DeepSeek的最新模型DeepSeek-V3和DeepSeek-R1都属于MoE(混合专家)架构,并在开源世界产生了较大的影响力。特别是2025 年 1 月开源的DeepSeek-R1,模型性能可挑战 OpenAI闭源的 o1 模型。
DeepSeek 凭借其卓越的性能和广泛的应用场景,迅速在全球范围内获得了极高的关注度和广泛的用户基础。DeepSeek-R1-Distill 是使用 DeepSeek-R1 生成的样本对开源模型进行蒸馏得到的小模型,拥有更小参数规模,推理成本更低,基准测试同样表现出色。
从榜单排名来看,通用AI助手类应用占据了绝对优势。夸克加速探索AI应用的全新业务态势,以3369万的平均日活用户数位居榜首。今年的黑马应用DeepSeek 和字节跳动旗下的豆包,分别以1028万和997万的DAU位列第二和第三,通用AI助手现在依旧是在日常生活中应用广泛的AI应用。
近期,由于国外大量攻击,导致 DeepSeek 经常无法使用;另外,许多朋友希望在本地搭建自己的知识库,以保护自己的资料不被外泄。因此,越来越多的人希望能够在本地部署 DeepSeek,但对于技术难度有所担忧。别担心,这篇教程将为你扫清所有障碍!从环境搭建到模型运行,每一步都进行了详细拆解,即便是零基础的小白也能轻松上手。让我们一起来解决这些问题,顺利完成本地部署,保护个人隐私的同时,享受强大的 AI 功能。
谷歌首席执行官Sundar Pichai宣布,开源最新多模态大模型Gemma-3,主打低成本高性能。Gemma-3共有10亿、40亿、120亿和270亿四种参数。但即便最大的270亿参数,只需要一张H100就能高效推理,同类模型要达到这个效果最少要提升10倍算力,也是目前最强小参数模型。根据盲测LMSYS ChatbotArena数据显示,Gemma-3仅次于DeepSeek的R1-671B,高于OpenAI的o3-mini,Llama3-405B等知名模型。
CherryStudio 是一款集多模型对话、知识库管理、AI 绘画、翻译等功能于一体的全能 AI 助手平台。CherryStudio的高度自定义的设计、强大的扩展能力和友好的用户体验,使其成为专业用户和 AI 爱好者的理想选择。无论是零基础用户还是开发者,都能在 CherryStudio 中找到适合自己的AI功能,提升工作效率和创造力。
今日,字节跳动正式发布中国首个AI原生集成开发环境工具:AI编程工具Trae国内版。据悉,该工具模型搭载doubao-1.5-pro,支持切换满血版DeepSeek R1&V3。能充分释放AI的潜力。从官方介绍来看,Trae可深度理解中文开发场景。AI高度集成于IDE环境之中,可带来比AI插件更加流畅、准确、优质的开发体验。
关注时代Java