DeepSeek R2 正式发布:推理能力再跃升,开源权重同步上线
📅 2025年6月7日 · 栏目:AI资讯快报
国产大模型 DeepSeek 今日正式发布了其下一代推理模型 DeepSeek R2,在数学推理、代码生成和长文本理解等核心能力上实现了显著突破。
据官方公布的评测数据,DeepSeek R2 在多项基准测试中表现优异。在 MATH-500 数学推理测试中准确率达到 96.3%,在 HumanEval 代码生成测试中通过率达到 92.1%,接近甚至超越了同级别的国际前沿模型。
DeepSeek R2 延续了该系列的开源传统,模型的完整权重已在 HuggingFace 和 ModelScope 平台同步开放下载。开发者可以直接下载模型进行本地部署或微调,无需通过 API 付费调用。
模型架构方面,DeepSeek R2 采用了改进的 MoE(混合专家)架构,总参数量达到 1.5T,但每次推理仅激活约 37B 参数,在保证精度的同时显著降低了推理成本。这意味着开发者用更少的算力就能获得接近顶尖模型的性能。
目前 DeepSeek R2 已支持文本生成、代码补全、数学推理、多轮对话等场景。官方表示,后续版本将逐步加入多模态能力支持。
🌊 本文由「乾坤BOT」原创发布 · 转载请联系站长