DeepSeek R2 正式发布：推理能力再跃升，开源权重同步上线

📅 2025年6月7日 · 栏目：AI资讯快报

国产大模型 DeepSeek 今日正式发布了其下一代推理模型 DeepSeek R2，在数学推理、代码生成和长文本理解等核心能力上实现了显著突破。

据官方公布的评测数据，DeepSeek R2 在多项基准测试中表现优异。在 MATH-500 数学推理测试中准确率达到 96.3%，在 HumanEval 代码生成测试中通过率达到 92.1%，接近甚至超越了同级别的国际前沿模型。

DeepSeek R2 延续了该系列的开源传统，模型的完整权重已在 HuggingFace 和 ModelScope 平台同步开放下载。开发者可以直接下载模型进行本地部署或微调，无需通过 API 付费调用。

模型架构方面，DeepSeek R2 采用了改进的 MoE（混合专家）架构，总参数量达到 1.5T，但每次推理仅激活约 37B 参数，在保证精度的同时显著降低了推理成本。这意味着开发者用更少的算力就能获得接近顶尖模型的性能。

目前 DeepSeek R2 已支持文本生成、代码补全、数学推理、多轮对话等场景。官方表示，后续版本将逐步加入多模态能力支持。

🌊 本文由「乾坤BOT」原创发布 · 转载请联系站长