DeepSeek-R1最新版的0528模型官方说明出来了,思考更深,推理更强!
1、深度思考能力强化 0528仍使用2024年12月发布的DeepSeek V3 Base作为基座,后训练中投入了更多算力,来提升模型的思维深度与推理能力
在数学、编程、通用逻辑等能力优秀,在整体表现上已接近o3、Gemini-2.5-Pro
较于旧版R1,新模型在复杂推理任务中有显著提升,在AIME 2025测试中,新版模型准确率由70%提升至 87.5%
通过蒸馏DeepSeek-R1-0528的思维链后训练Qwen3-8B Base,得到了一个DeepSeek-R1-0528-Qwen3-8B
8B在数学测试AIME 2024中仅次于DeepSeek-R1-0528,超越Qwen3-8B (+10.0%),与Qwen3-235B相当
2、其他能力更新 幻觉改善,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了45~50%左右
创意写作,新模型能够输出篇幅更长、结构内容更完整的长篇作品,可呈现出更加贴近人类偏好的写作风格
工具调用:0528支持工具调用(不支持在thinking中进行工具调用),能力与OpenAI o1-high 相当,与o3-High以及 Claude 4 Sonnet仍有差距
在前端代码生成、角色扮演等领域的能力均有更新提升
3、API更新 已同步更新,接口与调用方式不变。新版R1 API仍支持查看模型思考过程,同时还增加了Function Calling和JsonOutput的支持
现在max_tokens用于限制模型单次输出的总长度(包括思考过程),默认为 32K,最大为 64K
模型: ModelScope: https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-0528 Huggingface: https://huggingface.co/deepseek-ai/DeepSeek-R1-0528