DeepSeek-R1最新版模型：0528思考更深，推理更强！

DeepSeek-R1最新版的0528模型官方说明出来了，思考更深，推理更强！

1、深度思考能力强化 0528仍使用2024年12月发布的DeepSeek V3 Base作为基座，后训练中投入了更多算力，来提升模型的思维深度与推理能力

在数学、编程、通用逻辑等能力优秀，在整体表现上已接近o3、Gemini-2.5-Pro

较于旧版R1，新模型在复杂推理任务中有显著提升，在AIME 2025测试中，新版模型准确率由70%提升至 87.5%

通过蒸馏DeepSeek-R1-0528的思维链后训练Qwen3-8B Base，得到了一个DeepSeek-R1-0528-Qwen3-8B

8B在数学测试AIME 2024中仅次于DeepSeek-R1-0528，超越Qwen3-8B （+10.0%），与Qwen3-235B相当

2、其他能力更新幻觉改善，更新后的模型在改写润色、总结摘要、阅读理解等场景中，幻觉率降低了45～50%左右

创意写作，新模型能够输出篇幅更长、结构内容更完整的长篇作品，可呈现出更加贴近人类偏好的写作风格

工具调用：0528支持工具调用（不支持在thinking中进行工具调用），能力与OpenAI o1-high 相当，与o3-High以及 Claude 4 Sonnet仍有差距

在前端代码生成、角色扮演等领域的能力均有更新提升

3、API更新已同步更新，接口与调用方式不变。新版R1 API仍支持查看模型思考过程，同时还增加了Function Calling和JsonOutput的支持

现在max_tokens用于限制模型单次输出的总长度（包括思考过程），默认为 32K，最大为 64K

640 (1).gif