DeepSeek放出了新模型R1系列,R1-Zero和R1,R1在数学、代码和推理任务方面与OpenAI-o1相当

R1,671B参数(激活37B),支持128K上下文

除了R1-Zero、R1外,还开源了基于Llama和Qwen蒸馏出的六个小规模的模型(DeepSeek-R1-Distill系列),其中DeepSeek-R1-Distill-Qwen-32B在多个基准测试中超过了OpenAI o1-mini

模型:https://huggingface.co/deepseek-ai

image.png

image.png