DeepSeek R1-0528有哪些功能更新?
5月28日,DeepSeek R1模型完成小版本升級至DeepSeek - R1 - 0528, 在Live CodeBench中顯示,性能可以媲美Openai最新的o3高版本,大家可以通過官網、APP或小程序進入對話界面,開啟“深度思考”功能即可體驗,API也已同步更新,調用方式不變。此次功能更新主要有如下幾個方面:
思考能力提升
思考深度增強:基于DeepSeek V3 Base模型,投入更多算力優化,新版本在數學、編程和通用邏輯等測試中成績出色,接近國際頂尖水平。例如在AIME 2025測試中,準確率從70%提升至87.5%,平均每題使用的tokens也大幅增加。
思維鏈蒸餾:將DeepSeek-R1-0528的思維鏈蒸餾后訓練Qwen3-8B Base,得到的8B模型在數學測試AIME 2024中表現僅次于DeepSeek-R1-0528,超越Qwen3-8B,與Qwen3-235B相當。
幻覺問題優化
幻覺率降低:在改寫潤色、總結摘要、閱讀理解等場景中,幻覺率降低了45%~50%,結果更準確可靠。
創意寫作優化
文體優化:對議論文、小說、散文等文體進行了優化,能輸出篇幅更長、結構更完整的長篇作品,風格更貼近人類偏好。
工具調用支持
支持工具調用:支持工具調用功能,在Tau-Bench測評中表現良好,與OpenAI o1-high相當,但不支持在thinking中進行工具調用。
API更新
接口與調用方式不變:API已更新,接口與調用方式保持不變,但增加了Function Calling和JsonOutput的支持。
參數調整:調整了max_tokens參數的含義,用于限制模型單次輸出的總長度,包括思考過程。
其他能力提升
前端代碼生成:在前端代碼生成、角色扮演等領域的能力有所提升。
交互動畫生成:新增支持交互動畫生成與演示功能,如激活參數動態可視化。
動態內容更新:在動態更新類前端任務(如實時天氣信息卡片)中響應更快、細節更完善。
下載地址
https://huggingface.co/deepseek-ai/DeepSeek-R1-0528
https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-0528