DeepSeek R1-0528有哪些功能更新?
5月28日,DeepSeek R1模型完成小版本升級(jí)至DeepSeek - R1 - 0528, 在Live CodeBench中顯示,性能可以媲美Openai最新的o3高版本,大家可以通過官網(wǎng)、APP或小程序進(jìn)入對(duì)話界面,開啟“深度思考”功能即可體驗(yàn),API也已同步更新,調(diào)用方式不變。此次功能更新主要有如下幾個(gè)方面:
思考能力提升
思考深度增強(qiáng):基于DeepSeek V3 Base模型,投入更多算力優(yōu)化,新版本在數(shù)學(xué)、編程和通用邏輯等測(cè)試中成績(jī)出色,接近國(guó)際頂尖水平。例如在AIME 2025測(cè)試中,準(zhǔn)確率從70%提升至87.5%,平均每題使用的tokens也大幅增加。
思維鏈蒸餾:將DeepSeek-R1-0528的思維鏈蒸餾后訓(xùn)練Qwen3-8B Base,得到的8B模型在數(shù)學(xué)測(cè)試AIME 2024中表現(xiàn)僅次于DeepSeek-R1-0528,超越Qwen3-8B,與Qwen3-235B相當(dāng)。
幻覺問題優(yōu)化
幻覺率降低:在改寫潤(rùn)色、總結(jié)摘要、閱讀理解等場(chǎng)景中,幻覺率降低了45%~50%,結(jié)果更準(zhǔn)確可靠。
創(chuàng)意寫作優(yōu)化
文體優(yōu)化:對(duì)議論文、小說、散文等文體進(jìn)行了優(yōu)化,能輸出篇幅更長(zhǎng)、結(jié)構(gòu)更完整的長(zhǎng)篇作品,風(fēng)格更貼近人類偏好。
工具調(diào)用支持
支持工具調(diào)用:支持工具調(diào)用功能,在Tau-Bench測(cè)評(píng)中表現(xiàn)良好,與OpenAI o1-high相當(dāng),但不支持在thinking中進(jìn)行工具調(diào)用。
API更新
接口與調(diào)用方式不變:API已更新,接口與調(diào)用方式保持不變,但增加了Function Calling和JsonOutput的支持。
參數(shù)調(diào)整:調(diào)整了max_tokens參數(shù)的含義,用于限制模型單次輸出的總長(zhǎng)度,包括思考過程。
其他能力提升
前端代碼生成:在前端代碼生成、角色扮演等領(lǐng)域的能力有所提升。
交互動(dòng)畫生成:新增支持交互動(dòng)畫生成與演示功能,如激活參數(shù)動(dòng)態(tài)可視化。
動(dòng)態(tài)內(nèi)容更新:在動(dòng)態(tài)更新類前端任務(wù)(如實(shí)時(shí)天氣信息卡片)中響應(yīng)更快、細(xì)節(jié)更完善。
下載地址
https://huggingface.co/deepseek-ai/DeepSeek-R1-0528
https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-0528