不經思考就直接輸出推理結果的情況,DeepSeek官方做了最新使用說明
DeepSeek 官方對 R1 使用說明進行了更新。此前我們集群部署的 deepseek-r1 滿血版,在眾人使用期間,時常會出現模型的 output 不經思考就直接輸出推理結果的情況。針對這一問題,DeepSeek 官方給出了如下解決方案:
1. 請將 Temperature 設定在 0.5 至 0.7 的范圍內(建議設置為 0.6),以此避免產生無盡的重復或者不連貫的輸出。
2. 不要添加系統提示;所有的說明都應當涵蓋在用戶提示符之中。
3. 針對數學問題,建議在您的提示里添加一個指令提示:“請逐步推理,然后將最終答案放在\ boxed {}中?!?/p>
4. 在評估模型性能時,建議開展多次測試并對結果進行平均。
5. 當響應某些查詢時,DeepSeek-R1 系列模型容易繞過深度思考模式(也就是輸出””),這有可能給模型性能帶來不利影響。為了保障模型能夠進行全面的推理,官方提議:在每個輸出的開頭強制執行“
6、官方建議使用的搜索和文件上傳提示模版: https://github.com/deepseek-ai/DeepSeek-R1/pull/399/files
7、DeepSeek-R1減輕模型跳過思考直接推理的指南: https://github.com/deepseek-ai/DeepSeek-R1/commit/7ca5e1e7f75e12a1c561fffaa6aa686708f881ae
DeepSeek官方也更新了readme,大家可以按照官方給的readme來配置即可獲得最佳使用體驗。
最新readme地址:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/README.md
相關文章
DeepSeek+Gamma生成PPT教程全攻略
2025-03-25