OpenAI研究員稱:Deepseek發現了他們在實現o1的過程中的一些核心理念
Mark Chen (@markchen90)1月28 日
祝賀 DeepSeek 成功開發出 o1級推理模型!他們的研究論文表明,他們發現了我們在實現o1的過程中的一些核心理念。
然而,我認為外界對這項成果的反應有些過度,尤其是在關于成本的敘述上。有兩個范式(預訓練和推理)意味著我們可以在兩個軸線上優化能力,而不僅僅是一個,這降低了整體成本。
但這也表明我們可以沿兩個方向擴展能力,而我們計劃在這兩個方向上積極投入計算資源!
隨著蒸餾研究的進步,我們也發現降低成本和提升能力這兩者之間的關系越來越獨立。以更低成本提供服務(尤其是在較高延遲的情況下)并不代表能夠實現更高的能力。
我們將繼續優化模型以更低的成本提供服務同時對我們的研究計劃保持樂觀并專注于實施。今年第一季度以及全年,我們期待為大家帶來更強大的模型!
相關文章
OpenAI各個模型的命名來歷時間線
2025-04-17