CNBC:中國人工智能公司DeepSeek引發硅谷恐慌
CNBC 花了足足40分鐘來報道DeepSeek,觀看此視頻。
標題:中國新的人工智能模型 DeepSeek 如何威脅美國的主導地位
全文翻譯:
中國一家鮮為人知的人工智能DeepSeek發布的人工智能模型在整個硅谷引發了恐慌,該模型的性能超越了美國最好的模型,盡管其制造成本更低,芯片性能也較差。
DeepSeek(該實驗室的名稱)于 12 月底推出了一個免費、開源的大型語言模型,據稱該模型僅用了兩個月的時間,花費不到 600 萬美元就建成了,使用的是 Nvidia 的功能較低的 H800 芯片。
這些新進展敲響了人們的警鐘:美國在人工智能領域的全球領先地位是否正在萎縮,并讓人對大型科技公司在構建人工智能模型和數據中心方面的巨額支出提出質疑。
在一組第三方基準測試中,DeepSeek 的模型表現優于Meta的 Llama 3.1、Openai 的 GPT-4o 和 Anthropic 的 Claude Sonnet 3.5 的準確度范圍從復雜問題的解決到數學和編碼。
DeepSeek周一發布了R1,這是一種推理模型,在許多第三方測試中也優于Openai的最新O1。
微軟首席執行官薩蒂亞·納德拉(Satya Nadella)在世界上說:“看到DeepSeek的新模型,這兩者都非常有效地完成了進行這種推理時間計算的開源模型,而且非常有效,”周三在瑞士達沃斯舉行的經濟論壇。 “我們應該非常非常重視從中國的發展。”
由于美國政府對中國強加的嚴格半導體限制,從而使該國無法進口最強大的芯片,例如Nvidia的H100。表明DeepSeek要么找到了一種解決規則的方法,要么解決華盛頓出口控制障礙。
Benchmark 普通合伙人 Chetan Puttagunta 表示:“他們可以采用一個非常好的大型模型,并使用一種稱為蒸餾的過程。” “基本上,你使用一個非常大的模型來幫助你的小模型在你希望它變得聰明的事情上變得聰明。這實際上非常劃算。”
關于DeepSeek及其創始人梁文峰,人們知之甚少。據媒體報道,DeepSeek 誕生于一家名為 High-Flyer Quant 的中國對沖基金,該基金管理著約 80 億美元的資產。
但是DeepSeek并不是唯一一家闖入的中國公司。
AI研究員Kai-Fu Lee表示,他的創業公司01.AI僅使用300萬美元培訓。 Tiktok母公司周三發布了對其模型的更新,該更新聲稱在關鍵基準測試中表現優于OpenAI的O1。
“需求是創新之母,”困惑首席執行官Aravind Srinivas說。 “因為他們不得不想辦法找到替代方案,最終他們實際上開發出了更加高效的技術。”
相關文章
- 用戶登錄