CNBC:中國(guó)人工智能公司DeepSeek引發(fā)硅谷恐慌
CNBC 花了足足40分鐘來(lái)報(bào)道DeepSeek,觀看此視頻。
標(biāo)題:中國(guó)新的人工智能模型 DeepSeek 如何威脅美國(guó)的主導(dǎo)地位
全文翻譯:
中國(guó)一家鮮為人知的人工智能DeepSeek發(fā)布的人工智能模型在整個(gè)硅谷引發(fā)了恐慌,該模型的性能超越了美國(guó)最好的模型,盡管其制造成本更低,芯片性能也較差。
DeepSeek(該實(shí)驗(yàn)室的名稱)于 12 月底推出了一個(gè)免費(fèi)、開源的大型語(yǔ)言模型,據(jù)稱該模型僅用了兩個(gè)月的時(shí)間,花費(fèi)不到 600 萬(wàn)美元就建成了,使用的是 Nvidia 的功能較低的 H800 芯片。
這些新進(jìn)展敲響了人們的警鐘:美國(guó)在人工智能領(lǐng)域的全球領(lǐng)先地位是否正在萎縮,并讓人對(duì)大型科技公司在構(gòu)建人工智能模型和數(shù)據(jù)中心方面的巨額支出提出質(zhì)疑。
在一組第三方基準(zhǔn)測(cè)試中,DeepSeek 的模型表現(xiàn)優(yōu)于Meta的 Llama 3.1、Openai 的 GPT-4o 和 Anthropic 的 Claude Sonnet 3.5 的準(zhǔn)確度范圍從復(fù)雜問(wèn)題的解決到數(shù)學(xué)和編碼。
DeepSeek周一發(fā)布了R1,這是一種推理模型,在許多第三方測(cè)試中也優(yōu)于Openai的最新O1。
微軟首席執(zhí)行官薩蒂亞·納德拉(Satya Nadella)在世界上說(shuō):“看到DeepSeek的新模型,這兩者都非常有效地完成了進(jìn)行這種推理時(shí)間計(jì)算的開源模型,而且非常有效,”周三在瑞士達(dá)沃斯舉行的經(jīng)濟(jì)論壇。 “我們應(yīng)該非常非常重視從中國(guó)的發(fā)展。”
由于美國(guó)政府對(duì)中國(guó)強(qiáng)加的嚴(yán)格半導(dǎo)體限制,從而使該國(guó)無(wú)法進(jìn)口最強(qiáng)大的芯片,例如Nvidia的H100。表明DeepSeek要么找到了一種解決規(guī)則的方法,要么解決華盛頓出口控制障礙。
Benchmark 普通合伙人 Chetan Puttagunta 表示:“他們可以采用一個(gè)非常好的大型模型,并使用一種稱為蒸餾的過(guò)程。” “基本上,你使用一個(gè)非常大的模型來(lái)幫助你的小模型在你希望它變得聰明的事情上變得聰明。這實(shí)際上非常劃算。”
關(guān)于DeepSeek及其創(chuàng)始人梁文峰,人們知之甚少。據(jù)媒體報(bào)道,DeepSeek 誕生于一家名為 High-Flyer Quant 的中國(guó)對(duì)沖基金,該基金管理著約 80 億美元的資產(chǎn)。
但是DeepSeek并不是唯一一家闖入的中國(guó)公司。
AI研究員Kai-Fu Lee表示,他的創(chuàng)業(yè)公司01.AI僅使用300萬(wàn)美元培訓(xùn)。 Tiktok母公司周三發(fā)布了對(duì)其模型的更新,該更新聲稱在關(guān)鍵基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)于OpenAI的O1。
“需求是創(chuàng)新之母,”困惑首席執(zhí)行官Aravind Srinivas說(shuō)。 “因?yàn)樗麄儾坏貌幌朕k法找到替代方案,最終他們實(shí)際上開發(fā)出了更加高效的技術(shù)。”