這幾天,中國(guó)人工智能初創(chuàng)公司DeepSeek火了,不僅在美區(qū)下載榜上超越了ChatGPT,還引發(fā)多個(gè)美國(guó)科技股的股價(jià)暴跌。美國(guó)總統(tǒng)特朗普稱(chēng)DeepSeek的出現(xiàn)“給美國(guó)相關(guān)產(chǎn)業(yè)敲響了警鐘”。為何DeepSeek的出現(xiàn)會(huì)讓美國(guó)如此關(guān)注,甚至有些緊張?譚主聯(lián)合中國(guó)工業(yè)互聯(lián)網(wǎng)研究院獨(dú)家揭秘背后的原因↓↓↓
原因一:
高性?xún)r(jià)比沖擊美國(guó)大模型壟斷地位
DeepSeek可謂是用最少的錢(qián),干最多的事。其推出的模型,在性能上和世界目前頂尖的GPT-4o等大模型不相上下。但在成本上,OpenAI訓(xùn)練ChatGPT-4花費(fèi)的成本高達(dá)7800萬(wàn)美元,還可能達(dá)到1億美元。而DeepSeek大模型訓(xùn)練成本不到600萬(wàn)美元,僅為同性能模型的5%到10%。新模型訓(xùn)練方法大幅度降低了大模型行業(yè)的入局門(mén)檻,大規(guī)模預(yù)訓(xùn)練不再是科技巨頭的專(zhuān)利。在模型推理層面,DeepSeek新推出的DeepSeek-R1,價(jià)格為2.2美元/百萬(wàn)詞元,而同性能OpenAI-o1的價(jià)格為60美元/百萬(wàn)詞元,DeepSeek大概是OpenAI的三十分之一。這種“低成本”標(biāo)志著推理大模型調(diào)用進(jìn)入平價(jià)時(shí)代,顯著改善了大模型的應(yīng)用成本,對(duì)大模型在科研、企業(yè)等智力密集型產(chǎn)業(yè)中的應(yīng)用具有重大的價(jià)值。因此,無(wú)論是從基礎(chǔ)研究角度還是從商業(yè)層面上看,在訓(xùn)練和推理方面,對(duì)此前美國(guó)一些大模型公司的既有模式?jīng)_擊比較大。
原因二:
模式創(chuàng)新,帶來(lái)美國(guó)高新技術(shù)人員恐慌
DeepSeek開(kāi)發(fā)成本與美國(guó)大模型相比大幅降低,在于應(yīng)用了不同的模型訓(xùn)練模式,打破了美國(guó)堆砌算力的“豪氣”方式。在喂養(yǎng)學(xué)習(xí)數(shù)據(jù)這一大模型重要環(huán)節(jié)上,OpenAI選擇了“人海戰(zhàn)術(shù)”,堆砌算卡、將資源集中在算力,用海量數(shù)據(jù)投喂實(shí)現(xiàn)能力的提升。而DeepSeek相比于“砸資源”選擇了另外一種方式。利用算法把數(shù)據(jù)進(jìn)行總結(jié)和分類(lèi),經(jīng)過(guò)選擇性處理之后再輸送給大模型,最大優(yōu)化算力實(shí)現(xiàn)了成本的降低和模型性能提升。目前看Meta耗費(fèi)了大量資金訓(xùn)練Llama,但是效果上卻沒(méi)有成本極低的DeepSeek效果好,Meta高層已經(jīng)在思考其員工是否在浪費(fèi)公司資金,而這也引發(fā)了不少企業(yè)技術(shù)人員的恐慌,他們擔(dān)心自己被質(zhì)疑技術(shù)能力和創(chuàng)新性從而失去工作。根據(jù)海外互聯(lián)網(wǎng)平臺(tái)對(duì)DeepSeek的討論分析,社交媒體帖子的數(shù)量遠(yuǎn)高于新聞報(bào)道,數(shù)量約是新聞報(bào)道的十倍。時(shí)間上來(lái)看,社交媒體帖子的討論早于新聞報(bào)道,發(fā)酵起點(diǎn)比新聞媒體早了五天,這是由從事科技工作的自媒體人以及員工圈層傳播“破圈”造成。
原因三:
國(guó)產(chǎn)大模型正在厚積薄發(fā)
根據(jù)中國(guó)工業(yè)互聯(lián)網(wǎng)研究院推出的《人工智能大模型年度發(fā)展趨勢(shì)報(bào)告》,與國(guó)際頂尖大模型能力相比,2024年國(guó)內(nèi)大模型的能力進(jìn)步非常顯著。從2023年第四季度到2025年第一季度的測(cè)評(píng)顯示,國(guó)內(nèi)外大模型能力差距縮小了將近75%??梢钥闯觯珼eepSeek的出現(xiàn)并不是所謂的“異軍突起”,而是中國(guó)國(guó)內(nèi)大模型整體發(fā)展的階段性成果體現(xiàn)。此外,在報(bào)告統(tǒng)計(jì)的世界AI領(lǐng)域的投資上,中國(guó)55億美元的投資額排在第二位,僅是第一位美國(guó)641億投資額的不到十一分之一,中國(guó)未來(lái)在AI領(lǐng)域的發(fā)展上還有很大的空間。
如今,在DeepSeek對(duì)全球AI圈帶來(lái)的震動(dòng)下,很多業(yè)內(nèi)人士都喊出了“DeepSeek接班OpenAI”的口號(hào)。事實(shí)上,DeepSeek的出現(xiàn),并不是要取代別人,而是提出了更多樣化的方案,打破了國(guó)際主流大模型的市場(chǎng)壟斷,在大模型的發(fā)展道路上提出了不同于美西方的中國(guó)解法,讓世界看到了在大模型領(lǐng)域不是只有拼算力這一條路,再一次向世界證明,什么是中國(guó)智慧。