MetaverseInternationalTech

震驚世界的中國「DeepSeek」,撼動美國人工智慧霸權

文/金洪基

圖/App Store

由於中國無名的AI創業公司DeepSeek開發的生成AI模型「DeepSeek-R1」,美國和世界陷入了巨大的衝擊。 部分測試結果顯示,這與Open AI的最新聊天GPT-o1或Antropic Cloud3.5、谷歌Gemini 2.0等美國最尖端AI模型相似,或超過這些模型,因此硅谷幾乎處於恐慌狀態。這被認為是動搖美國世界AI霸權的致命一擊。

27日(當地時間),輝達及各大科技巨頭的股價在紐約證券交易所暴跌,包括美國在內的全球媒體都對此消息進行大力報導。它正在成為一個全球性大新聞,甚至比2022年OpenAI開發ChatGPT更令人震驚。

最終,川普在當天的另一場記者會上勉強承認了這一點。他掩飾不住焦急的心情,表示「這是中國的偉大成就,也為美國科技界重新崛起(維護霸權)敲響了警鐘。」

DeepSeek-R1」在iPhone 16 Pro App Store中排名第一

DeepSeek 的首款產品「DeepSeek-R1」因其出色的性能而引起轟動,在 iPhone 16 Pro 的 App Store 上排名第一。更令人震驚的是,與現有的ChatGPT 或Gemini 等LLM 模型相比,它的成本如此低廉。這世界領先的AI的開發成本低得可笑,僅600萬美元(約85億韓元)。據估計,其開發成本僅為ChatGPT的1/50。

更令人驚訝的是,據稱中國正在使用 Nvidia 過時的 H800晶片。在紐約證券交易所受創最大的公司是輝達(Nvidia)。 「如果用老舊的H800加上600萬美元就能開發出如此尖端的AI,那Nvidia不是一直被『坑』了嗎?」這番言論引發了質疑與反對的聲音。受此影響,該公司股價瞬間暴跌20%。該公司排名也跌至第四位,市值蒸發逾5000億美元。

不僅是 Nvidia。谷歌母公司 Alphabet微軟也大幅下跌,科技股為主的納斯達克和標準普爾 500 指數整體也出現下跌。甚至歐洲和亞洲市場也表現出疲軟盤整。這與西方世界對全球人工智能霸權可能從美國轉移到中國的擔憂一致。

此外,DeepSeek的「R1」型號採用了老式芯片,這也讓人懷疑是否真的有必要在Nvidia最新的AI芯片平臺「Blackwell」上投入如此多的資金。基於Blackwell的RTX5080和RTX5090售價估計每款至少為7萬美元(約1億韓元)。不得不使用昂貴Nvidia產品的美國AI公司未來將如何反應也值得關注。

DeepSeek用於開發「R1」的舊款 Nvidia H100 晶片(圖/Nvidia)

NVIDIA,是否一直都在「訛詐」人家牟利?

儘管中國技術不斷發展,但至少在短期內,對於相信自己在AI領域的優勢不會動搖的硅谷來說,這無異於「晴天霹靂」更何況,這不是使用以H100和Blackwell為基礎的最尖端英偉達芯片,而是使用過時的H800的成果,因此受到的衝擊更大。

佔據App Store第一位的「R1」至少在推論能力上,被評價為僅次於以開放AI接近AGI而自豪的最尖端GPT-o1,或谷歌Gemini FlashSync。Silicon Valley分析稱,儘管在學習和推論過程中使用了名為「Deepseek V3」的老式媒介模型,但「從App Store驅逐聊天GPT得益於「R1」的力量」

據稱,它不僅優於 GPT-o1 等封閉模型,也優於 Meta「Rama」等高性能開源模型。最重要的是,對美國來說最大的震撼是,中國沒有使用美國十分自信並且制裁的最先進的英偉達晶片,而是用劣質晶片打造出了這款近乎神級的產品。

多年來,美國嚴格限制對中國出口強大的人工智慧加速器和晶片製造設備。這是為了防止中國將該技術用於軍事用途。 Nvidia只供應舊款 H800、H20 等二、三流產品。但美國的策略出了問題。他們使用 H800 製造的 R1 僅花費 600 萬美元,這實際上是一台「廉價」機器。據報導,其耗電量也更小於OpenAI、Google和Meta。

DeepSeek的「R1」模型可用於網路、應用程式和 API,具有多種功能,包括 ChatGPT 和編碼內容創建等 AI 助理(秘書)功能。但是,該(技術)是開源的,並根據 MIT 標準提供,因此可以免費使用,不受限制。

(圖/Gettyimages)

關於「秘密走私Nvidia尖端晶片」的猜測在網路上也甚囂塵上

DeepSeek是一家位於中國杭州的新創公司,創辦人梁文峰去年創立。自然,與 OpenAI 和 Google 等競爭模型相比,它必然處於劣勢。因此,他們必須更有效率地利用AI模型,並致力於超低成本建構和訓練模型的技術。

當然,包括花旗銀行在內的其他分析師對這些成就表示質疑,「中國在人工智慧發展方面比美國更有限制的環境,(政治、社會和技術上)更嚴格。」儘管如此,OpenAI和矽谷等大型科技公司的危機感正在增強,它們已經在人工智慧基礎設施上投資了數十億美元。

但是,在DeepSeek成為世界焦點的當天,雖然不知道其幕後是什麼,但對此也進行了網絡攻擊。 據CNBC報導,DeepSeek方面當天還發布公告稱:「由於大規模惡意攻擊,服務暫時受到限制「,「但是現有用戶可以像平時一樣登錄」

在這種情況下,網上也充斥着「中國怎麼能以低廉的費用訓練如此複雜的LLM呢?」的揣測。

可靠消息來源《MIT Technology Review》稱,「DeepSeek最初使用的是秘密收購的高性能 Nvidia 晶片」,並且「在美國出口禁令進一步加強之前,它儲存了大量的 Nvidia A100,然後推測他們嘗試與H800進行技術融合。

矽谷新創公司 Skeleton AI 創辦人兼執行長 Alexander Wang 也說了同樣的話。他在一次採訪中斷言:「DeepSeek已經擁有大約 50,000 輛 H100。」彷彿早已等待,矽谷「惡人」馬斯克也加入了這場謠言派對。他辯稱,「正如Wang所說,中國一定秘密儲存了大量H100」,「否則,我們無法相信中國的成就」。

然而,隨著「Nvidia 的 H100 GPU 根本就不可能賣給中國」的反駁出現,爭議仍在繼續。還有網友進一步猜測,DeepSeek可能是繞道新加坡購買了H100 晶片。其中,有說法稱,「新加坡上個季度佔Nvidia營收的22%」。不過,根據Nvidia實際提交給美國證券交易委員會的文件,該金額「極為微小」。

「中國人工智慧技術能力累積的結果」是既定事實

專家認為,「種種猜測,都是不願相信中國所取得的成就的心理所致」。而是評論說「DeepSeek」R1「是中國長期累積的優秀AI技術的結晶,是經過耐心開發和測試的結果」。

矽谷的分析師也坦率地評估了中國的科技實力。這是一個「新時代」,展示了如何在有限的環境中,不顧製裁,充分運用和擴展現有的模型,創造出新的模式。有人說,「當然,需要大量的 Nvidia GPU 和高效能網路」,然而,現在可以打破這種刻板印象,利用高效的預學習和後學習(持續驗證和升級)以及持久的辯證測試擴展來實現這一點。

相反,結論是「在完全遵守美國出口管制的情況下能夠取得如此突破性的成就,這本身就是一個奇蹟。」一方面,對於至今壟斷「暴政」的Nvidia的產品、性能、價格的懷疑和質疑聲愈發強烈。因此,普遍的看法是,這次「DeepSeek」事件中遭受最致命打擊的公司是Nvidia。

Related Articles

Back to top button