DeepSeek風暴４｜DeepSeek優勢過人　OpenAI CEO「認錯」

大公文匯網新聞國際

國際即時

2025.02.02 08:24:54

字號：

小中大特大

（大公報記者蘇雨潤、凱雷北京報道）雖然投資界很多人盲目相信，股價節節上升的美國AI科企擁有永遠無法攻破的護城河，壟斷算力財源滾滾，但其實早在2023年，當OpenAI攜ChatGPT橫空出世時，一位谷歌研究員曾發布一句流傳網絡的預測：「谷歌沒有護城河，OpenAI也沒有。」如今，隨着中國AI崛起，讓美企穩賺不賠的「黃金護城河」失守。DeepSeek創辦人梁文鋒也曾說過：「技術沒有什麼秘密，但重置需要時間和成本。」

DeepSeek的開源模型精打細算，算力不足成為驅動算法優化的動力。1月31日，OpenAI首席執行官（CEO）奧爾特曼在美國社交平台一場「隨你問」環節中，回應「是否考慮公開OpenAI的研究」時說：「我個人認為，我們站在了歷史錯誤的一邊，需要制定不同的開源策略。」奧爾特曼在談到DeepSeek時說：「這是一個非常好的模型。我們會發展出更好的模型，但我們將不如前幾年，保持那麼大的領先優勢。」

僅用OpenAI預算5%　彰顯中國人才優勢

DeepSeek大模型訓練成本不到600萬美元，僅為OpenAI訓練ChatGPT-4花費的5%到10%。新模型訓練方法大幅度降低了大模型行業的入局門檻，大規模預訓練不再是科技巨頭的專利。這意味着，創新已不再是難題，難的是如何保持人才密度，精打細算，以精湛算法彌補算力不足。據多位與DeepSeek有過接觸的行業人士表述，DeepSeek的優勢之處就在於人才密度極高。各界憧憬，DeepSeek的「低成本」神話將進一步釋放中國人才優勢，於AI競賽中不斷提速。

匯聚全球技術生態力量　優化技術

開源指的是公開軟件源代碼的做法。清華大學新聞學院、人工智能學院教授沈陽接受大公報採訪時指出，DeepSeek團隊採用自創的類彙編語言，對硬件適配性進行深度優化，力求最大限度挖掘硬件潛能。通過大模型開源，DeepSeek迅速匯聚全球技術生態的力量，共同推動技術進步，此舉對美國地緣政治中盛行的霸權主義思想構成有力挑戰。「奧爾特曼對OpenAI策略做出反思，印證DeepSeek對於美國AI領域的衝擊。」

「OpenAI如果選擇開源，無疑是一項極具前瞻性的戰略舉措，但從資本運作的角度來看，這種轉變大概率會遭到資本方反對。」亞洲視覺科技研發總監陳經相信，行業內「開源VS閉源」的鬥爭模式不會就此落幕。目前，美國兩家主要的閉源公司OpenAI和Anthropic，基於現有的經營模式仍未做好向開源模式轉變的準備。陳經表示，閉源模式下，企業通過對核心技術的壟斷能更好地控制產品研發方向、保障商業利益，維持較高的市場壁壘。

o3-mini乏善可陳　無突破性技術革新

在「東方AI力量」強勁衝擊下，美國OpenAI公司於當地時間1月31日正式推出全新推理模型o3-mini，並首次向免費用戶開放推理模型。「OpenAI被迫加快了推出產品的速度，而且價格大降，說明他們真的慌了！」陳經表示，儘管o3-mini在推理速度上有所提升，測試集得分也更為亮眼，但整體並無突破性技術革新。「對於開發者而言，DeepSeek的開源特性賦予了它無可比擬的優勢，o3-mini在這方面吸引力相對有限。」

失去黃金護城河，是否代表華爾街失去生金蛋的鵝？私募股權巨頭、全球主要人工智能系統數據中心投資者黑石集團總裁喬納森·格雷預計，隨着人工智能計算能力成本大幅下降，人工智能將得到更廣泛的應用，意味着DeepSeek的崛起有利推動AI發展，惠及全球。

DeepSeek如何撼動美國科技界？

打破AI霸權迷信

•過去美國認為「AI＝硅谷＋英偉達芯片＋谷歌大腦」，DeepSeek證明中國團隊能用「低成本硬件＋數學優化」彎道超車，類似日本當年用省油車擊潰美國油老虎。

戳破大數據泡沫

•美國AI界長期迷信「更多數據＝更好效果」，DeepSeek卻用「數據蒸餾技術」，好比用濃縮咖啡粉取代一卡車咖啡豆，達到同等效果，直接動搖OpenAI、Meta的護城河。

撼動雲服務搖錢樹

•亞馬遜AWS、谷歌雲原本靠賣算力賺暴利，但DeepSeek的「超壓縮模型」，好比把卡車塞進行李箱的技術，讓客戶用1/10的算力就能運行，美國雲巨頭被迫降價應戰。

引發人才爭奪焦慮

•DeepSeek團隊人才濟濟，美國科技界開始擔心，就像NBA突然出現一支用低成本板櫈球員吊打明星隊的隊伍，動搖「高薪挖人」的壟斷策略。

資料來源：DeepSeek-R1

為何DeepSeek能低成本高水平？

專家分診制：精準分配算力

•傳統AI模型像一家普通醫院，醫生看所有病人。DeepSeek像一家「專家會診醫院」，每個病人進門後先由分診台判斷分配給具體科室的專家。每個專家只看自己領域的病例，效率提高10倍。

樂高式訓練法：不用每次從頭開始

•傳統AI訓練像從頭造火箭。DeepSeek像用樂高模塊組裝：先訓練好「語言理解」「邏輯推理」等基礎模塊，再快速拼接出新模型。就像用預製菜做宴席，比從種菜開始快得多。

菜市場經濟學：數據精打細算

•傳統AI模型像米其林大廚，用頂級和牛做牛排。DeepSeek像夜市老闆，能用普通牛肉+秘製醃料做出同樣美味。DeepSeek開發的「數據增強技術」，把一份數據「醃漬發酵」出10倍效果，大幅降低數據成本。

蹭空調戰術：硬件省電高科技

•普通AI訓練像在沙漠用冰箱，電費驚人；DeepSeek利用「動態電壓調節技術」，讓芯片在計算間隙自動休眠，像人類呼吸一樣「一呼一吸間省電」，把電費砍到1/3。

全面防護｜DeepSeek帶刀侍衛　360提供無償安保

近日，DeepSeek在全球AI領域異軍突起，其在展現出「史詩級」技術實力的同時也面臨外部網絡攻擊威脅。DeepSeek官網顯示，攻擊者IP地址均在美國。1月28日，360集團創始人周鴻禕宣布將無償為DeepSeek提供全方位網絡安全防護。此次DeepSeek服務遭遇一系列網絡攻擊，有專家推測可能是出於商業競爭或技術遏制的目的，試圖干擾DeepSeek的正常運行和發展進程。

作為中國最大的網絡安全企業，360集團率先發布「關於全力支持國產大模型DeepSeek的倡議書」，宣布為DeepSeek無償提供全方位的網絡安全防護，並同步在旗下納米AI搜索開通「DeepSeek高速專線」，啟用最高規格的R1高速專線和專屬防攻擊機房，以國家級安全能力全力保障用戶體驗。

法律爭端｜｜DeepSeek在美商標　被梁文鋒校友搶註

2月1日，「DeepSeek在美商標被梁文鋒校友搶註」的話題衝上微博熱搜。1月30日，據新華每日電訊援引TC報道，DeepSeek被指控盜竊知識產權，在歐洲面臨隱私調查，並成為大規模網絡攻擊的目標。現在，該公司似乎又面臨新的麻煩：美國商標糾紛。

Delson聲稱銷售DeepSeek產品

據悉，DeepSeek本周稍早前向美國專利商標局提交了為其AI聊天機器人應用、產品和工具註冊商標的申請。然而，在此之前36小時，一家總部位於特拉華州的公司Delson Group Inc.已經申請了同樣的商標。Delson Group聲稱自2020年初以來一直在銷售DeepSeek品牌的AI產品，其首席執行官兼創始人Willie Lu與DeepSeek創始人梁文鋒都畢業於浙江大學。

根據美國法律，商標的第一個使用者通常被視為合法所有者，除非可以證明該商標是惡意註冊的。知識產權問題專家Josh Gerben表示，如果DeepSeek能夠證明其在AI領域的經營方式與Delson Group不同，那麼他們可能會尋求共存協議，但Delson Group有多個優勢：他們先提交申請，聲稱使用時間更早，並且有一個實時網站展示與AI相關的活動。

（來源：大公報A3：要聞 2025/02/02）

DeepSeek風暴４｜DeepSeek優勢過人　OpenAI CEO「認錯」

國際即時

評論

相關推薦