DeepSeek風暴4|DeepSeek優勢過人 OpenAI CEO「認錯」
(大公報記者 蘇雨潤、凱雷 北京報道)雖然投資界很多人盲目相信,股價節節上升的美國AI科企擁有永遠無法攻破的護城河,壟斷算力財源滾滾,但其實早在2023年,當OpenAI攜ChatGPT橫空出世時,一位谷歌研究員曾發布一句流傳網絡的預測:「谷歌沒有護城河,OpenAI也沒有。」如今,隨着中國AI崛起,讓美企穩賺不賠的「黃金護城河」失守。DeepSeek創辦人梁文鋒也曾說過:「技術沒有什麼秘密,但重置需要時間和成本。」
DeepSeek的開源模型精打細算,算力不足成為驅動算法優化的動力。1月31日,OpenAI首席執行官(CEO)奧爾特曼在美國社交平台一場「隨你問」環節中,回應「是否考慮公開OpenAI的研究」時說:「我個人認為,我們站在了歷史錯誤的一邊,需要制定不同的開源策略。」奧爾特曼在談到DeepSeek時說:「這是一個非常好的模型。我們會發展出更好的模型,但我們將不如前幾年,保持那麼大的領先優勢。」
僅用OpenAI預算5% 彰顯中國人才優勢
DeepSeek大模型訓練成本不到600萬美元,僅為OpenAI訓練ChatGPT-4花費的5%到10%。新模型訓練方法大幅度降低了大模型行業的入局門檻,大規模預訓練不再是科技巨頭的專利。這意味着,創新已不再是難題,難的是如何保持人才密度,精打細算,以精湛算法彌補算力不足。據多位與DeepSeek有過接觸的行業人士表述,DeepSeek的優勢之處就在於人才密度極高。各界憧憬,DeepSeek的「低成本」神話將進一步釋放中國人才優勢,於AI競賽中不斷提速。
匯聚全球技術生態力量 優化技術
開源指的是公開軟件源代碼的做法。清華大學新聞學院、人工智能學院教授沈陽接受大公報採訪時指出,DeepSeek團隊採用自創的類彙編語言,對硬件適配性進行深度優化,力求最大限度挖掘硬件潛能。通過大模型開源,DeepSeek迅速匯聚全球技術生態的力量,共同推動技術進步,此舉對美國地緣政治中盛行的霸權主義思想構成有力挑戰。「奧爾特曼對OpenAI策略做出反思,印證DeepSeek對於美國AI領域的衝擊。」
「OpenAI如果選擇開源,無疑是一項極具前瞻性的戰略舉措,但從資本運作的角度來看,這種轉變大概率會遭到資本方反對。」亞洲視覺科技研發總監陳經相信,行業內「開源VS閉源」的鬥爭模式不會就此落幕。目前,美國兩家主要的閉源公司OpenAI和Anthropic,基於現有的經營模式仍未做好向開源模式轉變的準備。陳經表示,閉源模式下,企業通過對核心技術的壟斷能更好地控制產品研發方向、保障商業利益,維持較高的市場壁壘。
o3-mini乏善可陳 無突破性技術革新
在「東方AI力量」強勁衝擊下,美國OpenAI公司於當地時間1月31日正式推出全新推理模型o3-mini,並首次向免費用戶開放推理模型。「OpenAI被迫加快了推出產品的速度,而且價格大降,說明他們真的慌了!」陳經表示,儘管o3-mini在推理速度上有所提升,測試集得分也更為亮眼,但整體並無突破性技術革新。「對於開發者而言,DeepSeek的開源特性賦予了它無可比擬的優勢,o3-mini在這方面吸引力相對有限。」
失去黃金護城河,是否代表華爾街失去生金蛋的鵝?私募股權巨頭、全球主要人工智能系統數據中心投資者黑石集團總裁喬納森·格雷預計,隨着人工智能計算能力成本大幅下降,人工智能將得到更廣泛的應用,意味着DeepSeek的崛起有利推動AI發展,惠及全球。
DeepSeek如何撼動美國科技界?
打破AI霸權迷信
•過去美國認為「AI=硅谷+英偉達芯片+谷歌大腦」,DeepSeek證明中國團隊能用「低成本硬件+數學優化」彎道超車,類似日本當年用省油車擊潰美國油老虎。
戳破大數據泡沫
•美國AI界長期迷信「更多數據=更好效果」,DeepSeek卻用「數據蒸餾技術」,好比用濃縮咖啡粉取代一卡車咖啡豆,達到同等效果,直接動搖OpenAI、Meta的護城河。
撼動雲服務搖錢樹
•亞馬遜AWS、谷歌雲原本靠賣算力賺暴利,但DeepSeek的「超壓縮模型」,好比把卡車塞進行李箱的技術,讓客戶用1/10的算力就能運行,美國雲巨頭被迫降價應戰。
引發人才爭奪焦慮
•DeepSeek團隊人才濟濟,美國科技界開始擔心,就像NBA突然出現一支用低成本板櫈球員吊打明星隊的隊伍,動搖「高薪挖人」的壟斷策略。
資料來源:DeepSeek-R1
為何DeepSeek能低成本高水平?
專家分診制:精準分配算力
•傳統AI模型像一家普通醫院,醫生看所有病人。DeepSeek像一家「專家會診醫院」,每個病人進門後先由分診台判斷分配給具體科室的專家。每個專家只看自己領域的病例,效率提高10倍。
樂高式訓練法:不用每次從頭開始
•傳統AI訓練像從頭造火箭。DeepSeek像用樂高模塊組裝:先訓練好「語言理解」「邏輯推理」等基礎模塊,再快速拼接出新模型。就像用預製菜做宴席,比從種菜開始快得多。
菜市場經濟學:數據精打細算
•傳統AI模型像米其林大廚,用頂級和牛做牛排。DeepSeek像夜市老闆,能用普通牛肉+秘製醃料做出同樣美味。DeepSeek開發的「數據增強技術」,把一份數據「醃漬發酵」出10倍效果,大幅降低數據成本。
蹭空調戰術:硬件省電高科技
•普通AI訓練像在沙漠用冰箱,電費驚人;DeepSeek利用「動態電壓調節技術」,讓芯片在計算間隙自動休眠,像人類呼吸一樣「一呼一吸間省電」,把電費砍到1/3。
全面防護|DeepSeek帶刀侍衛 360提供無償安保
近日,DeepSeek在全球AI領域異軍突起,其在展現出「史詩級」技術實力的同時也面臨外部網絡攻擊威脅。DeepSeek官網顯示,攻擊者IP地址均在美國。1月28日,360集團創始人周鴻禕宣布將無償為DeepSeek提供全方位網絡安全防護。此次DeepSeek服務遭遇一系列網絡攻擊,有專家推測可能是出於商業競爭或技術遏制的目的,試圖干擾DeepSeek的正常運行和發展進程。
作為中國最大的網絡安全企業,360集團率先發布「關於全力支持國產大模型DeepSeek的倡議書」,宣布為DeepSeek無償提供全方位的網絡安全防護,並同步在旗下納米AI搜索開通「DeepSeek高速專線」,啟用最高規格的R1高速專線和專屬防攻擊機房,以國家級安全能力全力保障用戶體驗。
法律爭端||DeepSeek在美商標 被梁文鋒校友搶註
2月1日,「DeepSeek在美商標被梁文鋒校友搶註」的話題衝上微博熱搜。1月30日,據新華每日電訊援引TC報道,DeepSeek被指控盜竊知識產權,在歐洲面臨隱私調查,並成為大規模網絡攻擊的目標。現在,該公司似乎又面臨新的麻煩:美國商標糾紛。
Delson聲稱銷售DeepSeek產品
據悉,DeepSeek本周稍早前向美國專利商標局提交了為其AI聊天機器人應用、產品和工具註冊商標的申請。然而,在此之前36小時,一家總部位於特拉華州的公司Delson Group Inc.已經申請了同樣的商標。Delson Group聲稱自2020年初以來一直在銷售DeepSeek品牌的AI產品,其首席執行官兼創始人Willie Lu與DeepSeek創始人梁文鋒都畢業於浙江大學。
根據美國法律,商標的第一個使用者通常被視為合法所有者,除非可以證明該商標是惡意註冊的。知識產權問題專家Josh Gerben表示,如果DeepSeek能夠證明其在AI領域的經營方式與Delson Group不同,那麼他們可能會尋求共存協議,但Delson Group有多個優勢:他們先提交申請,聲稱使用時間更早,並且有一個實時網站展示與AI相關的活動。
(來源:大公報A3:要聞 2025/02/02)
字號:

評論