馬斯克推出Grok 3 AI競賽白熱化
本港時間18日,馬斯克旗下人工智能初創公司xAI通過直播,發布號稱「地球最聰明的AI大模型」Grok 3。演示內容顯示,Grok 3在數學、科學、編程三項能力的相關測評中,得分均高於其他主流AI模型。Grok 3總共用了20萬個英偉達H100GPU訓練,被質疑為「性價比黑洞」。復旦大學計算機科學技術學院教授張奇18日接受大公報專訪時表示,DeepSeek的出現加速了AI領域的競爭,諸如xAI和OpenAI等企業迫於壓力,不得不調整大模型的發布節奏以應對市場變化。
(大公報 記者 蘇雨潤、戚佳潔)本港時間18日,馬斯克旗下人工智能(AI)新創公司xAI推出AI模型Grok 3,並十分高調地宣稱,這是「地表最聰明的AI」,目標是為了理解宇宙。根據xAI數據,Grok 3在數學、科學以及編程三大基準測試中的表現還不錯。數據上是超越了所有主流模型,包括GPT-4o、DeepSeek-V3等。以數學測驗為例,Grok 3取得了52分的最高成績,而同屬xAI陣營的Grok 3 mini則拿到40分,DeepSeek-V3以39分緊追在後,GPT-4o只有9分。
Grok 3一周後上線語音模式
Grok 3性能突破的背後是驚人的資源投入,xAI團隊透露,Grok 3有20萬個英偉達GPU、4億個GPU小時的算力支持。馬斯克在直播中首次披露,Grok 3訓練過程累計消耗20萬個英偉達GPU,訓練在xAI公司的數據中心完成。馬斯克還說,Grok 3將在一周後上線語音模式。
據官方數據,Grok 3的運算能力依託由20萬個英偉達H100GPU構建的Colossus超算集群,據稱運算能力是前代產品Grok 2的「10倍以上」,預訓練階段的消耗相當於一座核電站7%的月發電量。以市價計算,一個H100GPU大概在3萬美元(約23.4萬港元),那麼Grok 3的訓練成本就至少在60億美元(約468億港元)左右。相較於DeepSeek以遠低於同行的成本訓練出比肩OpenAI o1模型能力的R1模型,Grok 3的這一算力消耗屬實不小。在馬斯克公布Grok 3訓練成本後,很快便有分析指出,Grok 3的算力消耗是DeepSeek-V3的263倍。
DeepSeek走紅加速行業競爭
馬斯克宣稱「地球最聰明的AI大模型」。張奇則指出,Grok 3在推理能力上確實更進一步,但就目前數據來看,它依然屬於大體量模型。至於其是否會對DeepSeek的市場造成衝擊,還需取決於它在實際場景中的使用效果。「完整部署Grok 3需要強大的計算量,許多企業出於性價比考量,可能不會選擇它。」
隨着Grok 3的發布,AI市場的競爭格局愈發白熱化,各大企業為在這場技術競賽中搶佔優勢,紛紛加大研發投入,加速產品迭代。張奇表示,AI模型間的競爭是行業常態,不過此前相互追趕的速度相對較慢,DeepSeek的走紅讓行業競爭進一步提速。他告訴記者,GPT-4問世後,各大企業在追趕多模態技術方面投入了大量時間與精力,企業間的追趕節奏一度放緩。而DeepSeek的出現將研發工作從「幕後」推向「台前」,研發重點也從「訓練」轉向「推理」,極大縮小技術壁壘,加速了大模型版本的迭代速率。
此外,值得注意的是,在本次直播發布會上,馬斯克多次提及DeepSeek。張奇表示,在Grok 1發布時,xAI研發團隊的關注焦點主要集中在OpenAI等頭部企業,幾乎從未提及中國的AI模型。「DeepSeek的異軍突起徹底改變了這一狀況,這反映出馬斯克乃至美國科技界對中國AI企業技術突破與創新能力的高度認可。」
Grok 3的性能
推理能力增強:
•Grok 3整體功能增強,號稱在基準測試(即數學推理、代碼生成和科學邏輯)表現優異,超越中國的DeepSeek-V3、美國OpenAI的GPT-4o等競爭對手。
算力消耗巨大:
•Grok 3有20萬個英偉達H100GPU、4億個GPU小時的超強算力支持。相比之下,OpenAI訓練GPT-4僅用了2.5萬個A100GPU,而DeepSeek-V3使用了2048個英偉達H800GPU。
大公報整理
網友評論Grok 3
@_THECRYPTODEV
•Grok 3的測試數據雖然很亮眼,但是只是增量而已。Grok 3對我沒什麼吸引力,感覺AI已經停滯不前了。
@nobody_qwert
•我是馬斯克的粉絲,但Grok在編程方面的能力有點普通。
@Maikoke5
•從馬斯克的營銷炒作中就知道這不會有什麼好事。
@Rob3rtWozny
•像往常一樣,他們發布欺詐性的基準測試,誇大其詞模型的真實能力,然後人們所做的真實基準測試表明它有多麼的糟糕。
@770Tx1u8A1CxXBF
•Deepseek:什麼是Grok 3?這只是個笑話。
大公報整理
(來源:大公報A21:國際 2025/02/19)
字號:

評論