淵謀遠略|AI新階段 不捲規模捲效率
文/袁淵
當全球人工智能(AI)產業陷入「規模內捲」的狂熱之中,愈來愈多的從業者開始意識到一個殘酷的現實──規模的邊際效益正在快速遞減。當「堆規模」的增長模式走到盡頭,整個產業終於回歸到最本質的問題:AI時代的核心競爭力,從來不是算力規模的絕對值,而是算力的利用效率。
效率,是貫穿大模型、圖形處理器(GPU)與算力規模全鏈條的核心主線,也是企業與國家構建長期比較優勢的底層邏輯。今天真正決定競爭力的,是你能把多少理論算力轉化為有效算力,能用多少算力實現想要的效果,能讓投入的算力帶來多少商業回報。
要理解效率如何決定比較優勢,首先要跳出對「效率」的狹隘認知——它絕不僅僅是GPU的TOPS/W(每瓦算力),也不是單純的模型推理速度,而是一個覆蓋AI全生命周期的完整效率體系,從硬件到算法,從系統到商業,每一個環節的效率短板,都會導致整個體系的投入產出比大幅下降。只有理清全鏈路的效率構成,才能找到提升比較優勢的核心抓手。
算法彌補硬件差距
硬件是效率的底層基礎,這裏的核心指標,不是GPU的理論峰值算力,而是算力轉化效率,也就是GPU的理論算力,最終能有多少轉化為大模型訓練與推理的有效算力。它包含兩個核心維度:一是硬件本身的能效比,也就是每消耗1瓦電力,能提供多少AI算力,這決定了算力的基礎成本;二是算力的有效利用率,也就是在實際的大模型任務中,GPU能持續輸出的算力,佔其理論峰值算力的比例,這決定了硬件資源的浪費程度。
很多廠商在宣傳GPU時,都會強調其峰值算力有多高,但在實際的大模型任務中,這個峰值算力幾乎永遠無法達到。而很多國產GPU,儘管理論峰值算力已經接近A100,但在實際任務中,有效算力利用率往往不到20%。這就導致哪怕硬件的理論峰值相同,實際的算力輸出差距卻能達到2至3倍。
如果說硬件效率是基礎,那麼算法效率就是放大硬件價值的核心槓桿。這裏的核心指標,是算力價值效率,也就是每單位算力,能實現的模型效果與業務價值。它回答的核心問題是:同樣的算力投入,誰能訓練出效果更好的模型?同樣的模型效果,誰需要的算力更少?
過去幾年,大模型產業陷入了「參數量愈大,能力愈強」的誤區,卻忽略了算法效率的核心價值。事實上,模型參數量翻倍,訓練所需的算力往往要翻3至4倍,但模型的通用能力,可能只提升了不到10%,這就是典型的算法效率低下。而算法效率的提升,往往能帶來指數級的價值放大:一個經過深度優化的70億參數模型,效果能超過未經優化的1750億參數模型,而所需的訓練算力只有後者的幾十分之一,推理算力更是只有百分之一。
這種算法效率的差距,能讓算力不足的企業與國家,用更少的硬件投入,實現接近甚至超越頭部玩家的效果,這是打破規模壟斷、構建比較優勢的核心機會。
積極完善商業閉環
單張GPU的效率再高,如果不能在集群中實現高效的協同調度,最終的整體效率也會大打折扣。系統層的核心指標,是集群協同效率,也就是由數千張GPU組成的算力集群,其整體的算力輸出,能達到單張GPU算力的多少倍,也就是線性加速比。同時,還包括數據中心的能源利用效率,也就是電力使用效率(PUE)值,它決定了有多少電力被真正用於算力輸出,而不是浪費在製冷、供電等環節。
這是最容易被忽略的效率環節,也是全球算力產業最大的效率窪地。根據行業機構的測算,全球絕大多數企業自建的算力集群,GPU的平均利用率不到20%,很多GPU長期處於閒置狀態;而數千張GPU組成的大規模集群,線性加速比往往不到60%,也就是1000張GPU的訓練速度,還不到1張GPU的600倍。造成這種情況的原因,包括網絡帶寬不足、存儲性能瓶頸、調度系統落後、分布式訓練框架優化不足等,任何一個環節的短板,都會導致整個集群的效率大幅下降。
而系統效率的提升,能在不增加硬件投入的情況下,讓總算力輸出翻倍,這是提升算力規模性價比最直接的方式,也是不同國家、不同企業之間算力競爭力差距的核心來源。
所有的硬件、算法、系統效率提升,最終都要落地到商業價值上,這就是商業效率,也就是投入的算力與技術資源,最終能帶來多少商業回報,能否形成可持續的正向商業循環。它回答的核心問題是:投入的每一分錢算力成本,能帶來多少收入增長與成本節約?
這是效率體系的最終閉環,也是決定企業與國家能否在AI競爭中持續發展的核心。
很多企業投入數十億資金,購買了數萬張GPU,訓練了超大參數的通用大模型,卻始終找不到商業化的落地場景,沒有穩定的收入來源,最終只能持續燒錢,難以為繼,這就是典型的商業效率缺失。而真正具備競爭力的企業,往往能把算力資源聚焦在高價值的垂直場景,用最少的算力投入,解決行業的核心痛點,實現明確的降本增效,形成「算力投入─商業回報─更多研發投入」的正向循環。
以上四個層面的效率,共同構成了AI時代的全鏈路效率體系,它們相互影響、相互放大:硬件效率是基礎,算法效率是槓桿,系統效率是支撐,商業效率是最終的閉環。一個國家、一個企業的比較優勢,從來不是靠單一環節的效率提升,而是靠全鏈路的效率優化,形成協同效應。只有把全鏈路的效率都做到極致,才能在全球AI競爭中,構建起真正不可替代的長期優勢。
堅定恪守長期主義
當AI產業從狂熱的規模內捲,回歸到理性的效率至上,整個行業的競爭邏輯,正在發生根本性的重構。未來的AI競爭,不再是算力規模的絕對值比拼,而是全鏈路效率的綜合較量;不再是少數擁有海量算力的巨頭的專屬遊戲,而是所有能夠在效率上實現突破的參與者的公平競爭;不再是單一環節的技術比拼,而是從硬件到算法、從系統到商業的全鏈條協同優化。
效率,正在成為AI時代最核心的硬通貨,也是企業與國家構建長期比較優勢的底層邏輯。對於企業來說,只有把全鏈路的效率做到極致,用最少的資源投入,創造最大的商業價值,才能在激烈的市場競爭中,實現可持續的發展;對於國家來說,只有充分發揮自己的比較優勢,在硬件、算法、系統、商業的全鏈條,實現效率的持續提升,才能在全球AI競爭中,構建起不可替代的話語權,走出一條高質量的發展道路。
效率的競爭未來將呈現出三個核心的趨勢:
第一,軟硬件的協同優化,將成為效率提升的核心方向。未來的AI芯片與大模型算法,將不再是獨立發展,而是深度綁定、協同優化,針對特定的模型架構,設計專門的硬件,針對硬件的特性,優化模型的算法,實現軟硬件的聯合設計,最大限度地提升計算效率。
第二,算力的競爭,將從規模擴張,轉向效率與低碳的綜合比拼。未來的算力基礎設施,不再是簡單的堆GPU數量,而是聚焦於提升算力的利用率、能源效率與低碳水平,綠電的佔比、PUE值、算力利用率,將成為衡量算力競爭力的核心指標。中國的綠電算力優勢、算力網絡調度優勢,將進一步凸顯,成為全球算力市場的核心供給方。
第三,AI的發展,將從技術驅動,轉向價值驅動,商業效率將成為最終的評判標準。未來的AI產業,將不再沉迷於參數榜單的比拼、技術概念的炒作,而是回歸到價值創造的本質,聚焦於解決實際的問題,實現商業的正向循環。垂直場景的深度落地、端側AI的普及、開源生態的構建,將成為AI產業發展的核心主線,擁有豐富場景、龐大市場、完整產業鏈的國家與企業,將在這場價值競爭中,佔據更大的優勢。
AI時代的大幕才剛剛拉開,規模只是暫時的優勢,效率才是長期的護城河。只有堅守長期主義,聚焦於全鏈路的效率提升,把技術創新與商業價值深度結合,才能在這場全球AI競爭中,行穩致遠,最終構建起真正不可替代的比較優勢。
(作者為外資投資基金董事總經理)
(來源:大公報A13:經濟 2026/04/18)

字號:

評論