淵謀遠略｜AI新階段　不捲規模捲效率

大公文匯網大文獨家

大文獨家

2026.04.18 08:41:19

字號：

小中大特大

文/袁淵

當全球人工智能（AI）產業陷入「規模內捲」的狂熱之中，愈來愈多的從業者開始意識到一個殘酷的現實──規模的邊際效益正在快速遞減。當「堆規模」的增長模式走到盡頭，整個產業終於回歸到最本質的問題：AI時代的核心競爭力，從來不是算力規模的絕對值，而是算力的利用效率。

效率，是貫穿大模型、圖形處理器（GPU）與算力規模全鏈條的核心主線，也是企業與國家構建長期比較優勢的底層邏輯。今天真正決定競爭力的，是你能把多少理論算力轉化為有效算力，能用多少算力實現想要的效果，能讓投入的算力帶來多少商業回報。

要理解效率如何決定比較優勢，首先要跳出對「效率」的狹隘認知——它絕不僅僅是GPU的TOPS/W（每瓦算力），也不是單純的模型推理速度，而是一個覆蓋AI全生命周期的完整效率體系，從硬件到算法，從系統到商業，每一個環節的效率短板，都會導致整個體系的投入產出比大幅下降。只有理清全鏈路的效率構成，才能找到提升比較優勢的核心抓手。

算法彌補硬件差距

硬件是效率的底層基礎，這裏的核心指標，不是GPU的理論峰值算力，而是算力轉化效率，也就是GPU的理論算力，最終能有多少轉化為大模型訓練與推理的有效算力。它包含兩個核心維度：一是硬件本身的能效比，也就是每消耗1瓦電力，能提供多少AI算力，這決定了算力的基礎成本；二是算力的有效利用率，也就是在實際的大模型任務中，GPU能持續輸出的算力，佔其理論峰值算力的比例，這決定了硬件資源的浪費程度。

很多廠商在宣傳GPU時，都會強調其峰值算力有多高，但在實際的大模型任務中，這個峰值算力幾乎永遠無法達到。而很多國產GPU，儘管理論峰值算力已經接近A100，但在實際任務中，有效算力利用率往往不到20%。這就導致哪怕硬件的理論峰值相同，實際的算力輸出差距卻能達到2至3倍。

如果說硬件效率是基礎，那麼算法效率就是放大硬件價值的核心槓桿。這裏的核心指標，是算力價值效率，也就是每單位算力，能實現的模型效果與業務價值。它回答的核心問題是：同樣的算力投入，誰能訓練出效果更好的模型？同樣的模型效果，誰需要的算力更少？

過去幾年，大模型產業陷入了「參數量愈大，能力愈強」的誤區，卻忽略了算法效率的核心價值。事實上，模型參數量翻倍，訓練所需的算力往往要翻3至4倍，但模型的通用能力，可能只提升了不到10%，這就是典型的算法效率低下。而算法效率的提升，往往能帶來指數級的價值放大：一個經過深度優化的70億參數模型，效果能超過未經優化的1750億參數模型，而所需的訓練算力只有後者的幾十分之一，推理算力更是只有百分之一。

這種算法效率的差距，能讓算力不足的企業與國家，用更少的硬件投入，實現接近甚至超越頭部玩家的效果，這是打破規模壟斷、構建比較優勢的核心機會。

積極完善商業閉環

單張GPU的效率再高，如果不能在集群中實現高效的協同調度，最終的整體效率也會大打折扣。系統層的核心指標，是集群協同效率，也就是由數千張GPU組成的算力集群，其整體的算力輸出，能達到單張GPU算力的多少倍，也就是線性加速比。同時，還包括數據中心的能源利用效率，也就是電力使用效率（PUE）值，它決定了有多少電力被真正用於算力輸出，而不是浪費在製冷、供電等環節。

這是最容易被忽略的效率環節，也是全球算力產業最大的效率窪地。根據行業機構的測算，全球絕大多數企業自建的算力集群，GPU的平均利用率不到20%，很多GPU長期處於閒置狀態；而數千張GPU組成的大規模集群，線性加速比往往不到60%，也就是1000張GPU的訓練速度，還不到1張GPU的600倍。造成這種情況的原因，包括網絡帶寬不足、存儲性能瓶頸、調度系統落後、分布式訓練框架優化不足等，任何一個環節的短板，都會導致整個集群的效率大幅下降。

而系統效率的提升，能在不增加硬件投入的情況下，讓總算力輸出翻倍，這是提升算力規模性價比最直接的方式，也是不同國家、不同企業之間算力競爭力差距的核心來源。

所有的硬件、算法、系統效率提升，最終都要落地到商業價值上，這就是商業效率，也就是投入的算力與技術資源，最終能帶來多少商業回報，能否形成可持續的正向商業循環。它回答的核心問題是：投入的每一分錢算力成本，能帶來多少收入增長與成本節約？

這是效率體系的最終閉環，也是決定企業與國家能否在AI競爭中持續發展的核心。

很多企業投入數十億資金，購買了數萬張GPU，訓練了超大參數的通用大模型，卻始終找不到商業化的落地場景，沒有穩定的收入來源，最終只能持續燒錢，難以為繼，這就是典型的商業效率缺失。而真正具備競爭力的企業，往往能把算力資源聚焦在高價值的垂直場景，用最少的算力投入，解決行業的核心痛點，實現明確的降本增效，形成「算力投入─商業回報─更多研發投入」的正向循環。

以上四個層面的效率，共同構成了AI時代的全鏈路效率體系，它們相互影響、相互放大：硬件效率是基礎，算法效率是槓桿，系統效率是支撐，商業效率是最終的閉環。一個國家、一個企業的比較優勢，從來不是靠單一環節的效率提升，而是靠全鏈路的效率優化，形成協同效應。只有把全鏈路的效率都做到極致，才能在全球AI競爭中，構建起真正不可替代的長期優勢。

堅定恪守長期主義

當AI產業從狂熱的規模內捲，回歸到理性的效率至上，整個行業的競爭邏輯，正在發生根本性的重構。未來的AI競爭，不再是算力規模的絕對值比拼，而是全鏈路效率的綜合較量；不再是少數擁有海量算力的巨頭的專屬遊戲，而是所有能夠在效率上實現突破的參與者的公平競爭；不再是單一環節的技術比拼，而是從硬件到算法、從系統到商業的全鏈條協同優化。

效率，正在成為AI時代最核心的硬通貨，也是企業與國家構建長期比較優勢的底層邏輯。對於企業來說，只有把全鏈路的效率做到極致，用最少的資源投入，創造最大的商業價值，才能在激烈的市場競爭中，實現可持續的發展；對於國家來說，只有充分發揮自己的比較優勢，在硬件、算法、系統、商業的全鏈條，實現效率的持續提升，才能在全球AI競爭中，構建起不可替代的話語權，走出一條高質量的發展道路。

效率的競爭未來將呈現出三個核心的趨勢：

第一，軟硬件的協同優化，將成為效率提升的核心方向。未來的AI芯片與大模型算法，將不再是獨立發展，而是深度綁定、協同優化，針對特定的模型架構，設計專門的硬件，針對硬件的特性，優化模型的算法，實現軟硬件的聯合設計，最大限度地提升計算效率。

第二，算力的競爭，將從規模擴張，轉向效率與低碳的綜合比拼。未來的算力基礎設施，不再是簡單的堆GPU數量，而是聚焦於提升算力的利用率、能源效率與低碳水平，綠電的佔比、PUE值、算力利用率，將成為衡量算力競爭力的核心指標。中國的綠電算力優勢、算力網絡調度優勢，將進一步凸顯，成為全球算力市場的核心供給方。

第三，AI的發展，將從技術驅動，轉向價值驅動，商業效率將成為最終的評判標準。未來的AI產業，將不再沉迷於參數榜單的比拼、技術概念的炒作，而是回歸到價值創造的本質，聚焦於解決實際的問題，實現商業的正向循環。垂直場景的深度落地、端側AI的普及、開源生態的構建，將成為AI產業發展的核心主線，擁有豐富場景、龐大市場、完整產業鏈的國家與企業，將在這場價值競爭中，佔據更大的優勢。

AI時代的大幕才剛剛拉開，規模只是暫時的優勢，效率才是長期的護城河。只有堅守長期主義，聚焦於全鏈路的效率提升，把技術創新與商業價值深度結合，才能在這場全球AI競爭中，行穩致遠，最終構建起真正不可替代的比較優勢。

（作者為外資投資基金董事總經理）

（來源：大公報A13：經濟 2026/04/18）

大文獨家

評論

相關推薦