中國AI調用量首超美國　四款大模型霸榜全球前五

大公文匯網新聞內地

大公報援引每日經濟新聞報道，全球最大AI模型API聚合平台OpenRouter數據顯示，2026年2月，中國AI模型調用量三周大漲127%，首次超越美國，且全球前五中佔四席。Token正從「流量」變為AI時代「燃料」，AI服務商業模式向「燃料＋成果」演進，未來定價將走向定製化和靈活化。中國模型廠商，正憑藉快速迭代和成本優勢佔領全球市場，國產算力需求正經歷指數級增長。2026年2月16日至22日的周榜單顯示，平台調用量排名前五的模型中，有四款來自中國廠商，分別為MiniMax的M2.5、月之暗面的Kimi K2.5、智譜的GLM-5以及DeepSeek的V3.2。這四款模型合計貢獻了Top5總調用量的85.7%。

Token消耗量的指數級攀升，表面看是用戶規模與使用時長的增長，但其背後更深層次的驅動力，是用戶對AI使用模式的根本性轉變。AI的角色正在從一個提供簡單信息、進行日常閒聊的「問答工具」，進化為能夠深度參與工作流、處理複雜任務的「生產力工具」。

國聯民生證券在近期發布的研報中，提出了「Token通脹」這一概念。這並非指Token本身變貴，而是指在單位時間內、單位用戶的Token消耗結構性上升。報告將這一現象歸因於三大核心趨勢。

淺層「問答」轉向深度「幹活」

首先，用戶的核心需求正在從淺層的「問答」轉向深度的「幹活」，即越來越多地利用AI來重構代碼、改寫文件、生成文檔和跑測試。編程場景天然具有「長上下文、多輪迭代、大量輸出」的特徵，會大量消耗Token。

其次，AI Agent技術的興起和普及，放大了Token的消耗。Agent會主動規劃、檢索、執行、反思，多次調用模型，Token消耗自然按步驟累加。

最後是推理強度上升。更多深度思考、更長鏈路推理會顯著提高輸出與中間過程的Token消耗。但對開發者而言，這往往帶來更高成功率與更少返工，用戶反而願意「增加Token投入來換取效率」。

英偉達CEO黃仁勳在2月26日的業績電話會上，反覆向市場強調一個核心觀點：「計算即收入」「推理即收入」。在全球數據中心電力瓶頸日益凸顯的今天，「性能／瓦特」（Performance per Watt）已成為衡量AI服務效率與收入能力的關鍵指標。

企業將更願意為直接「成果」付費

弗若斯特沙利文中國總監李慶向每經記者表示，隨着AI從「問答」工具向「幹活」的生產力工具轉變，企業將更願意為直接的「成果」付費，這將催生出更多基於訂閱制的商業模式。

李慶還預測，未來AI服務的定價將不可避免地走向高度定製化和靈活化。她表示，Agent時代的到來意味着任務的複雜度千差萬別，單一的定價模式將無法覆蓋所有商業需求。未來，計算消耗、調用頻次、任務是否涉及多步推理或規劃等高成本操作，都將成為影響定價的因素，一個多維度、動態的定價體系將成為主流。

（來源：大公報A17：內地 2026/02/28）

中國新聞

評論

相關推薦