中國AI調用量首超美國 四款大模型霸榜全球前五
大公報援引每日經濟新聞報道,全球最大AI模型API聚合平台OpenRouter數據顯示,2026年2月,中國AI模型調用量三周大漲127%,首次超越美國,且全球前五中佔四席。Token正從「流量」變為AI時代「燃料」,AI服務商業模式向「燃料+成果」演進,未來定價將走向定製化和靈活化。中國模型廠商,正憑藉快速迭代和成本優勢佔領全球市場,國產算力需求正經歷指數級增長。2026年2月16日至22日的周榜單顯示,平台調用量排名前五的模型中,有四款來自中國廠商,分別為MiniMax的M2.5、月之暗面的Kimi K2.5、智譜的GLM-5以及DeepSeek的V3.2。這四款模型合計貢獻了Top5總調用量的85.7%。
Token消耗量的指數級攀升,表面看是用戶規模與使用時長的增長,但其背後更深層次的驅動力,是用戶對AI使用模式的根本性轉變。AI的角色正在從一個提供簡單信息、進行日常閒聊的「問答工具」,進化為能夠深度參與工作流、處理複雜任務的「生產力工具」。
國聯民生證券在近期發布的研報中,提出了「Token通脹」這一概念。這並非指Token本身變貴,而是指在單位時間內、單位用戶的Token消耗結構性上升。報告將這一現象歸因於三大核心趨勢。
淺層「問答」轉向深度「幹活」
首先,用戶的核心需求正在從淺層的「問答」轉向深度的「幹活」,即越來越多地利用AI來重構代碼、改寫文件、生成文檔和跑測試。編程場景天然具有「長上下文、多輪迭代、大量輸出」的特徵,會大量消耗Token。
其次,AI Agent技術的興起和普及,放大了Token的消耗。Agent會主動規劃、檢索、執行、反思,多次調用模型,Token消耗自然按步驟累加。
最後是推理強度上升。更多深度思考、更長鏈路推理會顯著提高輸出與中間過程的Token消耗。但對開發者而言,這往往帶來更高成功率與更少返工,用戶反而願意「增加Token投入來換取效率」。
英偉達CEO黃仁勳在2月26日的業績電話會上,反覆向市場強調一個核心觀點:「計算即收入」「推理即收入」。在全球數據中心電力瓶頸日益凸顯的今天,「性能/瓦特」(Performance per Watt)已成為衡量AI服務效率與收入能力的關鍵指標。
企業將更願意為直接「成果」付費
弗若斯特沙利文中國總監李慶向每經記者表示,隨着AI從「問答」工具向「幹活」的生產力工具轉變,企業將更願意為直接的「成果」付費,這將催生出更多基於訂閱制的商業模式。
李慶還預測,未來AI服務的定價將不可避免地走向高度定製化和靈活化。她表示,Agent時代的到來意味着任務的複雜度千差萬別,單一的定價模式將無法覆蓋所有商業需求。未來,計算消耗、調用頻次、任務是否涉及多步推理或規劃等高成本操作,都將成為影響定價的因素,一個多維度、動態的定價體系將成為主流。
(來源:大公報A17:內地 2026/02/28)

字號:

評論