文心大模型X1.1深度思考模型首發　與GPT-5效果持平

大公文匯網新聞內地

（大公文匯網記者朱燁北京報道）在9日舉行的WAVE SUMMIT 深度學習開發者大會2025上，百度重磅發布文心大模型X1.1，並公布文心和飛槳的一系列技術、產品、生態最新成果。百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰透露，該模型在事實性、指令遵循、智能體等能力上均有顯著提升。目前，用戶可以在文心一言官網、文小言APP使用文心大模型X1.1。文心大模型X1.1已正式上線百度智能雲千帆平台，對企業客戶及開發者全面開放使用。

據王海峰現場介紹，文心大模型X1是基於文心大模型4.5訓練而來的深度思考模型，升級後的X1.1主要採用了迭代式混合強化學習訓練框架，一方面通過混合強化學習，同時提升通用任務和智能體任務的效果；另一方面通過自蒸餾數據的迭代式生產及訓練，不斷提升模型整體效果。相比文心大模型X1，X1.1的事實性提升34.8%，指令遵循提升12.5%，智能體提升9.6%。

在多個權威基準評測中，文心大模型X1.1整體表現超越DeepSeek R1-0528，在部分任務上展現出領先優勢。同時，在與國際頂尖模型GPT-5和Gemini 2.5 Pro相比，效果持平。

大會現場，百度還發布了飛槳核心框架v3.2，在大模型訓練、硬件適配和生態支持上全面升級，並同步升級大模型開發套件ERNIEKit和高效部署套件FastDeploy。

據最新數據披露，飛槳文心生態開發者達到2333萬，服務企業達到76萬家。

此外記者注意到，當日百度文心大模型還與中國老齡事業發展基金會聯合發起「AI助老公益計劃」，通過智能體、AI應用、AI公益志願活動等舉措，助力銀髮一族跨越數字鴻溝，推動老年群體樂享生活。目前，「AI助老智能體」已正式上線，在百度搜索「AI助老智能體」或打開小度智能健康屏，每個老人都能享受到AI所帶來的暖心與便利。

劇本驅動多模協同的數字人技術線上直播表現超真人

百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜現場展示了文心大模型X1.1的實際使用體驗，深入解讀基於文心大模型的最佳實踐——劇本驅動多模協同的數字人技術，並帶來文心數據生態等最新進展。

在現場演示中，文心大模型X1.1在處理複雜寫作任務時，既能運用模型內化的知識、調用聯網搜索工具等準確查找用戶需要的知識，又能深度思考用戶希望創意寫作的立意和要求，最後輸出事實準確，結構化、邏輯性強，並且文辭優美的內容。在更複雜的長程任務場景，文心大模型 X1.1在面對共享單車平台不同等級用戶，不同類型問題的處理流程，以及用戶的不同情緒狀態多元素疊加的問題時，能夠嚴格遵循業務流程先後規劃、再自主調用工具，並結合用戶情緒，短時內解決了問題，服務過程完整主動。

飛槳框架v3.2發布文心快碼全新升級至3.5S版本

此外，百度AI技術生態總經理馬艷軍正式對外發布飛槳（PaddlePaddle）框架v3.2，以及文心大模型開發套件ERNIEKit、大模型高效部署套件FastDeploy和兩大AI科學計算套件PaddleCFD、PaddleMaterials，全面降低大模型從訓練到部署的應用門檻。依託計算優化、並行策略和原生容錯能力三大核心升級，飛槳框架v3.2突破大模型訓練技術難題，顯著提升了訓練效率，在ERNIE-4.5-300B-A47B模型上實現預訓練MFU達47%。同時，該版本強化了類CUDA芯片適配能力，實現了最高92%的算子內核復用率，並全面兼容Safetensors權重及生態加速庫一鍵接入，顯著降低部署成本。

另值得注意的是，百度智能代碼助手文心快碼全新升級至3.5S（Super Synergistic AgentS）版本，強化多智能體自協同能力，實現「一人即團隊」開發新模式。據百度副總裁陳洋介紹，文心快碼3.5S版本從三方面進行了升級。首先，智能體能力更強，能懂業務，會分解任務列表，執行更準；其次，從單智能體到多智能體協同，動態生成多個智能體，自主協同一起解決複雜任務；最後，團隊協作更強，基於Rules與MCP構建統一的經驗庫，實現團隊知識傳承。現場數據顯示，文心快碼目前已服務超過1000 萬的開發者。

中國新聞

評論

相關推薦