DeepSeek新模型開源　推理能力大升級

大公文匯網新聞內地

中國新聞

2026.04.25 07:42:25

字號：

小中大特大

（大公報記者　劉鑛豪）中國通用人工智能領先企業DeepSeek（深度求索）昨日發布大模型DeepSeek-V4預覽版並同步開源，該模型在Agent代理（智能體）執行力、世界知識儲備及邏輯推理性能上均取得顯著突破，標誌着國產開源模型正式跨入「百萬級超長上下文」普惠時代。

DeepSeek-V4分為「Pro」與「Flash」兩個版本，旨在滿足不同層次的應用需求。兩個版本在國內與開源領域處領先位置，而在數學、STEM、競賽型代碼的測評中，則取得比肩世界頂級閉源模型的優異成績。市場預期新模型將可以深度適配國產芯片，芯片股昨日大漲，華虹半導體（01347）急升15%。

深度求索今次推出兩款模型參數差距較大，DeepSeek-V4-Pro的參數為1.6T，而DeepSeek-V4-Flash的參數僅284B。深度求索以「性能比肩頂級閉源模型」形容DeepSeek-V4-Pro，主要體現在三個部分：Agent能力大幅提高、豐富世界知識、世界頂級推理性能。首先在Agent能力方面，相比前代模型，「Pro」的Agent能力顯著增強；在Agentic Coding評測中，達到開源模型領先水平。DeepSeek-V4成為公司內部員工使用的模型，據評測反饋，使用體驗優於Sonnet 4.5，交付質量接近Opus 4.6非思考模式，但思考模式存在一定差距。

「Pro」在世界知識測評中，大幅領先其他開源模型，僅稍遜於頂尖閉源模型Gemini-Pro-3.1。推理性能方面，「Pro」在數學、STEM、競賽型代碼的測評中，超越當前所有已公開評測的開源模型，取得比肩世界頂級閉源模型的優異成績。

支援百萬字超長文

至於「Flash」版本，深度求索形容為「高效經濟之選」。公司表示，雖然相比「Pro」，「Flash」在世界知識儲備方面稍遜，但推理能力接近。由於模型參數和激活更小，相較之下「Flash」能提供更加快捷、經濟的API服務。在Agent測評，「Flash」在簡單任務上與「Pro」旗鼓相當，只在高難度任務上有差距。

值得一提的是，DeepSeek-V4開創一種全新的注意力機制，在token（詞元）維度進行壓縮，結合DSA稀疏注意力，實現全球領先的長上下文能力，並且相比於傳統方法大幅降低了對計算和顯存的需求。兩款模型擁有百萬字超長上下文，同時支持非思考模式與思考模式，並成為深度求索所有官方服務的標配。該公司表示，用戶即日起登錄官網「chat.DeepSeek.com」或官方App，即可與最新DeepSeek-V4對話。

華虹與中芯抽高一成

投資者預期DeepSeek-V4將適配國產芯片，芯片股昨日顯著造好，華虹半導體大升15.1%，收報108.1元；中芯國際（00981）升10%，報64.3元。豪威集團（00501）升7.3%，報87.75元。華贏東方證券研究部董事李慧芬認為，經過昨日拉升後，芯片股短線或回吐，投資者不妨待調整後再吸納。雖然芯片股中線可看高一線，以短線操作為主的投資者，需要緊貼股價走勢，因為股價波動較大。

加劇Agent賽道競爭

招商證券國際認為，因應DeepSeek-V4的推出，阿里巴巴（09988）、騰訊（00700）等龍頭雲廠商將直接受益，帶動MaaS平台收入持續提升。阿里巴巴、騰訊據報正洽談投資DeepSeek。

招商證券國際又稱，DeepSeek-V4-Flash輸出定價僅2元人民幣／百萬token，顯著利好AI應用層開發商成本效益，亦利好AI-native SaaS類公司加速AI能力內嵌。

該行相信，DeepSeek-V4對智譜（02513）、MiniMax（00100）等上市模型廠商不會構成顛覆性衝擊，但加劇Agent賽道競爭。

強強聯手　華為昇騰全面支持DeepSeek-V4

伴隨DeepSeek-V4發布，華為表示，昇騰（Ascend）一直同步支持DeepSeek系列模型，今次通過雙方芯模技術緊密協同，實現昇騰超節點全系列產品支持DeepSeek-V4系列模型。昇騰是華為自研的基於「達芬奇架構」的AI處理器系列（NPU），專注於高性能邊緣與雲端計算。

華為指出，昇騰950超節點重新定義長文本推理的性能天花板，實現DeepSeek V4-Pro 20ms和DeepSeek V4-Flash 10ms低時延推理。DeepSeek承認，現時V4-Pro版本的API訪問服務吞吐十分有限，直到下半年昇騰950超節點批量上市後，價格將會大幅下降。

寒武紀昨日亦宣布，已基於vLLM推理框架完成對DeepSeek最新開源模型的適配，模型發布當日即實現穩定運行，適配代碼已開源到GitHub社區。

針對DeepSeek-V4的新結構，寒武紀通過自研高性能融合算子庫Torch-MLU-Ops，對Compressor、mHC等模塊進行專項加速；利用BangC高性能編程語言，編寫稀疏／壓縮Attention、GroupGemm等熱點算子的極致優化Kernel，充分釋放硬件底層性能。

（來源：大公報A6：要聞 2026/04/25）

中國新聞

評論

相關推薦