DeepSeek新模型開源 推理能力大升級
(大公報記者 劉鑛豪)中國通用人工智能領先企業DeepSeek(深度求索)昨日發布大模型DeepSeek-V4預覽版並同步開源,該模型在Agent代理(智能體)執行力、世界知識儲備及邏輯推理性能上均取得顯著突破,標誌着國產開源模型正式跨入「百萬級超長上下文」普惠時代。
DeepSeek-V4分為「Pro」與「Flash」兩個版本,旨在滿足不同層次的應用需求。兩個版本在國內與開源領域處領先位置,而在數學、STEM、競賽型代碼的測評中,則取得比肩世界頂級閉源模型的優異成績。市場預期新模型將可以深度適配國產芯片,芯片股昨日大漲,華虹半導體(01347)急升15%。
深度求索今次推出兩款模型參數差距較大,DeepSeek-V4-Pro的參數為1.6T,而DeepSeek-V4-Flash的參數僅284B。深度求索以「性能比肩頂級閉源模型」形容DeepSeek-V4-Pro,主要體現在三個部分:Agent能力大幅提高、豐富世界知識、世界頂級推理性能。首先在Agent能力方面,相比前代模型,「Pro」的Agent能力顯著增強;在Agentic Coding評測中,達到開源模型領先水平。DeepSeek-V4成為公司內部員工使用的模型,據評測反饋,使用體驗優於Sonnet 4.5,交付質量接近Opus 4.6非思考模式,但思考模式存在一定差距。
「Pro」在世界知識測評中,大幅領先其他開源模型,僅稍遜於頂尖閉源模型Gemini-Pro-3.1。推理性能方面,「Pro」在數學、STEM、競賽型代碼的測評中,超越當前所有已公開評測的開源模型,取得比肩世界頂級閉源模型的優異成績。
支援百萬字超長文
至於「Flash」版本,深度求索形容為「高效經濟之選」。公司表示,雖然相比「Pro」,「Flash」在世界知識儲備方面稍遜,但推理能力接近。由於模型參數和激活更小,相較之下「Flash」能提供更加快捷、經濟的API服務。在Agent測評,「Flash」在簡單任務上與「Pro」旗鼓相當,只在高難度任務上有差距。
值得一提的是,DeepSeek-V4開創一種全新的注意力機制,在token(詞元)維度進行壓縮,結合DSA稀疏注意力,實現全球領先的長上下文能力,並且相比於傳統方法大幅降低了對計算和顯存的需求。兩款模型擁有百萬字超長上下文,同時支持非思考模式與思考模式,並成為深度求索所有官方服務的標配。該公司表示,用戶即日起登錄官網「chat.DeepSeek.com」或官方App,即可與最新DeepSeek-V4對話。
華虹與中芯抽高一成
投資者預期DeepSeek-V4將適配國產芯片,芯片股昨日顯著造好,華虹半導體大升15.1%,收報108.1元;中芯國際(00981)升10%,報64.3元。豪威集團(00501)升7.3%,報87.75元。華贏東方證券研究部董事李慧芬認為,經過昨日拉升後,芯片股短線或回吐,投資者不妨待調整後再吸納。雖然芯片股中線可看高一線,以短線操作為主的投資者,需要緊貼股價走勢,因為股價波動較大。
加劇Agent賽道競爭
招商證券國際認為,因應DeepSeek-V4的推出,阿里巴巴(09988)、騰訊(00700)等龍頭雲廠商將直接受益,帶動MaaS平台收入持續提升。阿里巴巴、騰訊據報正洽談投資DeepSeek。
招商證券國際又稱,DeepSeek-V4-Flash輸出定價僅2元人民幣/百萬token,顯著利好AI應用層開發商成本效益,亦利好AI-native SaaS類公司加速AI能力內嵌。
該行相信,DeepSeek-V4對智譜(02513)、MiniMax(00100)等上市模型廠商不會構成顛覆性衝擊,但加劇Agent賽道競爭。
強強聯手 華為昇騰全面支持DeepSeek-V4
伴隨DeepSeek-V4發布,華為表示,昇騰(Ascend)一直同步支持DeepSeek系列模型,今次通過雙方芯模技術緊密協同,實現昇騰超節點全系列產品支持DeepSeek-V4系列模型。昇騰是華為自研的基於「達芬奇架構」的AI處理器系列(NPU),專注於高性能邊緣與雲端計算。
華為指出,昇騰950超節點重新定義長文本推理的性能天花板,實現DeepSeek V4-Pro 20ms和DeepSeek V4-Flash 10ms低時延推理。DeepSeek承認,現時V4-Pro版本的API訪問服務吞吐十分有限,直到下半年昇騰950超節點批量上市後,價格將會大幅下降。
寒武紀昨日亦宣布,已基於vLLM推理框架完成對DeepSeek最新開源模型的適配,模型發布當日即實現穩定運行,適配代碼已開源到GitHub社區。
針對DeepSeek-V4的新結構,寒武紀通過自研高性能融合算子庫Torch-MLU-Ops,對Compressor、mHC等模塊進行專項加速;利用BangC高性能編程語言,編寫稀疏/壓縮Attention、GroupGemm等熱點算子的極致優化Kernel,充分釋放硬件底層性能。
(來源:大公報A6:要聞 2026/04/25)

字號:

評論