杭州六小龍進化路|DeepSeek創新火花 源自熱情與好奇
(大公報 記者 王莉)2025年開年,被創始人梁文鋒自喻為「鯰魚」的「杭州六小龍」之一、人工智能(AI)大模型DeepSeek橫空出世,席捲全球AI行業,其背後的極客(對計算機和技術充滿熱情的人)團隊備受外界關注,OpenAI前政策主管Jack Clark認為,一定有一群「高深莫測的奇才」。對此,梁文鋒回覆,在深度求索(DeepSeek)公司內,沒有什麼高深莫測的奇才,甚至沒有海歸,都是中國本土高校畢業甚至還沒有畢業的年輕人。
「不是所有人都能瘋狂一輩子,但大部分人在他年輕的那些年,可以完全沒有功利目的,投入地去做一件事。」梁文鋒說,創新的火花來自於「熱愛與好奇」。
黃仁勳首談DeepSeek:為AI領域帶來巨大活力
DeepSeek-R1推出後,投資者開始質疑大型科企投入數萬億美元建設AI基礎設施的必要性。英偉達CEO黃仁勳在近日預先錄製訪談中指出,市場的劇烈反應源於投資者的誤讀。黃仁勳強調,儘管R1的開發似乎減少了對算力的依賴,但人工智能行業仍需強大的算力來支持模型訓練後處理方法。黃仁勳還提到,DeepSeek的創新成果為人工智能領域帶來巨大的活力:「R1開源後,全球範圍內所展現出的熱情令人難以置信,這是一件極其令人興奮的事情。」
「人工成本是對未來的投資,是公司最大的資產。」梁文鋒曾公開表示,團隊成員中,工程師和研發人員都來自清華大學、北京大學、浙江大學、中山大學等國內頂尖高校,工作時間都不長,幾乎沒有海歸。「我們選人的標準一直都是熱愛和好奇心。」他堅信,創新首先是一種信念,而年輕人往往更具信心。
減少干預 讓每個人自由發揮
據悉,DeepSeek-V3最核心技術之一就是通過機制架構的創新,大大降低內存佔用並提高計算效率,而這一創新變革就來自一位年輕工程師的靈感。「他在總結主流架構的關鍵演化規律後,突然靈感迸發,設計出了一種新的替代方案。但從想法到現實,是一個漫長的過程。我們組建了團隊,花了幾個月時間驗證它的可行性。」
梁文鋒對團隊的管理採用了「放養模式」,不設KPI、不做干預,讓成員自己想辦法、自己發揮。「分工是自然形成的。每個人都帶着自己的經驗和想法,當他們遇到挑戰時,會自發地拉上別人討論。不過,一旦某個想法被證明有潛力,我們就會從上層投入資源,推動它的發展。」
梁文鋒認為,創新需要盡可能少的干預和管理,讓每個人有自由發揮的空間和試錯機會。在DeepSeek辦公區會議室兩側都設置了可以隨意推開的門,據內部人員解釋,這是為「偶然」留出的空隙。任何一個會議,偶然經過的人如果對討論問題有興趣都可以隨時加入,意外的驚喜也許就此產生。
有這樣的組織管理理念,DeepSeek開源的決策也由此應運而生。「在顛覆性的技術面前,閉源形成的護城河是短暫的。我們把價值沉澱在團隊上,同事在這個過程中得到成長,形成可以創新的組織和文化,就是我們的護城河。」就在馬斯克發布Grok-3模型後三天,2月21日DeepSeek宣布,從下周開始,他們將開源5個代碼庫,以完全透明的方式與全球開發者社區分享研究進展。
梁文鋒洞見創科發展
兩小時研討會上的沉默與睿智
DeepSeek創始人梁文鋒1985年出生於廣東湛江吳川,從小學習成績優異,初中就開始學習大學數學。身為「小鎮做題家」,2002年他考上浙江大學電子信息工程專業,畢業後沒有像其他同學一樣當「碼農」,反而對投資產生了濃厚興趣,一個人在成都出租屋裏探索全自動量化交易,一鑽研就是3年。
2015年,梁文鋒與同學共同創立了量化對沖基金公司幻方量化,他們將數學與人工智能深度融合,憑藉先進的算法和高效的執行力,在市場中屢創佳績,2021年公司資產管理規模已突破千億大關。2023年,全球AI大模型風起雲湧,同年4月,梁文鋒宣布正式進軍通用人工智能領域,「追尋一直以來的技術理想,超越投資去直面更大的課題」。很快,DeepSeek在杭州應運而生,同年11月,DeepSeek發布了開源的代碼大模型,直至2025年1月20日,DeepSeek正式發布DeepSeek-R1,席捲全球。
曾與梁文鋒有過接觸的相關人士告訴大公報記者,在他身上透露出更多的是極客的氣質。「初次見面時,我完全沒認出他就是公司老闆,看上去更像是程序員或者工程師。全程兩個小時的調研會上,他一句話沒說,直到最後一對一詢問時,他才開口。講話很簡潔,但邏輯特別清晰。」
不拘一格|百萬年薪招人才 潛力比經驗重要
DeepSeek火爆「出圈」後,再次因為大規模高薪招聘登上熱搜。記者查看相關招聘平台發現,DeepSeek發布的52個在招職位,涵蓋深度學習研究員、核心系統研發工程師及資深UI設計師等,大部分崗位起薪2萬元(人民幣,下同)以上,實行「14薪制」。其中薪酬最高的崗位是「深度學習研究員-AGI」,年薪最高可達154萬元。而且大部分崗位對學歷要求本科起招。
這或許還是與梁文鋒一貫的選人標準有關。「如果追求短期目標,找現成有經驗的人是對的。但如果看長遠,經驗就沒那麼重要,基礎能力、創造性、熱愛等更重要。」他認為,「做一件事,有經驗的人會不假思索告訴你應該這樣做,但沒有經驗的人會反覆摸索、很認真去想應該怎麼做,然後找到一個符合當前實際情況的解決辦法。」
人才是一切技術型事業的開始,杭州也已做好充分儲備。業內人士分析,DeepSeek的成功與浙大等頂尖高校的人才儲備也密不可分。梁文鋒與幻方合夥創始人本身都畢業於浙大。根據脈脈人才智庫發布的《人工智能頂尖人才數據圖鑒2022》,北京AI人才佔全國的24%,排名第二的就是杭州,佔16.53%,深圳則佔6.18%。
(來源:大公報A4:要聞 2025/02/23)

字號:

評論