港首個AI大模型 HKGAI V1面世
(大公報 記者 唐雪婷、郭如佳)香港生成式人工智能研發中心(HKGAI)昨日舉行本港首個人工智能大語言模型「HKGAI V1」發布會,這是業界首個基於DeepSeek 671B全參數微調、並持續訓練產生的大模型。團隊將DeepSeek系統本地化,設有對話及推理系統,可識別粵語、英語、普通話,涵蓋五個系統,包括「港話通」、「港文通」、「港會通」、「港法通」、「港環通」。
創新科技及工業局局長孫東致辭表示,由中心成立到本港自行研發的大語言模型正式推出,歷時一年半,書寫了「獅子山下美好創科傳奇」。香港科技大學首席副校長、香港生成式人工智能研究中心主任郭毅可介紹產品核心功能,他透露HKGAI V1大模型目標在今年內供市民使用,並期望系統未來能應用至金融、醫療等領域。
HKGAI V1大模型的建設,由特區政府重點創科項目「InnoHK創新香港研發平台」(InnoHK)資助的香港生成式人工智能研發中心主導,與北京大學等相關團隊聯合研發,展示出香港與內地高校在人工智能領域的強大協同創新能力。孫東致辭表示:「我們用最快的速度成立了InnoHK香港生成式人工智能研發中心,由香港科技大學領軍,還有本港其他四所大學和海外的科研機構共同參與,為香港研製自身大語言模型。」
70部門已試用及協助訓練
孫東指出,去年上半年,研發中心就開發出第一個大語言模型的版本「港文通」(生成式人工智能文書輔助應用程式),而且從去年年中開始,率先在政府部門開始試用及訓練,至今有超過70個政府部門已經開始試用及協助模型的訓練。
DeepSeek本地化 可支持粵語
他表示,從當初中心的成立到今天香港自己研發的大語言模型的正式推出,歷時一年半,從無到有,書寫了獅子山下一個美好的創科傳奇。「在這波以人工智能為代表的科技浪潮中,香港沒有缺席。」他希望香港研發的大語言模型能夠立足香港,盡快提供予業界及市民使用,服務大眾,亦希望日後能利用好這個平台,服務數以千萬的海外華人。
郭毅可在現場介紹產品核心功能並展示應用場景。他表示,HKGAI V1基於香港本地獨有數據,實現了針對DeepSeek的本地化訓練。HKGAI V1的背後是香港最大的大模型本地知識庫,全面支持兩文三語(粵語、英語、普通話),設有對話及推理系統,只要向「港話通」系統輸入指令,即可實時回答提問或生成指定內容,例如回答政府部門架構、最新電影票房等問題,或規劃旅遊行程等。
他表示,該大語言模型亦包括「港文通」、「港會通」、「港法通」、「港環通」,分別協助用戶撰寫文件、生成會議概要、提供香港法例及案件參考、自動生成香港環保報告,極大提高工作效率。他表示,目前首要是做到在政府內部廣泛且穩定應用,在有足夠承載力前提下,目標今年內可開放予公眾使用。
HKGAI V1解構
話你知|大模型微調 適用各行業
現時每個行業都在探索大模型的應用落地。對於大部分用戶來說,都沒有足夠的成本來創建獨特的基礎模型(Foundation Model)。但在大量基礎模型的開源分享之後,人們可以使用微調(Fine-tuning)的方法,訓練出適合自己行業和獨特用例的大模型以及應用。
大模型微調是指在已經預先訓練好的大型語言模型基礎上,使用特定的數據集作進一步的訓練,以使模型適應特定任務或領域。
例如,一個通用大模型涵蓋許多語言資訊,並能夠進行流暢的對話。但若想在醫藥方面,能給到患者準確的回答,就需要為這個通用大模型提供很多新的數據以供學習和理解。例如,布洛芬到底能否和感冒藥同時服用?為了確定模型可以回答正確,我們就需要對基礎模型進行微調。
提升效率|AI+政務 內地風行
內地各級地方政府接入DeepSeek向公民提供政務服務成為熱潮。深圳、廣州、呼和浩特、贛州、無錫、臨沂等地政府均宣布在政務系統中接入DeepSeek模型,廣泛推廣「AI+政務」,例如做各專業領域的檢索或諮詢助手。
深圳福田區最近推出基於DeepSeek開發的AI數智員工,首批70名AI數智員工已「上崗」,工作內容包括:公文格式修正準確率超95%,「執法文書生成助手」將執法筆錄秒級生成執法文書初稿,「AI招商助手」企業分析篩選效率提升30%;除有DeepSeek通用能力外,AI數智員工還結合各部門各單位實際業務流程,量身定制個性化智能體,首批滿足240個業務場景使用。
(來源:大公報A1:要聞 2025/02/26)
字號:

評論