港中深研校園版ChatGPT 鳳凰大語言模型即將上線
(大公文匯網記者李望賢 深圳報道)想知道學校有幾個食堂?哪些菜品好吃實惠?想要了解某個學院的師資力量、講座訊息?想對論文進行潤色,讓文章更加流暢……向「鳳凰」提問,它會一一提供寶貴建議。
由香港中文大學(深圳)師生團隊聯合深圳市大數據研究院自主研發的「鳳凰」的大語言模型將在8月中旬開放內部測試。
據悉,「鳳凰」大語言模型結合全球領先的人工智能技術與校園教學、研究需求,是一款經過校內數據科學團隊精心研發的一項人工智能應用,旨在針對校內數據進行指令微調,為廣大師生提供智能化、高效率的學習與研究支持。
據悉,「鳳凰」大語言模型在校園內有着廣泛的應用場景,包括學術研究助力,可以請求「鳳凰」進行潤色,讓文章更加流暢。在科研項目方面,無論是實驗設計還是數據分析,它都能為科研團隊提供關鍵支持,推動創新成果的產出,讓科研更加高效。「鳳凰」大語言模型還可進行校園信息查詢,師生不必費心到處查找,只需詢問「鳳凰」,你就能獲取關於校園設施、行政流程、教授研究領域等方面的信息。
據介紹,「鳳凰」在具有香港中文大學(深圳)校內知識的同時,在通用能力方面也達到了GPT的95%的水平,具有強大的智慧內核。通過此技術,團隊希望模型的輸出更加貼近校園現實,為校內師生提供真正有用的智能化建議與支持。在使用期間,「鳳凰」研發團隊深知數據安全與私隱保護的重要性。所有「鳳凰」大語言模型的應用都遵循嚴格的數據私隱保護原則,確保師生的個人信息與學術數據。
一切創新都源自生活,鳳凰大語言模型的構想也是如此。 2023年5月,香港中文大學(深圳)的師生團隊聚在一起開展課題小組討論時,大家充滿激情地構想着一個令人興奮的場景:「我們可以開發一款專門用於校內的大語言模型,為校內師生提供個性化的智能學習和研究輔助,讓學術探索更加高效和智能化!」
數據科學學院的青年教師王本友在日常交流中,經常聽到團隊裏的學生講述在處理海量學術數據和文獻時遇到的困難,深知學生們在技術和理論上的壓力,王本友教授決定以他的學術經驗,帶領學生共同探索一個解決方案,希望做出一款專屬於校內師生的大語言模型,真正將人工智能與校園生活無縫地結合起來。王本友在獲得成熟的構思之後,立刻與博士生陳志鴻進行了可行性的溝通,並與計算器科學與技術專業的本科生研究助理劉禹恆取得聯繫,指導劉禹恆主導研究「鳳凰」項目。隨後,團隊招募了三位研究助理加入團隊,他們分別是來自大數據科學專業的本科生歐陽愷瑞、張一笛和來自大數據研究院的研究助理宋定傑。他們融合各自的專業知識和熱情,通宵達旦地研究、探索和迭代。經過數月的不懈努力,「鳳凰」大語言模型擬在8月中旬發布內測版。
目前,英特爾公司專門選取「鳳凰」模型做CPU的適配,參考https://github.com/intel-analytics/BigDL ,彰顯了模型的全球影響力和工業界影響力。鳳凰是第一個多語言開源的類ChatGPT的語言模型,根據第三方排行榜SuperCLUE琅琊榜(中文通用大模型匿名對戰評價基準)https://www.superclueai.com/ 的排名情況,它排名第五,為高校獨立開發的首位。
記者了解到,香港中文大學(深圳)研發團隊除了開發「鳳凰」,還同時開發專註於醫療健康領域的大模型「華佗GPT」。公開數據顯示,2023年2月,研發團隊發布的「華佗GPT」是首個國內類ChatGPT的醫療大模型,也是國內公開的首個通過多個醫療資格考試的大模型,目前在線已經有十幾萬用戶體驗了「華佗GPT」的功能。
評論