兩會|張勤委員:推動人工智能賦能中華優秀傳統文化傳播

全國兩會伊始,全國政協委員、中央廣播電視總台新聞中心副召集人張勤提出了《關於推動人工智能賦能中華優秀傳統文化傳播的提案》。

當前,全球人工智能新技術、新產品加速湧現。一方面,文生圖、文生視頻等一系列新技術給各行各業帶來發展的想像空間;另一方面,快速變化的形勢也給中國大模型發展提出了挑戰,使其面臨到底什麼是中國自有的大模型、如何在模型語料訓練等層面體現中國特色等一系列問題。

張勤委員在提案中指出,文生視頻,關鍵在文,對於人工智能而言,輸出什麼關鍵還是看輸入了什麼。但是目前,對於國內外大模型而言,對中國優秀傳統文化的學習還是嚴重不足。當前全球通用(國內也在使用)的大模型數據訓練集裏,中文語料僅占1.3%,中國企業使用的語料中,由美西方主導的英文語料占絕大多數,如果我們訓練的大模型持續用西方價值觀數據、西方應用場景來訓練中國大模型,中國式的認知將被湮沒。以OpenAI的ChatGPT為例,它對於中國文化的理解非常有限。比如,讓它列出著名的七絕,它給出的回答裏卻有杜甫的《春望》、王之渙的《登鸛雀樓》等五言絕句。在全球新的技術變革中,如果不加以引導,中華優秀傳統文化容易被人工智能拋下甚至抹去。

張勤認為,中華優秀傳統文化本身具有領域廣、數據量大、理解難度高等特點,對於與人工智能結合而言,這既是優勢,也是挑戰。優勢在於中華優秀傳統文化積澱深厚,是人工智能學習的巨大語料寶庫,僅以古籍舉例,中國是全球擁有古籍最多的國家,國內現存漢文古籍300萬部,散居在海外的古籍超過40萬部,已完成數字化的古籍為7.4萬部。而挑戰則在於目前這方面的數據結構化程度不高、理解難度極高。這需要有大量團隊持續投入精力開展語料建設相關工作,甚至需要建設針對文言文、古漢語等優秀傳統文化的機器算法與編碼系統,把「道」「德」「善」等核心價值觀根據語境條理化和清晰化,讓人工智能能夠準確理解中華優秀傳統文化的豐富內涵。

張勤介紹,作為音視頻語料庫最豐富的機構,中央廣播電視總台已與高校、科研機構、國內企業聯合在人工智能領域開展了卓有成效的探索,並與多家機構共同發起成立「中國大模型語料數據庫聯盟」,聯合發布「央視聽媒體大模型」,並牽頭髮起成立大模型研發共同體,在科研攻關、需求應用、安全發展、產業生態等方面開展合作,聯動產業鏈上下游,為總台和中國媒體行業高質量發展打造新質生產力。

為了加快新技術更好賦能文化傳播,張勤委員建議集聚資源打造中央廣播電視總台牽頭重大原創平台,具體內容如下:

第一,國家發展改革委和財政部以重點項目和專項資金,支持中央廣播電視總台牽頭推進中華優秀傳統文化與人工智能等現代技術結合的工作。建議將相關工作納入到國家關於人工智能的整體規劃中,加快推動中華優秀傳統文化與主流價值相關語料庫建設,開展以主流價值為導向的數據分類、匯聚與運行工作,並將中華優秀傳統文化語料的建構與人工智能大模型訓練等有機結合起來,為中國人工智能發展提供真正的中國智慧。

第二,國家數據局牽頭制定有關政策,鼓勵主流媒體、文化機構有序有效開放其所屬的文化數據資源。推動中華優秀傳統文化相關數據要素在認知安全的前提下轉化為生產要素,進一步支持數據所有者採用市場化方式運作,鼓勵通過招投標、聯合規劃、聯合應用、聯合驗收、合資公司等多種方式,與相關主體建立數據共享與使用機制,並從協調數據匯聚、約定形成數據產權與收益分配機制等層面提供指導幫助。

第三,教育部加快培養中華優秀傳統文化與人工智能相關的跨學科專項人才。增設相關專業、課程,構建高校與建設單位之間的人才聯合培養與選拔渠道。結合計算機、人工智能與人文社科等專業方向,在一批試點高校增設相關專業或課程,推動設立一級學科,以中央廣播電視總台開展的中華優秀傳統文化人工智能項目為試點,構建高校與建設單位之間的人才聯盟,聯合培養和選拔,推動人才培養與國家戰略需求有效接軌。

全國政協委員、中央廣播電視總台新聞中心副召集人張勤