教育部:到2027年初步建成國家關(guān)鍵語料庫
2025-04-09
瀏覽量:次
中新網(wǎng)北京3月31日電(記者 袁秀月)31日,記者從教育部新聞發(fā)布會上獲悉,教育部、國家語委、中央網(wǎng)信辦近日共同印發(fā)《關(guān)于加強數(shù)字中文建設(shè) 推進語言文字信息化發(fā)展的意見》(以下簡稱《意見》)?!兑庖姟诽岢觯?027年,基本建成國家語言文字大數(shù)據(jù)中心,初步建成國家關(guān)鍵語料庫和國家戰(zhàn)略語言資源信息庫。
新聞發(fā)布會現(xiàn)場。袁秀月 攝 到2027年初步建成國家關(guān)鍵語料庫
《意見》提出,到2027年,國家數(shù)字中文建設(shè)行動取得重要成效,語言文字數(shù)據(jù)要素價值有效釋放?;拘纬伞罢鲗?dǎo)、部門協(xié)同、社會參與、共建共享”的語言文字信息化工作機制;基本建成國家語言文字大數(shù)據(jù)中心,初步建成國家關(guān)鍵語料庫和國家戰(zhàn)略語言資源信息庫;語言文字信息化標準、前沿語言技術(shù)、優(yōu)質(zhì)語言資源、新型語言服務(wù)等基礎(chǔ)支撐能力顯著增強。
到2035年,中文在全球數(shù)字空間、網(wǎng)絡(luò)空間以及生成式人工智能等關(guān)鍵應(yīng)用場景中的使用占比顯著提高;語言文字信息化有力支撐國家語言能力建設(shè)、語言文字事業(yè)和經(jīng)濟社會高質(zhì)量發(fā)展,整體水平位居世界前列。
推進大語言模型等基礎(chǔ)術(shù)語規(guī)范化
在完善規(guī)范標準方面,《意見》提出,以語言文字信息處理標準建設(shè)為基礎(chǔ),支持面向信息技術(shù)及人工智能領(lǐng)域的語言資源建設(shè)、管理、應(yīng)用、共享標準研究,重點推進語料庫、數(shù)據(jù)標注、數(shù)據(jù)評價等規(guī)范標準的制修訂。推進大語言模型等基礎(chǔ)術(shù)語規(guī)范化。制定手語和盲文的信息化標準。研制民族語言文字信息化標準。研制甲骨文數(shù)字化共享技術(shù)標準。
在健全資源服務(wù)方面,《意見》提出,加快建設(shè)國家語言文字大數(shù)據(jù)中心,以數(shù)字化技術(shù)動態(tài)監(jiān)測、收集和分析語言文字事業(yè)發(fā)展、國家語言能力建設(shè)、重點規(guī)劃實施、重大工程進展等核心業(yè)務(wù)數(shù)據(jù),提高數(shù)據(jù)支持決策效率。以國家語言資源服務(wù)平臺建設(shè)為基礎(chǔ),帶動地方語言資源平臺建設(shè)。推動基礎(chǔ)性語言資源建設(shè),實施國家關(guān)鍵語料庫共建共享計劃,重點支持建設(shè)大規(guī)模中文語料庫及高質(zhì)量民族語言文字語料庫、手語盲文語料庫、行業(yè)領(lǐng)域語料庫、語言監(jiān)測動態(tài)語料庫等。
重點加強語言文字資源信息安全治理
在人才培養(yǎng)方面,《意見》提出,依托國家語言文字關(guān)鍵研究領(lǐng)域領(lǐng)航計劃,培養(yǎng)精通語言文字信息化建設(shè)的高層次緊缺急需人才。加強語言人才供需機制研究,支持高等學(xué)校語言學(xué)科與多學(xué)科深度交叉融合發(fā)展,加強“語言+人工智能”復(fù)合型人才培養(yǎng)。
在安全保障方面,《意見》提出,重點加強語言文字資源信息安全治理,切實加強數(shù)據(jù)安全、倫理道德、價值觀對齊等重點事項的監(jiān)測與管理,提升資源和技術(shù)的可信性、可控性和可靠性。支持生成式人工智能的語料規(guī)范性、生成內(nèi)容評測評價和全流程追溯機制研究。加強面向語言資源監(jiān)測的自然語言處理技術(shù)研究,強化語言文字信息安全的態(tài)勢感知、監(jiān)測預(yù)警、風(fēng)險評估和應(yīng)急處置。規(guī)范網(wǎng)絡(luò)空間、數(shù)字空間的語言生態(tài),建設(shè)健康文明的網(wǎng)絡(luò)語言環(huán)境,守住網(wǎng)絡(luò)安全底線。
打造中國版人工智能教育大模型
此外,《意見》提出,要實施數(shù)字中文服務(wù)教育發(fā)展行動、數(shù)字中文助力科技創(chuàng)新行動、數(shù)字中文賦能文化傳承行動、數(shù)字中文推動產(chǎn)業(yè)升級行動、數(shù)字中文促進社會進步行動。
其中提到,服務(wù)國家教育數(shù)字化戰(zhàn)略行動,加強語言文字信息化建設(shè)成果在國家智慧教育公共服務(wù)平臺和地方智慧教育平臺上推廣共享;助力打造中國版人工智能教育大模型;研究基于大語言模型的教學(xué)新范式,研制大語言模型能力素養(yǎng)框架(師生版)。
《意見》還指出,加快布局支持一批新型語言文字交叉領(lǐng)域科研機構(gòu),重點建設(shè)多語言智能化科技創(chuàng)新中心和實驗室。加強古籍數(shù)字化整理關(guān)鍵技術(shù)研究。推進甲骨文數(shù)字化共享。支持研發(fā)面向語言障礙人群、老年群體的科技設(shè)備,鼓勵智能終端設(shè)備的適老化研發(fā)及無障礙改造。(完)
- 新的社會階層人士浙江象山“尋美” 傳播海洋特色文化
- 貴州沿河:“數(shù)字白茶”飄香 繪就產(chǎn)業(yè)新圖景
- 給草原“放個假”!內(nèi)蒙古9.7億畝草原陸續(xù)“帶薪休假”
- 湖北長陽現(xiàn)野生珙桐群落
- 西藏日喀則森林消防大隊積極參與義務(wù)植樹 為駐地添綠
- 上海首個區(qū)級“數(shù)字孿生城市”亮相 徐匯區(qū)多舉措探索量子城市治理
- 云南商標品牌指導(dǎo)站達101個 實現(xiàn)16個州市全覆蓋
- “移動國安課”在高鐵車廂上開講
- 江西九江:“甜蜜產(chǎn)業(yè)”結(jié)碩果 助農(nóng)增收添活力
- 開車越慢越安全?“龜速行駛”會有哪些危害?一文科普
相關(guān)文章