31日,教育部發(fā)布《關(guān)于加強(qiáng)數(shù)字中文建設(shè) 推進(jìn)語(yǔ)言文字信息化發(fā)展的意見(jiàn)》,明確我國(guó)已建成世界最大的規(guī)模語(yǔ)言資源庫(kù)和中國(guó)語(yǔ)言資源知識(shí)圖譜,集成120多種語(yǔ)言和方言資源。今年,全國(guó)語(yǔ)言文字使用情況調(diào)查將首次實(shí)施。
教育部語(yǔ)言文字信息管理司司長(zhǎng)劉培俊介紹,我國(guó)已發(fā)布100多項(xiàng)國(guó)家通用語(yǔ)言文字和民族語(yǔ)言文字信息化規(guī)范標(biāo)準(zhǔn),為自然語(yǔ)言處理技術(shù)在人工智能、數(shù)字產(chǎn)品和信息產(chǎn)業(yè)領(lǐng)域的應(yīng)用創(chuàng)新奠定規(guī)范基礎(chǔ);高水平開(kāi)展普通話水平測(cè)試,實(shí)現(xiàn)了測(cè)試方式從人工到智能的轉(zhuǎn)變。我國(guó)還建成了集成化、智能化、國(guó)際化的全球中文學(xué)習(xí)平臺(tái),用戶(hù)超1600萬(wàn)人,覆蓋190多個(gè)國(guó)家和地區(qū)。
今年,全國(guó)語(yǔ)言文字使用情況調(diào)查將首次實(shí)施,打造集數(shù)據(jù)采集、傳輸、存儲(chǔ)、加工一體的集成化調(diào)查平臺(tái),為深化教育綜合改革和綜合國(guó)力分析提供大數(shù)據(jù)支撐。我國(guó)還將創(chuàng)新應(yīng)用自然語(yǔ)言處理、多模態(tài)信息處理、知識(shí)圖譜等5項(xiàng)前沿技術(shù),夯實(shí)國(guó)家關(guān)鍵語(yǔ)料基礎(chǔ)設(shè)施建設(shè)。
為加快推進(jìn)語(yǔ)言文字信息化,《意見(jiàn)》提出,將數(shù)字中文建設(shè)作為服務(wù)數(shù)字中國(guó)建設(shè)的重要任務(wù)和全面推進(jìn)語(yǔ)言文字信息化發(fā)展的突出重點(diǎn),著力推進(jìn)中文數(shù)字化與數(shù)據(jù)中文化,完善新型中文服務(wù)體系構(gòu)建與語(yǔ)言文字治理體系。
到2027年,我國(guó)將基本形成“政府主導(dǎo)、部門(mén)協(xié)同、社會(huì)參與、共建共享”的語(yǔ)言文字信息化工作機(jī)制,國(guó)家語(yǔ)言文字大數(shù)據(jù)中心基本建成,初步建成國(guó)家關(guān)鍵語(yǔ)料庫(kù)和國(guó)家戰(zhàn)略語(yǔ)言資源信息庫(kù),前沿語(yǔ)言技術(shù)、優(yōu)質(zhì)語(yǔ)言資源、新型語(yǔ)言服務(wù)等基礎(chǔ)支撐能力顯著增強(qiáng)。到2035年,中文在全球數(shù)字空間、網(wǎng)絡(luò)空間以及生成式人工智能等關(guān)鍵應(yīng)用場(chǎng)景中的使用占比將顯著提高,語(yǔ)言文字信息化整體水平位居世界前列。