bl双性厨房裸体围裙_一本大道一卡二卡三卡_2019年中文字字幕在线看不卡_中文字幕日产乱码天堂

首頁 | 資訊 | 財經(jīng) | 公益 | 彩店 | 奇聞 | 速遞 | 前瞻 | 提點 | 網(wǎng)站相關(guān) | 科技 | 熱點 | 生活 |
網(wǎng)絡(luò)不規(guī)范字詞研究 通過輸入法記憶功能固化錯誤選擇-今日熱文

發(fā)稿時間:2023-06-08 17:21:27 來源: 澎湃新聞


(資料圖片僅供參考)

【網(wǎng)絡(luò)不規(guī)范字詞研究】網(wǎng)絡(luò)不規(guī)范用字問題頻發(fā),不僅影響人們對漢字的理解和使用,也對公眾造成不良示范。一些常見錯誤可能會通過輸入法記憶功能固化錯誤選擇,成為網(wǎng)絡(luò)不規(guī)范字詞出現(xiàn)的重要原因。

6月8日,由澎湃新聞牽頭發(fā)起,上海人工智能研究院、上海市信息安全測評認(rèn)證中心、上海新華傳媒連鎖有限公司和上海蜜度信息技術(shù)有限公司聯(lián)合共建的“數(shù)字內(nèi)容生態(tài)實驗室”發(fā)布《網(wǎng)絡(luò)不規(guī)范用字用詞現(xiàn)象研究報告》。實驗室隨機(jī)抽取2022年12月到2023年3月期間互動論壇、數(shù)字報、客戶端、微博、網(wǎng)站、微信、短視頻平臺七類信源內(nèi)容,形成具有4946.3萬條、706.6億字內(nèi)容的樣本。經(jīng)過排查發(fā)現(xiàn),網(wǎng)絡(luò)語言環(huán)境中的不規(guī)范字詞主要包括誤用繁體字、異體字、異形詞、常見錯誤等。

報告顯示,按照錯誤類型統(tǒng)計,常見錯誤是出現(xiàn)頻率最高的類型,占比超過六成;繁體字也是較常出現(xiàn)的錯誤類型,占比達(dá)到20%;異體字、異形詞出現(xiàn)相對較少,因異形詞、異體字可將規(guī)范文件納入輸入法數(shù)據(jù)庫,通過選詞推薦等技術(shù)手段減少誤用。相較而言,形近字、形近詞錯選等常見錯誤以及公眾主觀通過錯用體現(xiàn)個性的情況更易發(fā)生,且可能通過輸入法記憶功能固化錯誤選擇,成為網(wǎng)絡(luò)不規(guī)范字詞出現(xiàn)的主要原因。

針對互聯(lián)網(wǎng)不規(guī)范字詞現(xiàn)象,報告從多角度分析不規(guī)范使用行為背后的原因,包括人機(jī)交互輸入方式的限制、創(chuàng)作者能力參差不齊、網(wǎng)絡(luò)個性化表達(dá)促成不規(guī)范用字用詞風(fēng)氣、專業(yè)內(nèi)容平臺示范作用有待進(jìn)一步發(fā)揮等。報告認(rèn)為,其中,互聯(lián)網(wǎng)時代的人機(jī)交互方式是導(dǎo)致互聯(lián)網(wǎng)漢字不規(guī)范使用的重要原因。相比手寫等傳統(tǒng)記錄方式中逐字思考記錄,使用計算機(jī)錄入可通過輸入法的聯(lián)想功能大大加快內(nèi)容輸入速度,但更容易出現(xiàn)形近、音近字選擇疏忽;輸入法選詞推薦同時呈現(xiàn)字音相同、字形相近、字義不同的易錯詞,增加了困惑和誤用的可能性。

對此,報告認(rèn)為,以輸入法技術(shù)優(yōu)化促進(jìn)漢字規(guī)范使用是減少網(wǎng)絡(luò)不規(guī)范字詞最直接的方式之一。受技術(shù)限制,過往輸入法僅通過正在輸入的拼音等信息進(jìn)行字詞推薦。結(jié)合人工智能語言模型等前沿技術(shù)優(yōu)化輸入法功能,實現(xiàn)結(jié)合上下文語境推薦選詞,提高選詞準(zhǔn)確性。在內(nèi)容發(fā)布平臺引入智能不規(guī)范字詞監(jiān)測工具,優(yōu)化文本內(nèi)容檢查功能,如微信公眾平臺的疑似錯別字自動檢測系統(tǒng),以及澎湃清穹內(nèi)容風(fēng)控智能平臺、鈾媒等專業(yè)的內(nèi)容審核、校對及管理工具,協(xié)助內(nèi)容發(fā)布者正確規(guī)范用字用詞,形成互聯(lián)網(wǎng)正確使用字詞的氛圍;推廣針對不同文體、主題的不規(guī)范字詞檢查工具,以技術(shù)手段促進(jìn)漢字文化傳承。

上海蜜度智能校對事業(yè)部總經(jīng)理張曉娟表示,目前,國內(nèi)已有智能校對系統(tǒng)能夠針對漢語特點,將字義、字形和字音三類信息以多模態(tài)方式編碼進(jìn)大規(guī)模深度神經(jīng)網(wǎng)絡(luò)中,捕捉句子的細(xì)粒度語義信息和長程語義依賴關(guān)系,實現(xiàn)錯別字、冗余、缺失、語法錯誤等文字差錯的自動識別,同時具備主動演進(jìn)策略,能夠持續(xù)學(xué)習(xí)新的語言現(xiàn)象以改進(jìn)校對效果,是人工智能技術(shù)在語言文字處理領(lǐng)域的典范,為語言文字規(guī)范性的監(jiān)督管理工作提供了有力支撐。

標(biāo)簽:

責(zé)任編輯:mb01

網(wǎng)站首頁 | 關(guān)于我們 | 免責(zé)聲明 | 聯(lián)系我們

生活晚報網(wǎng)版權(quán)所有

Copyright @ 1999-2017 gaoerwen.cn All Rights Reserved豫ICP備2022016495號-7

聯(lián)系郵箱:939 674 669@qq.com