(資料圖片)
北京日報客戶端 | 記者 趙語涵
10月11日,由“北京大學—字節(jié)跳動數字人文開放實驗室”研發(fā)的古籍數字化平臺“識典古籍”測試版正式上線。目前,該平臺涵蓋390部經典古籍,主要來自《四部叢刊》,共計3000多萬字,即日起向公眾免費開放。未來三年,“識典古籍”將陸續(xù)完成一萬種古籍的智能化整理工作,基本覆蓋儒家、道家和佛學的核心典籍目錄,屆時將全部免費開放。
識典古籍平臺負責人做介紹
據了解,上述實驗室系今年3月北京大學與字節(jié)跳動合作成立,將人工智能技術應用于古籍資源的智能化整理?!白R典古籍”平臺上線,即是雙方合作的最新進展。
當前,中國的古籍數字化還處于初級階段,面臨技術難度高、資金缺口大、人才緊張等難點。相關資料顯示,現存的20多萬種古籍中,只有8萬種完成影像數字化掃描,近4萬種完成文本數字化。據專家統(tǒng)計,從1949年到2019年,國內共修復整理出版古籍近3.8萬種,要將現存古籍全部修復整理出來,可能需要300年時間;若利用人工智能技術輔助修復整理,大概二三十年就能完成。
識典古籍網頁
與其他古籍數字化平臺相比,“識典古籍”具有自身的特點,頁面簡潔,瀏覽流暢,提供影印底本作為參照,還具備主題詞檢索和繁簡體轉換功能,便于專業(yè)研究人員、廣大古籍愛好者使用。同時,“識典古籍”書目將持續(xù)更新,后續(xù)將上線手機移動版。
未來,“識典古籍”將向全社會開放古籍閱讀檢索研究能力,還將實現全自動整理校對,更高效地實現存量古籍全部數字化。同時,平臺也鼓勵擁有文獻的學者自行上傳文獻,用戶甚至可參與再創(chuàng)作和再闡釋,助力古籍文化傳承和研究。
一年多來,字節(jié)跳動在古籍修復和活化上也有所進展。此前,字節(jié)跳動資助國家圖書館定向修復的珍貴古籍104冊件,現已完成50多冊件。在活化方面,抖音平臺推出“尋找古籍守護人”計劃,旨在激勵創(chuàng)作者通過音樂、說書、繪畫、復原美食等形式,普及古籍知識、演繹古籍內容,讓古籍鮮活起來。
- 一如年少模樣
- 衢州風華學校教師宋晴斬獲省級比賽一等獎
- 阿根廷隊將與阿聯酋隊進行一場友誼賽后前往卡塔爾
- 卡塔爾世界杯各隊大名單全出爐 我們總結了5個“最”
- 世界消息!北京唯一“五線換乘”樞紐!麗澤城市航站樓交通樞紐獲批
- 全球新動態(tài):美國今年流感季已致1300人死亡 專家呼吁民眾積極接種流感疫苗
- 天天快播:世界首個唾液孕檢試劑盒即將上市
- 天天滾動:今年以來我國新開工重大水利工程45項 創(chuàng)歷史新高
- 熱點聚焦:北京朝陽:繼續(xù)增加核酸檢測點位和通道,優(yōu)化點位布局
- 美國登月火箭終于發(fā)射升空 執(zhí)行“阿耳忒彌斯1號”任務
- 看熱訊:10月民航客運數據發(fā)布 ?主要運營指標同比下滑
- 世界熱資訊!綠色菜單引領餐廳低碳消費新風尚
- 燕麥奶不等于燕麥加牛奶
- 四川省總工會職工心理健康服務活動走進遂寧
- 今日關注:北京新增感染者中,147例為隔離觀察人員,涉及13區(qū)
- 全球播報:貴州大方:非遺傳人高光友獲“貴州工匠”稱號
- 世界通訊!用包裹著火焰的詩句,撫平時光的皺紋|“娜夜詩選”首發(fā)
- 2000千克是多少噸?1噸等于多少磅?
- 含“相接”的成語有哪些?人山人海出自哪里?
- 描寫潮水的四字成語有哪些?悶雷滾動近義詞都在這兒!
- 中國最嚇人的一本古籍是什么?為什么現在中醫(yī)不學本草綱目?
- (V面日報11.15)彩虹醬哇、鈴宮鈴、阿薩獲漲粉、營收、人氣榜榜首
- 干燥劑怎么重復利用?與壓片型干燥劑類似的干燥劑有哪些?
- 世界微資訊!疫情午報|31省區(qū)市昨日新增1.9萬余例,詳情匯總
- 環(huán)球今日訊!國內旅游市場再迎利好 出行信心恢復仍需時間
- 焦點精選!2022“閱讀北京·十佳優(yōu)讀空間”評選結果出爐
- 全球新資訊:衢江區(qū)“一庫一策”動態(tài)清零病險水庫
- 世界熱文:安化縣退休交警給村民送頭盔
- 每日熱文:?衢州“烏引”建設高速互聯“智能引水網”
- 速讀:黃山風景區(qū)探索"信用游" 能否成旅游業(yè)趨勢?