科技改變生活 · 科技引領(lǐng)未來
雖然甲骨文是迄今為止中國發(fā)現(xiàn)的年代最早的成熟文字系統(tǒng),更是漢字的源頭和中華優(yōu)秀傳統(tǒng)文化的根脈。但該文字很多時(shí)候都是以圖片的形式出現(xiàn),給文字檢索帶來了一定的困難,而如今的年輕人對甲骨文的一更是了解甚少。此次在世界人工智能大會(huì)上展示智能文字識(shí)別技術(shù)能對甲骨文進(jìn)行識(shí)別,將形象豐富的甲骨文復(fù)刻在龜甲上再進(jìn)行重新排列組合后,“單身狗”“白富美”“買它買它”等網(wǎng)絡(luò)熱詞被一一識(shí)別出來。
據(jù)介紹,合合信息的智能文字識(shí)別技術(shù)主要包含了智能圖像處理,基于深度學(xué)習(xí)的復(fù)雜場景文字識(shí)別,自然語言處理三個(gè)核心技術(shù)層。智能圖像處理技術(shù)主要對用戶拍攝的復(fù)雜文檔圖像進(jìn)行預(yù)處理,使得文檔圖像質(zhì)量得到大幅度提升。基于深度學(xué)習(xí)的復(fù)雜場景文字識(shí)別技術(shù),主要利用合合信息自研的手寫印刷混排識(shí)別,抗強(qiáng)干擾識(shí)別,扭曲文字識(shí)別,復(fù)雜印章和手寫識(shí)別等一系列先進(jìn)深度學(xué)習(xí)識(shí)別技術(shù)來解決各種不同復(fù)雜場景下的文字識(shí)別問題,而自然語言處理技術(shù),則是對識(shí)別出的結(jié)果進(jìn)行進(jìn)一步的語義理解。
合合信息相關(guān)技術(shù)負(fù)責(zé)人表示,“甲骨文識(shí)別的難點(diǎn)在于甲骨殘缺嚴(yán)重、素材難獲取、拓片清晰度低等難點(diǎn),這些都是需要通過技術(shù)來解決。例如樣本素材少,從技術(shù)層面上,我們需要解決少樣本訓(xùn)練的問題。目前我們主要是初步研究,更多的工作還在路上。”
丁龍東
版權(quán)所有 未經(jīng)許可不得轉(zhuǎn)載
增值電信業(yè)務(wù)經(jīng)營許可證備案號(hào):遼ICP備14006349號(hào)
網(wǎng)站介紹 商務(wù)合作 免責(zé)聲明 - html - txt - xml