能识别铅印版蒙古文的OCR印刷软件
2015年夏天博士毕业之后,乌日力嘎开始全身心地投入到传统蒙古文OCR软件的开发之中,她参考了国内外大量学术文献,并使用深度学习和语言模型等高新技术,在短时间内成功研发出了蒙古文高精度自动识别软件。据介绍,这一软件的优势是既能识别扫描图片,又能识别拍照的图片,并且将打字和校对的功能融为一体。
“读博士期间研究机器翻译,机器翻译需要大量的语言资源,但是蒙古文的资源特别少,我们在建立语言数据库时需要大量的人力、时间和经费,”乌日力嘎博士说:“从那个时候起,我就萌发一个念头,自己是否也试着研发一款高精度的蒙古文自动识别系统。”
“上世纪90年代以前的书本都是铅印版本,但目前还没有其他可以把铅印版转换成文本的软件,而乌日力嘎博士研究的软件优势是能识别铅印版,并且有承前启后的作用,”内蒙古大学教授那顺乌日图认为,乌日力嘎研究的软件理论上有创新,这一软件结合语言规则和统计方法,再利用深度学习和神经网络等新技术来完成的。因为以前的OCR软件是基于规则或者是基于统计的方法来实现的,他们终效果都不理想。
乌日力嘎后表示,希望她所开发的这款印刷软件能为广大的蒙古语言文字工作者带来更多的工作上的便利。
此文关键字:能识别铅印版蒙古文的OCR印刷软件
关于“”的相关资讯
我要评论: | |
---|---|
内 容: | |
验证码: | (内容最多500个汉字,1000个字符) 看不清?! |
请注意: |
|
1.尊重网上道德,遵守中华人民共和国的各项有关法律法规,不发表攻击性言论。 2.承担一切因您的行为而直接或间接导致的民事或刑事法律责任。 3.新闻留言板管理人员有权保留或删除其管辖留言中的任意内容。 |
共有-条评论【我要评论】