• 用户名
  • 密码
  • 产品
供应
求购
公司
资讯
展会
评论访谈专题话题印搜动态
国内国际环保视频产品导购
活动展会设备印品世界
行业动态企业动态营销电子商务政策法规统计商机
印前印中印后包装器材耗材油墨
胶印数码标签CTP纸箱创意丝印柔印其他
展会专题企业专题资讯专题技术专题
文化人物社会
展会预告会议预告展会资讯国内展会国际展会推荐展会
印刷包装丝印
印刷包装丝印
印刷包装丝印
您当前位置: CPP114首页> 正文
胶印油墨
胶印材料
丝印材料

少数民族文字识别系统研制成功

2007-01-31 00:00:00.0 来源:科技日报 责编:中华印刷包装网

蒙古文、藏文、维吾尔文等六种少数民族文字的纸出版物要转换成电子出版物,今后不再靠人工录入,只要经“统一平台少数民族文字识别系统”处理,印刷文档的扫描图像就会自动生成可编辑检索的电子文档。这是记者今天在清华大学举行的“多体蒙古文(包括混排汉英)印刷文档识别暨统一平台少数民族文字识别系统”技术鉴定会上获悉的。

  据项目研制主持人,清华大学丁晓青教授介绍,该系统能识别多种印刷字体的蒙古文字符和文档,并能识别蒙汉英混排的文档,是集版面分析、文本行字切分、识别、纵向文档图文对照编改等技术于一体的蒙古文文档识别实用系统,解决了多字体蒙古文汉英混排文本切分和识别问题。在实际的多字体蒙汉英文档测试集上,文本识别率可达96.89%。

  据介绍,该系统是全球首款在统一平台上支持我国主要少数民族文字文档的识别系统。系统在汉字和英文文档识别的基础上将四种类型六种文字的少数民族文字,即蒙古文、藏文、维吾尔文、哈萨克文、朝鲜文和柯尔克孜文(混排汉英)。文档识别综合集成在一个统一的平台系统中,使我国最主要的少数民族文字文档能够自动识别输入计算机。该系统软件产品采用国际标准编码,系统结构具有良好的扩展性,还支持阿拉伯文的识别。

  由倪光南、何新贵、戴浩院士组成的鉴定委员会认为:该项目解决了实用的多字体印刷蒙古文文档及其混排汉英的识别问题,实现了在统一平台上蒙、藏、维、哈、柯、朝(混排汉英)文档识别的综合集成,其主要技术指标达到了国际领先水平,对促进我国少数民族语言文字的信息化建设具有重要意义。
分享到: 下一篇:韩国开发成功生物天然染料技术
  • 【我要印】印刷厂与需方印务对接,海量印刷订单供您任意选择。
  • 【cpp114】印刷机械、零配件供求信息对接,让客户方便找到您。
  • 【我的耗材】采购低于市场价5%-20%的印刷耗材,为您节省成本。
  • 【印东印西】全国领先的印刷品网上采购商城,让印刷不花钱。