摘要:本发明涉及一种版式识别模板方法及系统,属于文字识别技术领域,包括如下步骤:对于扫描页面进行轮廓分析,查找出与页面连通域重合率达到设定阀值的版式模板;将所述版式模板中的标记块与扫描页面中的信息进行匹配,提取并识别已匹配标记块的页眉页角信息;切去已识别的所述标记块,提交给后续识别流程。本发明通过采用区域识别模板对版面固定格式区域版面进行识别,并将其从识别目标中剥离,提升了页面区域内识别的效率,采用本发明所述的方法,简化了一般扫描页面识别的内容,并且基于此模板能够方便的通过人工进行识别管理。
- 专利类型发明专利
- 申请人方正国际软件有限公司;方正国际软件(北京)有限公司;
- 发明人周长岭;赵海涛;
- 地址215123 江苏〒省苏州工业园区星湖街328号创意产业园方正国际大厦
- 申请号CN201010610885.9
- 申请时间2010年12月29日
- 申请公布号CN102081732B
- 申请公布时间2013年06月05日
- 分类号G06K9/00(2006.01)I;G06K9/20(2006.01)I;