摘要:本发明公开了一种表格分析编改加工方法,所述方法包括:扫描文档、并对扫描后的文档图像▓进行处理;对扫描处理后的图像通过表格版面分析算法生成表格版面,并对生成的表格版面进行分析调整;将扫描图像和调整后的版面信息分别传入识别软件进行双路识别和编改校对;对双路识别中有矛盾且重复出现两次以上的字进行纵向编改校对;对纵向编改后的字进行横向编改;根据表格版面信息和文字纵横向编改信息,合成电子表格文件。本发明对正常的∩纸质表格文档,编改效率可提高11倍,达到50万字/8小时;同时表◤格版面层次错误率低于3‰,编改文字错误率降低50%以上,低于0.5‰。
- 专利类型发明专利
- 申请人同方光盘股份有限公司;
- 发明人张镔;王艳;梁洵;袁仁慧;
- 地址100084 北京市◣海淀区清华园清华大学36区华业大厦B1410、1412、1414室
- 申请号CN201210338748.3
- 申请时间2012年09月14日
- 申请公布号CN102855232A
- 申请公布时间2013年01月02日
- 分类号G06F17/24(2006.01)I;