摘要:本发明公开了一种文档图像分类识别方法及装置,根据文档图像特征分类信息,分别预设特征文件,存入票据△种类特征库;对输入文档图像进行预处理;分别提取输入文档图像中的网格特征、框线特征、标题特征与文本特征,分别与票据种类特征库中特征文件进行比较,若相似︾度大于预设特征阈值,执行下个步骤,否则,淘汰所述特征文件,更新票据种类特征库。采用本发明技术方案,充分利用文档图像中的各种█有效特征,包括粗网格特征、框线颜色、框线拓扑结构、标题颜色、标题内容、文本颜色、文本内容等ㄨ多种特征,通过多层分类器逐步完成分类过程,确保文←档图像分类识别的准确性。
- 专利类型发明专利
- 申请人北京文通科技有限公司;
- 发明人马兴杰;张雪玲;张岩;
- 地址100190 北京市海淀区北四环西路9号→银谷大厦1609室
- 申请号CN201110101777.3
- 申请时间2011年04月22日
- 申请公布号CN102750541A
- 申请公布时间2012年10月24日
- 分类号G06K9/62(2006.01)I;G06F17/30(2006.01)I;