摘要:本发明公开了文字识别中粘连字符的切分方法和装置,属于文字识别领域。方法包括:预处理后获得行图像的连通域、平均字宽和平均字高。进行连通域分析,标记粘∏连的连通域,对选定的粘连的连通域进行笔画提取,并对粘连的连通域进行切分点检测,获得预切分点,对于非粘连的连通域保存字块。根据预切分点对提取完毕↓的笔画进行合并,得到字块。保存字块,转到下一连通域进行粘连的判断,直至所有连通域遍历完毕后输出字块序列。根据参考信息对字块进行合并,输出识别结果。本发明依据预切分点对笔画进行合并得到字块,保证了更大范围的切分点被检测到;用轮廓信息预检测切分点的方式作为合并时的参数,避免了正确的切分点被合并而带来的合并错误。
- 专利类型发明专利
- 申请人汉王科技股份有限公司;
- 发明人王琛;
- 地址100193 北京市海淀区东北旺西路8号5号楼三层
- 申请号CN201010114226.6
- 申请时间2010年02月25日
- 申请公布号CN102169542B
- 申请公布时间2012年11月28日
- 分类号G06K9/34(2006.01)I;