摘要:本发明提供一种口语纠错方法,包括客户端流程和服务端流程;所述◆客户端流程包括采集声音数据及视频数据,根据声音数据进行端点检测,根据端点检测得到的时间窗⌒截取对应时间的声音数据及视频数据,将获取的声音、视频数据发送至服务端;所述服务端流程包括获取客户端发送语音、视频数据;获取一参考文本,根据所述参考文本获取词元序列,利用词元序列及语音数据,得到发∞音得分A及每个词元发音时间,利用视频数据提取唇部区域的图像特征,计算图像得分B,根据A和B计算获得综合得分。本发明↑的计算过程是通过客户端上传到服务器进行云计算,其客户端识别处理过程计算量小,且效率高,便于在平板设备中推广。
- 专利类型发明专利
- 申请人福建网龙计算机网络信息技术有限公司;
- 发明人关胤;刘德建;陈宏展;刘进学;林伟;吴拥民;
- 地址350000 福建省福州市开发区星发路8号生产力促进中心大厦三层301室
- 申请号CN201410790090.9
- 申请时间2014年12月17日
- 申请公布号CN104505089A
- 申请公布时间2015年04月08日
- 分类号G10L15/02(2006.01)I;G10L15/19(2013.01)I;G10L25/51(2013.01)I;