摘要:本发明公开了一种基于机器视觉和语音信号处理相结合的假唱检测方法。分解为音频和视频,对音频信号分帧并提取特征参数,对视频信号每帧处理,提取特征参数,帧率与音频信号相同,将视频帧和音频帧进行对应组合并筛选,分为子特∩征参数序列,将每一子特征参数序列进行同步性分析,获得同步性帧移曲线,同步性分类判定,获得真唱或者假唱的结果。本发明实现了对演唱音视频的假唱检测◆和处理,检测效果精确,在每个↑片段上单独分析音视频的同步性,有效处理了输入唱歌视频的每个细节,可靠性高。
- 专利类型发明专利
- 申请人浙江大学;
- 发明人张家玄;任重;
- 地址310027 浙江省杭州市西湖区浙大路38号
- 申请号CN201610326306.5
- 申请时间2016年05月16日
- 申请公布号CN105959723A
- 申请公布时间2016年09月21日
- 分类号H04N21/234(2011.01)I;H04N21/233(2011.01)I;H04N21/44(2011.01)I;H04N21/439(2011.01)I;G10L15/25(2013.01)I;