(排版定稿)网络首发时间:2019-06-19 14:07:34

基于MFCC的频谱重构实现音高估计和发声分类

音高估计和发声分类可以帮助快速检索目标语音,是语音检索中十分重要且困难的研究方向之一,对语音识别领域具有重要的意义。提出了一种新型音高估计和发声分类方法。利用梅尔频率倒谱系数(MFCC)进行频谱重构,并在对数下对重构的频谱进行压缩和过滤。通过高斯混合模型(GMM)对音高频率和滤波频率的联合密度建模来实现音高估计,实验结果在TIMIT数据库上的相对误差为6. 62%。基于高斯混合模型的模型也可以完成发声分类任务,经试验测试表明发声分类的准确率超过99%,为音高估计和发声分类提供了一种新的模型。

语音识别; 音高估计; 梅尔频率倒谱系数; 高斯混合模型;

10.19708/j.ckjs.2019.06.218

TN912.34

中国知网独家网络首发,未经许可,禁止转载、摘编。

1165163K
在线咨询 用户反馈