电信技术论文_基于自监督知识迁移的鲁棒性语音

2021/09/29

文章摘要:针对标注神经网络训练数据的成本日益高昂与噪声干扰阻碍语音识别系统性能提升的问题,提出一种基于自监督知识迁移的鲁棒性语音识别模型训练算法。首先,预处理阶段提取原始语音样本的三个人工特征;然后,训练阶段将特征提取网络生成的高级特征分别通过三个浅层网络来拟合预处理阶段提取的人工特征;同时,与语音识别后端进行交叉训练,而后合并损失函数。最后,通过梯度反向传播令特征提取网络学会提取更有助于去噪语音识别的高级特征,实现人工知识迁移与去噪,从而高效利用了训练数据。在军事装备控制的应用场景下,基于加噪后的THCH30,AISHELL-1与ST-CMDS三个开源中文语音识别数据集以及内部装备控制指令数据集进行测试,其词错率可以降低到0.12。实验结果表明,所提方法不仅可以实现鲁棒性语音识别模型的训练,同时通过自监督知识迁移提高了训练样本的利用率,可完成装备控制任务。

文章关键词:

项目基金: