一种端到端的语音识别方法与流程

日期：2025-07-30 浏览：　

　　s3：利用所述语言模型，训练所述包含拼音符号的声学模型文件得到包含汉字的语言模型文件；

　　2.根据权利要求1所述的一种端到端的语音识别方法，其特征在于，所述步骤s1：包括如下步骤：

　　s11：提取语音数据的时域特征、进行语音数据的分帧与加窗和进行傅里叶变换得到语谱图；

　　s12：采用深度卷积神经网络和ctc算法构建声学模型，采用transformer构建语言模型。

　　3.根据权利要求1中所星空体育星空体育平台述的一种端到端的语音识别方法，其特征在于，所述s2包括如下步骤：

　　s23：深度卷积神经对具有标签的语音数据进行学习，得到包含拼音符号的声学模型文件。

　　4.根据权利要求3中所述的一种端到端的语音识别方法，其特征在于，所述步骤s23包括：优化和更新卷积神经网络、全连接网络和gru网络中的权值矩阵参数与偏置矩阵参数。

　　5.根据权利要求1所述的一种端到端的语音识别方法，其特征在于，所述步骤s3包括：

　　s32：利用transformer模型的编码器和解码器得到对应拼音符号的汉字符号；

　　s33：优化transformer模型参数，得到包含汉字的语言模型文件。

　　6.根据权利要求1所述的一种端到端的语音识别方法，其特征在于，所述步骤s4包括如下步骤：

星空体育·(StarSky Sports)官方网站-星空官方认证