树图思维导图提供语音识别的流程在线思维导图免费制作,点击“编辑”按钮,可对语音识别的流程进行在线思维导图编辑,本思维导图属于思维导图模板主题,文件编号是:db9a91c8dbf737f2f5044f63d5c11567
话筒将声波转换为电压信号,然后通过A/D装置(如声卡)进行采样,从而将连续的电压信号转换为计算机能够处理的数字信号
目前多媒体计算机已经非常普及,声卡、音箱、话筒等已是个人计算机的基本设备
其中声卡是计算机对语音信进行加工的重要部件,它具有对信号滤波、放大、A/D和D/A转换等功能
而且,现代操作系统都附带录音软件,通过它可以驱动声卡采集语音信号并保存为语音文件。
语音信号号在采集后首先要进行滤波、A/D变换,预加重(Preemphasis)和端点检测等预处理,然后才能进入识别、合成、增强等实际应用。
一是抑制输入信号中频率超出//2的所有分量(/:为采样频率),以防止混叠干扰
A/D变换是将语音模拟信号转换为数字信号。A/D变换中要对信号进行量化,量化后的信号值与原信号值之间的差值为量化误差,又称为量化噪声。
预加重处理的目的是提升高频部分,使信号的频谱变得平坦,保持在低频到高频的整个频带中,能用同样的信噪比求频谱,便于频谱分析。
根据香农采样定理,为了使语音信号的采样数据中包含所需单词的信息,计算机的采样频率应是需要记录的语音信号中包含的最高语音频率的两倍以上。
一般将信号分割成若干块,信号的每个块称为帧,为了保证可能落在帧边缘的重要信息不会丢失,应该使帧有重叠。例如,当使用20kH*的采样麵率时,标准的一帧为10ms,包含200个采样值。
虽然这些声音的波形包含了所需单词的信息,但用肉眼观察这些波形却得不到多少信息因此,需要从采样数据中抽取星空体育 星空体育平台那些能够帮助辨别单词的特征信息。在语音识别中,常用线性预测编码技术抽取语音特征。
在标量量化中整个动态范围被分成若干个小区间,每个小区间有一个代表值,对于一个输入的标量信号,量化时落入小区间的值就用这个代表值[戈替。因为这时的信号量是一维的标量,所以称为标量量化。
树图思维导图提供CAD/CAM流程在线思维导图免费制作,点击“编辑”按钮,可对CAD/CAM流程进行在线思维导图编辑,本思维导图属于思维导图模板主题,文件编号是:c5b6a5ba5b9390b55b685aba9b3270e6
树图思维导图提供量感知识脉络图在线思维导图免费制作,点击“编辑”按钮,可对量感知识脉络图进行在线思维导图编辑,本思维导图属于思维导图模板主题,文件编号是:2d8be5248af093f09e6a4312b51bb5ea