一种交互系统的语音识别方法和装置制造方法及图纸

日期：2025-05-25 浏览：　

　　当前位置:首页专利查询北京奇虎科技有限公司专利正文

　　本发明专利技术公开了一种交互系统的语音识别方法和装置。所述方法包括：依据互动状态及所述互动状态对应的一个或多个预期答案，预先在语音识别样本库中选择预期样本以组成预期语音识别样本库；采集所述互动状态下的用户的语音信号；将所述语音信号与所述预期语音识别样本库中的预期样本进行匹配。本发明专利技术的技术方案，能够提高交互系统的语音识别速度和准确度。

　　随着多媒体技术的发展，各种交互式系统都采用了语音交互的方式，以提高与用户的互动效率和提高趣味性。例如问答系统，先通过语音或图像显示的方式向用户抛出问题，然后用户语音回答。再例如一些展示系统，需要用户发出语音指令来选择展示哪些目录中的内容。在这些场景下都需要对用户的语音进行准确识别，才能在问答系统下判断用户给出的语音答案是否正确，以及在展示系统下判断用户到底选择了哪些目录，以便展示相应目录中的内容。因此在交互系统中对用户的语音进行准确和快速的识别是亟需解决的问题。

　　鉴于上述问题，提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种交互系统的语音识别方法和装置。依据本专利技术的一个方面，提供了一种交互系统的语音识别方法，其中，该方法包括:依据互动状态及所述互动状态对应的一个或多个预期答案，预先在语音识别样本库中选择预期样本以组成预期语音识别样本库；采集所述互动状态下的用户的语音信号；将所述语音信号与所述预期语音识别样本库中的预期样本进行匹配。可选地，一个所述预期答案对应至少一个预期样本。可选地，该方法进一步包括:如果所述语音信号与所述预期语音识别样本库中的一个预期样本的匹配度达到预设值，则确定所述用户给出了所述预期样本对应的该预期答案。可选地，所述预期样本包含所述语音识别样本库中与所述一个或多个预期答案相对应的每一个样本，以及所述方法进一步包括:如果所述语音信号与所述预期语音识别样本库中的任何一个预期样本的匹配度都达不到预设值，则确定所述用户未给出任何预期答案。可选地，该方法进一步包括:如果所述语音信号与所述预期语音识别样本库中的任一个预期样本的匹配度都达不到所述预设值，则将所述语音信号与所述语音识别样本库中除所述预期样本以外的与所述预期答案对应的样本进行匹配。可选地，一个所述预期答案对应所述语音识别样本库中除所述预期样本以外的至少一个样本。可选地，如果所述语音信号与所述语音识别样本库中除所述预期样本以外的一个与所述预期答案对应的样本的匹配度达到预设值，则确定所述用户给出了所述样本对应的该预期答案。可选地，如果所述语音信号与所述语音识别样本库中除所述预期样本以外的任何一个与所述预期答案对应的样本的匹配度都达不到预设值，则确定所述用户未给出任何预期答案。可选地，该方法进一步包括:对于所述互动状态，根据所采集的该互动状态下的历史语音信号，相应扩充所述预期语音识别样本库中的预期样本，或者，相应扩充所述语音识别样本库中的样本。可选地，所述语音识别样本库位于云端服务器，以及所述方法在组成所述预期语音识别样本库之后进一步包括:将所述预期语音识别样本库下载到本地以进行语音识别。可选地，在采集所述互动状态下的用户的语音信号之前，该方法进一步包括:通过结合语音、图像和视频中任一种或多种的形式，展现互动状态。依据本专利技术的另一个方面，提供了一种交互系统的语音识别装置，其中，该装置包括:预期样本库生成单元，适于依据互动状态及所述互动状态对应的一个或多个预期答案，预先在语音识别样本库中选择预期样本以组成预期语音识别样本库；存储单元，适于保存预期语音识别样本库；采集单元，适于采集所述互动状态下的用户的语音信号；匹配处理单元，适于将所述语音信号与所述预期语音识别样本库中的预期样本进行匹配。可选地，一个所述预期答案对应至少一个预期样本。可选地，所述匹配处理单元，进一步适于当所述语音信号与所述预期语音识别样本库中的一个预期样本的匹配度达到预设值时，确定所述用户给出了所述预期样本对应的该预期答案。可选地，所述预期样本库生成单元选择的所述预期样本包含所述语音识别样本库中与所述一个或多个预期答案相对应的每一个样本；所述匹配处理单元，进一步适于当所述语音信号与所述预期语音识别样本库中的任何一个预期样本的匹配度都达不到预设值时，确定所述用户未给出任何预期答案。可选地，所述匹配处理单元，适于当所述语音信号与所述预期语音识别样本库中的任一个预期样本的匹配度都达不到所述预设值时，将所述语音信号与所述语音识别样本库中除所述预期样本以外的与所述预期答案对应的样本进行匹配。可选地，一个所述预期答案对应所述语音识别样本库中除所述预期样本以外的至少一个样本。可选地，所述匹配处理单元，适于当所述语音信号与所述语音识别样本库中除所述预期样本以外的一个与所述预期答案对应的样本的匹配度达到预设值时，确定所述用户给出了所述样本对应的该预期答案。可选地，所述匹配处理单元，适于当所述语音信号与所述语音识别样本库中除所述预期样本以外的任何一个与所述预期答案对应的样本的匹配度都达不到预设值时，确定所述用户未给出任何预期答案。可选地，该装置进一步包括:扩充单元，适于对于所述互动状态，根据所采集的该互动状态下的历史语音信号，相应扩充所述预期语音识别样本库中的预期样本，或者，相应扩充所述语音识别样本库中的样本。可选地，所述语音识别样本库位于云端服务器，该装置进一步包括:下载单元，适于将所述预期语音识别样本库下载到本地以进行语音识别。可选地，该装置进一步包括:展现单元，适于通过结合语音、图像和视频中任一种或多种的形式，展现互动状??τ O根据本专利技术的这种依据互动状态及所述互动状态对应的一个或多个预期答案，预先在语音识别样本库中选择预期样本以组成预期语音识别样本库，采集所述互动状态下的用户的语音信号，将所述语音信号与所述预期语音识别样本库中的预期样本进行匹配的技术方案，由于将预期答案对应的预期样本预先保存到预期语音识别样本库，将用户的语音信号直接与预期语音识别样本库中的预期样本进行匹配，因此使得匹配的范围缩小到一个可预期的小范围，不仅提高了交互系统的语音识别的速度，而且提高了语音识别的准确性。【附图说明】通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本专利技术的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中:图1示出了根据本专利技术一个实施例的一种交互系统的语音识别方法的流程图；图2示出了根据本专利技术一个实施例的一种交互系统的语音识别装置的结构图；以及图3示出了根据本专利技术又一个实施例的一种交互系统的语音识别装置的结构图。【具体实施方式】下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。图1示出了根据本专利技术一个实施例的一种交互系统的语音识别方法的流程图。如图1所示，该方法包括:星空体育登录入口星空体育在线官网步骤S110，依据互动状态及所述互动状态对应的一个或多个预期答案，预先在语音识别样本库中选择预期样本以组成预期语音识别样本库。在专利技术的本实施例中，一个互动状态是指某个特定的互动场景，例如问答系统中的某个特定的问答题场景，或者展示系统中的展示某个特定内容的场景。以问答系统中的某个特定问答题场景为例，系统提问:“芹菜叶是否可以食用？ ”。对应的预期答案为“是”。根据该预期答案，用户回答“是

　　一种交互系统的语音识别方法，其中，该方法包括：依据互动状态及所述互动状态对应的一个或多个预期答案，预先在语音识别样本库中选择预期样本以组成预期语音识别样本库；采集所述互动状态下的用户的语音信号；将所述语音信号与所述预期语音识别样本库中的预期样本进行匹配。

星空体育·(StarSky Sports)官方网站-星空官方认证

一种交互系统的语音识别方法和装置制造方法及图纸