语音转写接口通过集成开发可将音频文件(5小时以内)转换成文本数据,适用于语音质检、会议访谈等场景,可提供公有云接口及私有化部署方案
1、默认支持中文、英文、中英混合识别;购买套餐三可领取3个方言/语种,购买套餐四、五可领取5个方言/语种,购买套餐六可领取8个方言/语种; 购买套餐后,可在控制台领取所需方言/语种;购买多个套餐的情况下,赠送的方言/语种数量不叠加;
默认支持中文、英文、中英混合识别;中文包含普通话、天津话、河北话、东北话、甘肃话、山东话、太原线、
西南官话包含云南话、贵州话、重庆话、四川线、 非实时语音转写结合统一建模的星火多语种语音识别大模型,推出英语、日语、韩语、俄语、法语、西班牙语、阿拉伯语、德语、葡萄牙语、越南语、泰语、意大利语、印地语转写语种识别。极大提升了语音转写准确度,真实还原语音内容,标点等同步预测,带来更流畅的体验。后续将持续扩增转写语种的支持。快来点击
电话销售&客服将坐席大量录音文件转成文字,帮助电话质检和信息同步,也为数据挖掘提供原料基础
会议&访谈记录将会议和访谈的音频转换成文字存稿,让后期的信息检索和整理更方便快捷
字幕生成将视频中的音频进行语音识别并标记时间戳,生成对应字幕,提升配置字幕效率语音质检
可以从转写出的文字结果中搜索匹配相关词类,对黄暴/涉政内容进行高效鉴别
分词形式&完整句子形式,词&句置信息度词&句时间戳,词属性,多候选词,文法格式智能转换,多发音人分离
1、文法格式智能转换包括电话号码、车牌、日期、时间以及量词的规整,如“五点三十”引擎会识别规整为“5:30”。
2、词属性包括:普通词;语气犹豫词,如“嗯”、“啊”、“呃”或者无意义的重复词等;标点符号,如“,”等。
4、语音转写引擎是适用于5小时以内的长音频识别,若您有大量1分钟以内的短音频需要识别,为了提高识别效率,建议使用
)转写:将预先录制完毕的完整音频文件传输至云端,转写服务处理完成后将输出此音频对应的完整文字结果。该流程为异步
)转写:在采集音频的同时,连续上传音频流至云端,转写服务将实时返回文字结果,实现文字和声音的同步展现。
答:默认支持中文、英文、中英混合识别;中文包括普通话、天津话、河北话、东北话、甘肃话、山东话、太原话;其他方言
星空体育登录入口 星空体育在线官网5、语音转写支不支持并发?答:支持,要保证同一个appid每秒请求接口次数最大值在20