品玩4月20日讯,据阿里通义实验室官方消息,通义实验室正式发布语音识别大模型Fun-ASR 1.5,标志着语音技术在多方言与多文化理解领域取得重大突破。该模型基于统一架构,单模型即可无缝覆盖30种语言及汉语七大方言体系,典型方言场景字错误率相对下降56.2%,其中5种方言准确率突破90%。
Fun-ASR 1.5在技术上实现四大核心升级。一是深度适配20余种地区口音,涵盖中原、西南、粤语等复杂方言场景;二是支持30种主流语言自由混说识别,无需预设语种;三是专项优化古诗词识别,字符级准确率达97%;四是强化文本归一化能力,智能处理标点、数字及日期格式,输出规范文本。
目前,该模型已通过阿里云百炼平台上线API服务,广泛应用于县域教育、地方政务及跨国协作等场景。Fun-ASR 1.5的推出,推动语音识别从“听得清”迈向“听得懂”的工业级新阶段。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储星空体育网站 星空体育首页服务。
美伊停火到期前48小时“极限博弈”:伊朗手握海峡“核按钮”,特朗普威胁炸桥炸电厂
日本一观光直升机坠入火山口,2名中国台湾游客与1名日本机长失踪已3月,日媒称生还可能性极低,拟动用无人机重机具进入火口作业
小米18 Pro Max:骁龙8 Elite Gen6 Pro+6.9寸直屏,外围全面增强
REDMI 显示器 G Pro 27U 2026轻体验:电竞利器 桌面上的“小钢炮”
轻薄本秒变性能怪兽!技嘉AORUS RTX 5060 Ti AI BOX显卡坞推荐
华为MateBook 14发布:支持小艺Claw Beta,6599元起