星空体育·(StarSky Sports)官方网站-星空官方认证

小米深夜上线系列模型:旗舰Pro全模态基座Omni语音合成TTS-星空体育官方网站

新闻资讯
质量为本、客户为根、勇于拼搏、务实创新

小米深夜上线系列模型:旗舰Pro全模态基座Omni语音合成TTS

日期:2026-04-30 浏览: 

  Xiaomi MiMo-V2-Pro 专为现实世界中高强度的 Agent 工作场景而打造。其拥有超过 1T 的总参数量(42B 激活参数),采用创新的混合注意力架构,并支持 1M 超长上下文长度。小米还在更为广泛的 Agent 场景中持续 Scaling 算力,进一步拓展了智能的动作空间,实现了从 Coding 到 Claw 的重要泛化。在 Artificial Analysis 排行榜上,MiMo-V2-Pro 位列全球第八,国内第二。

  在 OpenClaw、Claude Code 等智能体框架中,MiMo-V2-Pro 能够在无人工干预的条件下完成复杂工作流编排、长程规划与精准工具调用,并持续可靠地交付最终结果。整体使用体感已超越 Claude Sonnet 4.6,逼近 Opus 4.6,但模型 API 定价仅为其 1/5,降低了前沿智能的使用门槛。

  MiMo-V2-Pro 能够参与更严肃的代码工程构建。内部工程师评测显示,其体感已接近 Claude Opus 4.6,并展现出高阶的代码智能:拥有更出色的系统设计与任务规划能力、更优雅的代码风格,以及更高效直接的问题解决路径。

  MiMo-V2-Pro 模型现已正式开放 API 服务,支持 1M 上下文长度,并根据使用量分段计价:

  Xiaomi MiMo 底层推理引擎与金山办公生态实现框架级集成。WPS 灵犀现已接入 MiMo-V2-Pro 模型,向灵犀 Claw 提问或布置任务,办公更高效。

  其专为现实世界中复杂的多模态交互与执行场景而生,可无缝接入各种 Agent 框架,实现了从理解到操控的跨越,大幅降低了全模态 Agent 的落地门槛。

  音频理解方面,支持从环境声分类、多说话人分离、音频-视觉联合推理,到超过 10 小时连续长音频的深度理解。综合表现超越 Gemini 3 Pro,是当前最强的音频理解基座模型之一。

  图像理解方面,MiMo-V2-Omni 展现出强大的多学科视觉推理与复杂图表分析能力,超越 Claude Opus 4.6,逼近 Gemini 3 Pro 等顶尖闭源模型水平。

  视频理解方面,支持原生音视频联合输入,实现真正的多模态视频理解。通过创新的视频预训练,模型具备强大的情境感知与未来推理能力。

  MiMo-V2-Omni 能够跨模态理解复杂环境、自主制定并执行计划、在遇到异常时实时修正策略,最终端到端地交付完整结果。

  Xiaomi MiMo-V2-TTS 是小米自主研发的语音合成大模型。它基于自研 Audio Tokenizer 和多码本语音-文本联合建模架构,经过上亿小时语音数据的大规模预训练与多维度强化学习,实现了高度可控的多粒度语音风格控制。MiMo-V2-TTS 支持从整体风格定调到局部情绪表达的精准调节,能在同一句话内完成语气转折和情感递变;真实还原人类说话的自然韵律;在唱歌时,也能准确表达音高和节奏,自然且富有表现力。

  在训练过程中,MiMo-V2-TTS 首先通过超大规模语音-文本混合预训练,在海量数据中习得了强大的跨模态对齐与理解生成的统一能力;在此基础上,通过少量高质量监督数据的微调,模型获得了可泛化的多粒度与多风格指令控制能力。

  为进一步激发模型在大规模预训练中积累的高表现力语音生成潜力,小米引入了多维度强化学习,兼顾了稳定性与表现力。具体而言,MiMo-V2-TTS 在强化学习阶段,围绕更自然的韵律、更稳定的音质、更准确的字词表达、更高质量的音色克隆以及不同场景下恰当的语气和表达方式等多个维度持续优化。得益于多层码本建模架构,模型在高保真的离散 token 空间中对语音进行建模,充分保留了原始语音中的丰富信息,使强化学习阶段能够直接利用语音相关奖励信号对模型进行优化,从而让多维奖励信号更有效地作用于生成过程。

  MiMo-V2-TTS 支持从整体到局部的多层次语音风格控制。用户可通过自然语言指令设定整体语音基调,同时对句内局部片段进行细粒度的情绪调节,实现同一语句中语气转折与情感递变的自然过渡。

  该模型还具备丰富的多元表达能力:支持多种方言的自然发音,可进行角色扮演式的风格化演绎,更能实现高质量的歌声合成 —— 让同一个模型既能说、能演、也能唱,支持东北话、四川话、河南话、粤语、台湾腔等多种方言。

  特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号星空体育官方入口 星空体育官网”用户上传并发布,本平台仅提供信息存储服务。

  全球首创!字节跳动首个AI药物曝光,背后37人团队亮相,前信达总裁任顾问!

  俞敏洪回应东方甄选股权授予:从东方甄选成立到今天,没领一分钱工资;未来股权兑现后会用在设立董事长奖励基金、捐献一部分给北大等方面

  国轩高科一季报出炉!一面是净利润跌幅近八成,一面是产能扩张在持续,前景到底如何?

  2026HyperX 暗影精灵 PRO 16 锐龙版酷凉风暴PRO+调度

  2026首选!HyperX 暗影精灵 PRO 16 锐龙版240Hz电竞实测

  学生神器!2026HyperX暗影精灵PRO15小尺寸双AI+稳定网络

  A4 黄金屏+满血性能!OPPO Pad 5 Pro全面评测:告别爱奇艺 这款平板才是真生产力

  骑士逆转险胜3-2猛龙:哈登23+9季后赛破4000分 莫布利23+9

  游戏多开不卡!HyperX 暗影精灵 PRO 16 锐龙版多核多线程解析

  2026HyperX 暗影精灵 PRO 16 锐龙版酷凉风暴PRO+双烤实测

  消息称三星将推出安卓系统Galaxy Book,入门、中端、旗舰全覆盖

  “A Letter from Kunming春城有请”第二季正式启幕星空体育官方入口 星空体育官网 中国昆明向全球递出21℃盛夏请柬