码农财经视角:2026年4月初的这几天,人工智能领域上演了一场精彩的技术对决。微软与谷歌两大巨头几乎在同一时间发布了新一代AI模型,而国内AI应用则呈现爆发式增长态势。这些技术突破不仅预示着多模态AI时代的全面到来,更为A股市场相关公司带来了明确的发展机遇。
4月2日,微软一次性推出了三款自研多模态AI基础模型,标志着这家软件巨头正在降低对OpenAI的依赖,构建自主AI技术体系。这三款模型分别是:
:支持25种语言,在批量转录速度上达到Azure Fast的2.5倍,具备复杂环境噪音过滤能力,将应用于Teams等产品。
:1秒可生成60秒音频,支持英式、美式等多种语音风格,已集成至Copilot等工具。
:生成速度提升至少2倍,计划逐步接入Bing搜索和PowerPoint。
仅仅一天后,4月3日,谷歌DeepMind发布了新一代开源模型系列Gemma 4,涉及四款覆盖端侧到工作站全场景的模型。其中最引人注目的是31B稠密模型,拥有310亿参数全激活,256K上下文长度,目前在行业标准Arena AI文本榜单中位列全球开源模型第三。谷歌表示,Gemma 4专为高级推理与智能体工作流打造,实现了前所未有的“单位参数智能水平”。
这两大巨头的同日发布并非巧合。微软AI负责人穆斯塔法·苏莱曼星空体育官方入口 星空体育官网在4月3日宣布,公司正加速推进自研AI模型研发,目标在2027年实现文本、图像及音频处理能力达行业最先进水平。微软已开始部署英伟达GB200芯片集群,计划未来12至18个月内将算力提升至前沿规模。
就在国际巨头激烈角逐的同时,国内AI应用呈现爆发式增长。4月2日,火山引擎总裁谭待对外宣布,截至2026年3月,豆包大模型日均Token使用量已突破120万亿,在过去三个月内增长一倍,比2024年5月发布时增长1000倍。这一数字背后是AI应用生态的全面繁荣。
在火山引擎平台上,累计Token使用量超过一万亿的企业客户数量,已从去年底的100家增长至140家。这些企业客户覆盖了金融、制造、零售、教育等多个行业,标志着AI技术正从概念验证阶段迈向规模化商业应用。
与此同时,视频生成模型Seedance 2.0 API正式面向企业用户开放公测。根据业内人士测算,Seedance 2.0生成15秒视频的可用率或达到90%,相较此前行业内平均值20%大幅提升。以制作90分钟的视频项目为例,成本有望从1万多元降低到2000元左右。
微软的三款模型分别针对语音、图像不同模态,但都强调在企业生产力场景中的集成应用。这种多模态融合不再是实验室里的概念演示,而是直接面向Teams、Copilot、Bing等实际产品的技术升级。谷歌的Gemma 4同样强调在多模态理解上的突破,其31B模型在文本、代码、数学推理等多个基准测试中表现优异。
谷歌Gemma 4系列中的E2B模型仅有51亿总参数,官方称部分设备内存占用可压至1.5GB以下,专门为端侧设备优化。这与行业向AI手机、AI PC、智能汽车等端侧场景延伸的趋势完全吻合。端侧AI不仅能够降低云端计算压力,还能更好地保护用户隐私,实现实时响应。
这些技术突破为A股市场相关公司带来了明确的发展机遇。我们可以从以下几个维度进行关联分析:
微软MAI-Voice-1和MAI-Transcribe-1的发布,直接推动了语音AI技术的发展。A股市场中,彩讯股份近日宣布拟收购生成式AI语音智能体企业基智智能100%股权,成为今年以来A股市场在企业级Voice AI Agent领域的标志性收购交易之一。基智智能基于开源模型深度定制了垂直行业小模型,在降低延迟与提升拟真度方面取得了突破。
海天瑞声作为A股市场唯一一家以训练数据为主业的上市公司,其产品线余个主要语种及方言,为语音识别、语音合成等应用提供专业数据集。科大讯飞则在虚拟人领域积极布局,基于国际领先的语音合成、人脸建模等技术,提供定制化解决方案。
多模态AI需要同时处理文本、图像、视频等多种形式的数据。当虹科技已从“以视频为核心”的技术体系,迈向以“AI多模态+空间视频+行业”为核心的全新发展阶段。公司旗下BlackEye多模态视听大模型已通过国家网信办算法和大模型“双备案”。
昆仑万维在2025年8月举办了覆盖五大技术领域的SkyWork AI技术发布周,每天发布一款模型,包括视频生成模型、世界模型、生图一体化模型等,全面展示在多模态AI领域的突破性成果。合合信息则基于多模态大语言模型,向全球用户提供文本智能技术产品,其扫描全能王产品贡献了超过80%的收入。
AI模型的训练和推理离不开强大的算力支持。随着国产大模型商业化落地进程持续加速,算力产业链需求持续释放。4月1日,算力板块全线飙升,光模块等相关概念涨幅均超4%,其中中润光学、波长光电等光模块个股涨幅均超11%。
寒武纪、海光信息、芯原股份等千亿市值龙头股同步走强,芯原股份上涨10.23%,寒武纪涨幅达6.96%,海光信息上涨4.78%。这些公司在AI芯片、服务器等核心环节具备技术优势。
江波龙则专注于端侧AI存储,公司近期发布了自研SPU(存储处理单元)与iSA(存储智能体),结合HLC技术(高级缓存技术),为智能汽车、具身智能、可穿戴设备、AI手机及AI PC提供具有竞争力的产品方案。
AI技术最终要落实到具体行业应用中。天海防务通过自主研发,成功交付多艘特种及民用智能无人船艇项目。兴通股份依托DeepSeek大模型及API能力,自主打造面向化学品航运的“AI-兴仔”智能体平台,核心功能已在多个场景落地。
兆驰股份旗下风行在线与火山引擎正式签署深度合作协议,双方将围绕橙星梦工厂AI创作一站式平台,在技术研发、智能创作引擎及数字内容生态建设三大核心领域开展协同合作。橙星梦工厂将深度集成豆包大模型文本生成、图像生成、视频生成、语音合成等核心能力。
微软的MAI系列模型采用了混合专家架构(MoE),这种架构能够在保持模型规模的同时,降低推理时的计算成本。谷歌Gemma 4中的26B A4B MoE混合专家模型有252亿总参数,但仅38亿激活参数,推理速度接近4B模型。这种架构创新使得大模型能够在资源受限的环境中高效运行。
随着AI应用向垂直行业深入,对专业化训练数据的需求日益增长。海天瑞声的产品和服务已获得阿里巴巴、腾讯、百度、科大讯飞、海康威视、字节跳动、微软、亚马逊、三星等国内外客户的认可。公司产品线个主要语种及方言,积累了近1,800个自有知识产权的AI训练数据产品。
谷歌通过Gemma 4的开源策略,试图在开发者生态中星空体育官方入口 星空体育官网建立优势。开源模型降低了企业使用AI技术的门槛,加速了技术普及。与此同时,OpenClaw(小龙虾)GitHub星标突破25万,成为现象级开源项目。开源生态的繁荣为整个AI产业注入了创新活力。
微软近期租用了德克萨斯州阿比林市一处容量达700兆瓦的数据中心,并与英伟达就核能技术展开AI合作,以支撑算力需求。公司计划在2026年内将AI算力提升超80%,资本支出增速加快。这种算力军备竞赛反映了AI产业对基础设施的极度依赖。
2026年4月初的这几场技术发布,标志着AI技术革命进入了深水区。从单一的语言模型到多模态融合,从云端计算到端侧智能,从通用能力到行业专业化,AI技术正在以前所未有的速度演进。
对于A股投资者而言,这既意味着机遇,也意味着挑战。机遇在于,中国AI产业在应用落地方面已经走在了世界前列,豆包大模型日均120万亿Token的使用量就是明证。挑战在于,国际巨头在基础模型上的优势依然明显,国内企业需要在技术创新和生态建设上持续投入。
作为码农财经的观察者,我们认为,未来几年将是AI技术从“可用”到“好用”的关键时期。那些能够在多模态融合、端侧智能、行业应用等方向取得突破的企业,将在这场技术革命中占据有利位置。而对于普通投资者来说,理解技术趋势,把握产业脉络,才能在AI投资浪潮中做出明智决策。