搜索框升级为“智能框”,不仅能支持超过千字的文本输入,还兼容拍照、语音、视频等多种输入形式,并且可直接调用AI写作、AI作图等工具。
上海证券报记者注意到,百度搜索最直观的改变在于,传统意义上的搜索框不但变大了,而且成为“智能框”。过去仅能容纳几十个字符输入的搜索框,如今可容纳超千字的文本,还支持文件上传操作,并且直接整合了AI写作、AI绘图等一系列功能。
除此之外,图片、视频、音频等多模态的输入功能也得到强化。以AI相机为例,它不仅能辅助用户识别图像、解答题目、翻译内容,还能提供更加贴合个人需求的服务。例如,随意拍摄一张风景照片,它可以为用户进行景点讲解。
搜索结果页面同样在改变,从过去提供相关链接到如今直接满足用户的需求。比如,当记者询问“北京有哪些好玩的景点”时,与以往给出一系列链接不同的是,现在不仅能将相关景点信息分类整理,还可以在搜索页面上直接完成购买操作。
“AI助手”同样完成了能力上的提升。包括新增了视频通话功能,强化了语音、图片以及文件等多模态输入方面的能力。此外,拓展了多媒体输出能力,支持图片、视频、笔记等各类内容混合排版,并且能依据用户的使用习惯与偏好,对输出结果进行智能调整。
此前的Create2025百度AI开发者大会上,百度创始人李彦宏正式发布了百度搜索开放平台,提供了AI时代的生态解决方案。据统计,目前百度搜索开放平台已收录1.8万+优质星空体育 星空体育平台MCP。
有业内人士表示,百度搜索正在从工具属性向平台属性演进,这次改版更像在为下一代的搜索引擎形态探路。对外经济贸易大学国际经济贸易学院教授屈启兴对上证报记者表示,百度此次搜索改版,本质上是从“工具”向“智能伙伴”迈进的一次质变。
当日,百度商业研发团队发布自研视频生成模型“MuseSteamer”及创作平台“绘想”。百度商业表示,MuseSteamer是全球首个实现中文音视频一体化生成的视频模型。该技术可实现画面与音效、人声台词的协同创作,打破传统AIGC视频“先画面后配音”的割裂流程。
MuseSteamer具备多项技术突破:支持一张图生成10秒1080p电影级画质视频,人物微表情与运镜效果达专业影视水准。其核心能力源于亿级中文多模态数据清洗、精细化视频结构化描述语言,以及多目标强化学习等技术优化。
记者梳理发现,近期AI视频生成赛道热闹起来。今年4月,快手可灵发布2.0视频生成模型;6月,字节跳动发布了即梦3.0 Pro视频模型;谷歌也对外宣布Veo3正式上线投入使用。
百度为什么选择这个时间节点推出相关的模型?百度副总裁、移动生态商业体系负责人陈一凡对上证报记者坦言:“今年行业持续发展,像短剧广告投流多,对创意质量要求更高,仅靠剪辑传统片段或生图不够。代理商和广告主提出,能否用短剧内容剪辑,延伸场景,生成科幻场景。我们有两个选择,一是接外部模型,二是自己做。考虑到方便客户反馈优化,我们决定自己做。”
陈一凡发现在做模型时,遇到很多行业反馈平台问题。“比如一个多月前,客户想用动漫展现创意,我们补数据、调模型。现在大家能看到的动漫类创意,都是需求驱动,因为模型通用性变强,发展快且成本大幅降低,所以有了今天的发布。”
据悉,MuseSteamer模型家族包含Turbo、Lite、Pro及全系列有声版,覆盖从普通创作者到专业影视机构的需求。其中,Turbo版已上线绘想平台开启限时免费公测,其余版本将于8月陆续开放。