星空体育·(StarSky Sports)官方网站-星空官方认证

Gemini 3之后谷歌首席科学家Jeff Dean说清AI的3个关键信号-星空体育官方网站

新闻资讯
质量为本、客户为根、勇于拼搏、务实创新

Gemini 3之后谷歌首席科学家Jeff Dean说清AI的3个关键信号

日期:2025-11-26 浏览: 

  但和上一次相比,它到底变了什么? 是跑分又涨了几个点,还是 AI 真的不一样了?

  在演讲中,Jeff Dean 没有讲 benchmark 数字,也没有做产品宣传。他说的是:

  在 Jeff Dean 的视角里,Gemini 3 不只是一个更大的模型,而是让 AI 的用法彻底变了。

  演讲一开始,Jeff Dean 就直指一个问题:传统 AI 模型太浪费了。

  “在传统神经网络中,你为每个例子激活整个模型,这非常浪费。更好的方式是:拥有一个非常大的模型,但每次只激活其中 1% 到 5%。”

  假设你有一个巨大的模型,包含了图像、语言、数学、代码等各种能力。传统做法:无论你问什么问题,整个模型都要调用一遍。就像每次开灯,家里所有电器都要启动。Jeff Dean 的想法:根据任务类型,只运行需要的那部分。处理图片时,只用视觉模块;写代码时,只用编程模块。

  他用大脑做比喻:你坐在英语课上,大脑会使用处理语言的那部分;开车时,大脑就关闭它,将全部精力专注于控制身体和观察路况。AI 模型也应该这样工作。

  早在几年前,Jeff Dean 就开始推动团队往这个方向研究,并给它起了个名字:Pathways 架构。该架构的核心目标,是构建一个超大模型却能保持高效,让每次推理仅激活一小部分路径。

  效果有多好?Jeff Dean 在演讲中展示的数据很惊人:用同样的计算预算,MoE 架构可以训练出效果提升 8 倍的模型。

  结果是:性能更强,成本更低,还能同时处理多个任务。就像你的大脑:处理复杂问题时多个区域协同工作,做简单事情时只用一小部分。

  未来的顶级模型,不再是一个什么都做的全能选手,而是各有专长、协同工作的专业团队。

  如果说第一节讲的是模型内部如何变聪明,那第二节要讲的是:它开始能为你做事了。

  在演讲现场,Jeff Dean 演示了一个例子:一位用户有一堆家族食谱,有些是韩语手写的,有些是英语的,都是老照片,有折痕和油渍。

  然后,Gemini 3 做了什么? 第一步:扫描并识别所有照片中的文字; 第二步:翻译成双语版本; 第三步:自动生成网站布局; 第四步:为每个食谱配上 AI 生成的配图。

  这就是传统助手和智能 Agent 的区别。助手是你问什么它答什么,Agent 是你说目标、它自己拆解任务、调用工具、完成整个操作链。

  Jeff Dean 说:这个技术突破使模型能够真正探索潜在解决方案的空间,随着时间推移,它在探索这个空间时变得越来越好。

  效果有多惊人?Gemini 在 2025 年国际数学奥林匹克竞赛(IMO)上,解决了六道题中的五道,获得金牌。

  当时,业界最先进的模型在 GSM8K(一个中学数学基准测试)上的准确率只有 15%。测试的题目是什么难度呢?比如:Sean 有五个玩具,圣诞节他又得到了两个,现在有几个玩具?

  而现在,Gemini 能解决的是国际数学奥林匹克的题目,这是全球数学天才竞赛中最难的问题。

  这个飞跃说明,AI 不只是在回答问题上变强了,而是具备了真正的问题解决能力。它能够自己探索、尝试、验证,直到找到正确答案。

  而 Gemini 星空体育 星空体育平台3 通过和 Google 生态的深度集成,可以串联日历、邮件、云端服务等真实系统,把这些能力真正用起来。

  就像前面的食谱网站案例:你不需要说“先识别文字,再翻译,再排版”,只需要说“做个网站”,Gemini 3 自己搞定所有步骤。

  如果说 Pathways 架构让模型变星空体育 星空体育平台聪明,Agent 系统让模型能行动,那第三个信号最容易被忽视,但可能最关键:让 AI 真正用得起。

  当时,Google 刚做出一个很好的语音识别模型,比现有系统的错误率低很多。Jeff Dean 做了一个测算:如果 1 亿人开始每天和手机说线 分钟,会发生什么?

  2015 年,第一代 TPU 投入使用。它专门为机器学习设计,做了一件事:把低精度线性代数运算做到极致。

  这让原本需要翻倍服务器才能推出的功能,现在只需要现有硬件的一小部分就能实现。

  到了最新第七代 Ironwood TPU,单个 pod 有 9,216 个芯片。如果和第一代机器学习超级计算 pod(TPUv2)比,性能提升了 3,600 倍,能效提升了 30 倍。

  Jeff Dean 特别指出,这些提升不只靠芯片工艺进步,更重要的是谷歌从设计之初就把能效作为核心目标。

  “你可以训练一个非常大的模型,然后用蒸馏让一个小得多的模型获得非常接近大模型的性能。”

  这就是为什么 Gemini 可以同时做到性能领先和手机可用。大模型在云端训练,小模型通过蒸馏学习,部署到手机上。参数只有十分之一,但保留了 80% 以上的能力。

  但技术突破只是第一步。Jeff Dean 认为,AI 要真正普及到全球,必须面对更现实的问题:能源够不够?电力稳不稳?网络通不通?设备能不能支持?

  这也是为什么 Google 要在东南亚等新兴市场推广 AI。这些地区可能没有强大的电网和服务器基础设施,但通过 TPU 和蒸馏这样的效率技术,人们依然可以在现有条件下用上 AI。

  从 2013 年服务器要翻倍的困境,到 2025 年拿下 IMO 金牌,Jeff Dean 一直在回答一个问题: