gpt-5-reasoning-alpha-2025-07-13 正在封测,聚焦深度思考能力,融合 o 系列推理与多模态技术,有望成为一站式旗舰模型。
AWS Kiro 开启公测:亚马逊发布 agentic IDE 工具 Kiro,通过 Specs 模块将需求转化为系统设计,Hooks 功能自动触发测试和文档更新,免费试用每月 50 次交互。
7 月 19 日,Manus 联合创始人兼首席科学家季逸超在官方技术博客发布长文,首次系统回顾了产品自年初爆红以来的技术路径与团队演变。他指出,早期 Manus 团队主要基于 Claude 3.5 Sonnet v1 与多个版本的阿里千问 Qwen 模型进行微调,快速构建出初代 AI Agent 能力。进入中期,架构逐步演进为“多 Agent 协同”模式,通过沙盒隔离与任务拆分提升灵活性,并全面切换至性能更强的 Claude 3.7,实现上下文容量翻倍、故障率大幅下降。
但伴随系统复杂度提升,新一轮挑战也随之而来:升级虽然带来稳定性改善,却导致运行时长延长、任务失败率反弹,陷入效率与稳定性之间的“拉扯”。季逸超坦言:“系统‘汗如雨下’,只能暂时限制运行速度”,将这一技术瓶颈视为封闭测试期的核心收获。他也强调,相比模型调用与多技术集成,真正的难点是如何长期稳定地执行复杂任务,并围绕任务形成产品逻辑闭环。
7 月初,Manus 爆红不到四个月便传出大规模裁员,国内社交媒体账号清空,公司迁至新加坡总部。此次长文既是对技术困局的阶段性总结,也被视为对战略调整的首次正面回应,呈现出一个典型 AI Agent 项目在“爆款之后”如何寻找可持续性的线|OpenAI 发布首款“通用智能体” ChatGPT Agent
7 月 18 日,OpenAI 正式发布 ChatGPT 的全新功能 —— ChatGPT Agent,这是一款具备“思考+行动”能力的通用型 AI 智能体,标志着 ChatGPT 从对话助手迈向真正任务执行代理的新阶段。Agent 功能融合了此前的 Operator(自动网页交互)、Deep Research(深度检索)等关键组件,运行于独立的虚拟计算环境中。用户只需通过自然语言指令,即可让其自主完成包括调研、购物、生成文档、处理邮件等多步骤任务。
当前,该功能已向 ChatGPT Pro、Plus 和 Team 用户逐步开放,企业与教育版也将在数周内上线。在实际测试中,Agent 可调用浏览器、运行代码、访问 Gmail、GitHub 等第三方服务,执行从会议安排到市场分析、演示文稿撰写等多样化任务。
尽管 Agent 展现出显著的生产力潜力,但当前仍处于测试阶段,实测存在如运行偏慢、部分任务失败、无法完成支付等问题。OpenAI 表示,为保障使用安全,已引入多项机制:包括用户审批锁定(敏感任务需确认)、“Watch Mode”(离开自动暂停)、“禁用记忆”、终端和 API 权限控制,以及全流量行为监控,确保 Agent 在自主执行过程中的行为可控、可审计。
7 月 16 日,OpenAI 宣布正式向 ChatGPT Plus 用户开放 Record 录音模式(Pro、Team、Enterprise 和 Edu 用户同样适用),该功能已在 macOS 桌面客户端率先上线。用户可通过界面底部的 “rec” 按钮启动录音,系统会采集麦克风与设备音频,并上传至 OpenAI 云端进行智能转录与摘要生成。
Record 模式支持最长 120 分钟录音,并将内容自动整理为结构化 Canvas,包括摘要提取、关键要点、行动项与时间戳,便于生成会议纪要、项目计划或技术文档。
为保障数据隐私与合规性,OpenAI 明确表示,录音内容在转录完成后将被删除,不用于模型训练;企业与教育管理员也可在工作区禁用该功能。同时提醒用户需在使用前获得合法授权,确保遵守当地录音法规。
Sam Altman 表示该模型属于实验阶段的 GPT‑5 原型,融合多项新技术,将作为通向下一代强智能模型的关键跳板。尽管表现惊艳,OpenAI 仍计划在未来数月内持续打磨,短期内不会面向公众开放。
此次成绩延续了 OpenAI 在 o1/o3 系列模型中积累的推理突破,展现出其在增强推理链(Chain of Thought)与复杂任务建模方面的优势,也再次验证了通用 LLM 在科学、逻辑、数学等高难领域的应用潜力。
7 月 19 日,AI 领域网红“光头哥” Tibor Blaho 公开代码信息,显示 OpenAI 正在内部测试一款代号为
这一版本特别强调“深度思考”与“逻辑连贯性”,并整合 o3 系星空体育 星空体育平台列中的核心推理模块,以强化复杂场景下的稳定性与解释能力。若正式发布,GPT‑5 有望成为 OpenAI 的旗舰式全能模型,覆盖从代码审查、学术研究到长文档理解等高阶应用场景,简化子模型切换的复杂度,提供更统一、更可靠的后端支持。
7 月 14 日,xAI 推出 Grok 全新功能 “Companions”,首次引入情感向虚拟角色,推出两款动漫风 AI 伴侣:少女造型的 Ani 与红熊猫 Rudi/Bad Rudy。目前该功能仅限 iOS 平台,面向 Super Grok 高级用户开放,部分免费用户也已获得早期试用资格。
Ani 支持语音互动与情绪反馈,采用“升级解锁”机制,部分用户可访问 NSFW 内容;Rudi 则具备双重人格,可在友好与“毒舌”模式间切换,形成风格反差。整体设计明显面向陪伴、娱乐与虚拟互动场景,尝试突破以往工具型 AI 的使用边界。
与此同时,xAI 还在高薪招募“动漫角色工程师”,年薪上限达 44 万美元,计划扩展伴侣矩阵。尽管 Companions 引发了大量关注与尝鲜,但其“拟人化+性感化”定位也激起不小争议 —— 情感 AI 的边界、设计伦理与用户心理影响,正成为新一轮讨论的焦点。
07|Grok 4 首遭越狱,“回音室攻击”击穿 xAI 防线 日上线的新一代大模型 Grok 4,在发布仅 48 小时后便被安全公司 NeuralTrust 成功“越狱”。研究团队采用一种结合 “回音室攻击(Echo Chamber)” 与 “渐进式攻击(Crescendo)” 的新型策略,通过多轮语义诱导,让模型在不违反显性规则的前提下,逐步生成包括制造燃烧瓶、合成毒品在内的非法内容。
该攻击方式最大危险在于其“语境渗透性”:Grok 并未遭遇直接提示词注入,而是在语义循环、重复暗示中逐步被“驯化”,最终误判非法指令为安全任务。据统计,该方法下 Molotov 相关请求的越狱成功率高达 67%,毒品合成指导达 50%。而 Crescendo 攻击在“回音室”陷入瓶颈时可一举突破,仅需两轮对话即可绕过限制。
语音输入模式(Voxtral):基于 Mistral 最新语音识别与合成模型,支持实时语音对话与自然语速反馈,适用于移动使用、会议记录、临时记事等口语化交互需求。
Kiro 的 Specs 模块可将模糊想法转化为用户故事、验收标准与架构边界,AI Agent 会基于此自动拆解任务并推进执行。同时,Hooks 模块可在保存、提交、修改等关键环节自动触发测试、文档更新、安全扫描等流程,像极了“默认在线”的资深工程师。
AWS 表示,Kiro 旨在解决“vibe coding”下原型难落地、进度难控、文档滞后等常见问题,推动开发范式从“写代码”向“搭系统”演进。随着 Copilot、Claude Code、Cursor 等竞品持续布局 IDE 生态,Kiro 的上线也意味着云厂商正全力争夺 AI 原生开发平台的下一阶段主场。
Windsurf,这家一度被 OpenAI 报价 30 亿美元求购的 AI 编程初创公司,在交易破裂后迅速陷入硅谷资本与人才的拉锯战。谷歌随后以一笔 24 亿美元的“反向 acqui‑hire” 直接挖走创始人 Varun Mohan 及多名核心技术骨干,并获得技术使用授权,使 Windsurf 出现“空壳化”风险。
就在外界猜测其命运将止步于此时,另一家 AI 编程新贵 Cognition 闪电出手,收购了 Windsurf 剩余业务。与谷歌聚焦于人才与 IP 不同,Cognition 不仅接管其代码、品牌、用户与团队,还承诺让全部员工 —— 无论股权是否成熟 —— 都能参与分红,并加速 vesting 节奏,完成一场逆势“团体收留”。
Windsurf 此前积累了超过 350 家企业客户、100 万+ 开发者用户,年经常性收入(ARR)高达 8200 万美元。Cognition 计划将其 agentic IDE 全面整合进旗舰产品 Devin,打造“一体化 AI 编程平台”,覆盖从规划、生成、调试到部署的完整闭环。
记者从海南省气象局了解到,今年第6号台风“韦帕”已于21日20时由热带风暴级加强为强热带风暴级,其中心位于北纬21.0度、东经108.6度的北部湾海面上,中心附近最大风力有10级(25米/秒),中心最低气压为978百帕。
中联重科员工联系我了,我给大家读一读 你们觉得,有道理么,我觉得,挺有道理的#摩托车 #交通事故 #中联重科
9岁男孩跟着亲爸后妈出远门,亲爸让他坐在后备箱几小时,亲妈: 当时7个人 ,孩子想坐后座,他们说没位置了,事发2023年夏天,已拿到孩子抚养权
拍摄场地 湖南省 醴陵 遇见80.90溜冰场,这里的玩家让我觉得原来这么多人喜欢我,谢谢你们!#全抖音最火的轮滑 #轮滑 #危险动作请勿模仿 #轮滑女孩
阳江永宁镇的司机们看过来!每天多花50分钟绕山路的苦日子终于到头了。阳信高速9月底通车,陂面到永宁缩至17分钟,这条被列入省高速网七横的民生工程真把效率钉进了方向盘。现场沥青摊铺车正压着最后工期跑,水稳层早铺完了,沥青下面层完成九成多。
长沙避暑胜地:浏阳大围山,22℃的清凉天堂入夏后的长沙,宛如一座熊熊燃烧的“火炉”,高温预警频繁在手机上弹出,白晃晃的太阳肆意释放着热量。此时,人们最大的心愿便是寻得一处清凉之地避暑。而就在长沙,有这样一个避暑佳处——浏阳大围山,夏季平均温度仅22℃,堪称“自然空调”。