OpenAI 最新宣布,ChatGPT 现已能够连接多个外部服务,进一步提升其在商业领域的应用效果。这一举措旨在为用户提供更丰富、实时的上下文信息,使其响应更加精准和有用。
目前,ChatGPT 支持的外部连接服务包括 Microsoft Outlook、Microsoft Teams、SharePoint、Dropbox、Box、Google Drive 和 Gmail 等。这些新功能不仅使得用户能够更方便地在不同平台之间协作,还能在获取信息时更加高效。此外,企业的 IT 管理员也可以利用流行的模型上下文协议(MCP)创建自定义连接器,整合企业内部的专有系统和 ChatGPT 的数据,从而更好地服务于公司需求。
OpenAI 在6月3日更新了其支持文档,宣布将记忆功能(Memory)免费向所有 ChatGPT 用户开放。这一功能原本只限于 ChatGPT Plus 和 Pro 的付费用户,现在逐步扩展至登录的免费用户,旨在更好地保存和引用用户的历史对话内容。
不过,OpenAI 也明确表示,免费用户体验的记忆功能属于轻量版,主要支持短期对话的连续性。相比之下,付费用户在订阅 ChatGPT Plus(每月20美元)或 ChatGPT Pro(每月200美元)后,将享有更强大的记忆能力,能够引用更久远的对话记录。这使得付费用户在使用中享受更高的便捷性和深度互动。
OpenAI 宣布对其 AI 智能体开发工具进行了一系列重要升级。此次更新不仅提升了平台的兼容性,还对语音界面进行了优化,同时增强了可观测性(observability),使得开发者在构建 AI 智能体时能更加得心应手。
OpenAI 为其 Agents SDK 新增了对 TypeScript 的支持。这一举措让 JavaScript 和 Node.js 环境下的开发者也能参与到智能体的开发中。新版本与之前的 Python 版本在功能上保持一致,包含了 Handoffs(任务转交机制)、Guardrails(运行时行为约束)和 Tracing(执行追踪)等核心组件。此外,模型上下文协议(MCP)确保智能体在执行过程中能够顺畅地传递上下文信息,开发者可以在前端浏览器和后端 Node.js 环境中无缝构建智能体。
OpenAI 推出了 RealtimeAgent 功能,以支持低延迟的语音应用。该功能集成了音频输入输出、状态交互及中断处理等功能,特别引入了人机回路(HITL)审批机制。开发者在执行智能体时可以选择暂停,让系统检查当前状态,并在手动确认后再继续执行。这种机制特别适合需要监管和合规检查的应用场景,确保智能体的行为可控。
OpenAI 还对 Traces 仪表盘进行了升级,支持对 Realtime API 的会话进行追踪。更新后的仪表盘能够覆盖音频输入输出、工具调用及用户中断等环节,并提供统一的审计记录,简化了调试和性能优化的过程。
OpenAI 还对语音对语音模型进行了改进,旨在降低延迟、提升对话的自然性和中断处理能力。更新后,系统能够实现更快的流式响应、更具表现力的音频生成及对重叠输入的稳健应对,这些改进为动态多模态对话智能体的构建奠定了基础。
OpenAI 近期以30亿美元收购了氛围编码初创公司 Windsurf,但随之而来的却是用户对 Claude 模型访问权限受限的不满。这一情况不仅让 Windsurf 的用户感到困惑,也对公司的未来增长潜力造成了威胁。
自从收购完成后,Windsurf 的用户开始发现,Anthropic 的 Claude3.7Sonnet 和 Claude3.5Sonnet 模型的访问权限大幅减少。由于这两个模型的可用性下降,开发者们面临着无法使用其所需工具的窘境。尽管 Windsurf 试图通过第三方服务来解决这一问题,然而,由于成本的增加和操作的复杂性,用户体验并没有得到改善。
更令人失望的是,Windsurf 未能获得对 Claude4系列的直接访问权限。这样一来,用户的体验再度受到影响,平台的竞争力也随之降低。这一切都可能导致 Windsurf 在激烈的市场竞争中处于劣势,阻碍其未来的成长。
来自AI 初创公司 Anthropic 的 Claude 聊天机器人即将迎来一项重要升级,新的 “检索” 模式将使其在 “项目” 功能中处理内容的能力提高十倍。这一改进意味着,用户在使用 Claude 时,即使超过了常规的内容限制,聊天机器人也能自动切换到新的检索模式,扩展其记忆存储。这项升级将很快在所有付费的 Claude 计划中推行。
新的检索模式开启后,Claude 将能够从更大的信息库中提取和管理数据,这使得其在应对复杂任务时更为得心应手。不论是处理文档、搜索信息,还是进行深入的对话,Claude 都将展现出更强的能力和灵活性。此举不仅提升了聊天机器人的实用性,也标志着 Anthropic 在 AI 领域持续创新的决心。
这项升级将在未来几天内向所有付费用户推出,届时用户将能够体验到Claude 在处理内容方面的显著改善。
Anthropic开发的AI编码助手Claude Code自发布以来,以其强大的代码库理解能力和终端集成特性受到开发者热捧。近期网络动态显示,Anthropic可能计划将Claude Code扩展至Claude Pro用户,打破此前仅限Max订阅或API用户的限制。这一举措有望大幅降低使用门槛,让更多开发者体验到AI驱动的编码效率提升。
科技公司Anthropic 悄然推出了名为 “Claude Explains” 的博客项目,旨在展示其人工智能(AI)模型 Claude 在内容创作中的能力。该博客的内容主要由 Claude AI 生成,并经过人类专家团队的编辑和增强,涵盖了多种技术主题。
该博客的首批文章包括与Claude 应用相关的技术主题,如 “Simplify complex codebases with Claude”(用 Claude 简化复杂代码库),这类内容旨在帮助读者理解如何更有效地利用 Claude 进行技术开发。Anthropic 的发言人表示,这种人机协作模式是 AI 辅助创作的早期示范,目的是提升内容的价值,而非取代人类专家。
AI 初创公司 Manus 近日宣布推出其全新的 “文生视频” 功能,旨在为用户提供通过简单文本指令生成视频的便捷体验。该功能目前已经面向 Basic、Plus 和 Pro 会员用户开放抢先体验。Manus 在社交媒体平台 X 上表示,用户只需输入文本命令,其智能系统便能在几分钟内将这些指令转换成结构清晰、故事连贯的视频,展示了其在 AI 视频生成领域的强大能力。
近日,DeepSeek 发布了其最新的 R1推理 AI 模型更新版,该模型在多个数学和编程基准测试中展现出色性能。然而,DeepSeek 并未透露其模型的训练数据来源,令一些 AI 研究人员产生了疑问,并推测该模型可能部分基于 Google 的 Gemini AI 系列进行训练。
Exa与OpenRouter宣布达成合作,为超过400种大语言模型(LLMs)提供实时网络搜索功能。这一突破性进展将显著提升AI模型的实用性和信息获取能力,为开发者、研究人员以及普通用户带来全新的交互体验。
Exa与OpenRouter的合作标志着大语言模型从“静态知识库”向“动态信息枢纽”的转变。未来,随着更多模型和工具加入这一生态,AI的交互体验和实用价值将进一步提升。
11、微软必应推出全新视频创作工具Bing Video Creator,用户可轻松生成 AI 视频
微软必应(Microsoft Bing)于6月2日正式推出了一款全新的 “Bing 视频创作器”,这项功能基于 OpenAI 的 Sora 模型,标志着视频生成能力的首次免费开放,普通用户也可以轻松通过文本提示生成视频。
此次Bing 视频创作器的上线,让用户能够用简单的文字描述,创造出属于自己的短视频。值得注意的是,这一功能目前仅支持移动设备,尚未在桌面端推出。
微软还表示,生成的视频将在用户的账户中保存最多90天,以便随时访问。当 Bing Video Creator 在桌面版本上线后,用户可以实现图像和视频的创作需求,进一步丰富了创作体验。
在6月6日,谷歌再次对 Gemini2.5Pro 模型进行了更新,升级到了06-05版本。这次更新的重点是性能的显著提升,谷歌声称该模型在多项 AI 性能基准测试中取得了更高的分数,尤其是在 LMArena 和 WebDevArena 等测试中,Elo 评分分别上升了24分和35分,后者更是达到了1443分,成为业界的领军者。
谷歌还放宽了Pro 版用户的请求限制,这意味着用户在使用该模型时将享受到更大的灵活性和便利性。这一变化可能预示着在本月该版本正式上线后,谷歌会推出更加吸引人的定价策略,进一步推动用户使用。
谷歌更新了Gemini2.5版本,标志着 AI 音频对话和生成技术的重大进步。Gemini2.5是一个多模态的 AI 系统,能够原生理解和生成文本、图像、音频、视频和代码,提升了用户与 AI 的互动体验。
在Gemini2.5的开发过程中,谷歌对潜在风险进行了全面评估,并采取了相应的缓解策略。所有音频输出均嵌入了名为 SynthID 的水印技术,以确保 AI 生成音频的透明性和可识别性。
NVIDIA最新发布了Llama-3.1-Nemotron-Nano-VL-8B-V1,一款支持图像、视频和文本输入的视觉到文本模型,输出高质量文本并具备图像推理能力。这一模型的发布不仅展示了NVIDIA在多模态AI领域的雄心,也为开发者提供了高效的轻量化解决方案。
近日,科技巨头英伟达联合麻省理工学院(MIT)与香港大学,发布了名为 Fast-dLLM 的新框架。这一创新的框架旨在显著提高扩散模型(Diffusion-based LLMs)的推理速度,最高可达27.6倍,为人工智能的应用提供了更为强大的技术支持。
15、Midjourney视频重磅来袭!V8模型蓄势待发,AI创意新时代即将来临
Midjourney视频功能即将在本月上线模型的开发也在加速推进。新一批服务器将在未来一至两周内上线,视频功能的上线将紧随其后。为确保模型质量,Midjourney计划于未来一周举办视频评级派对,邀请用户参与评估以优化最终模型。
视频功能初期将仅对年度订阅用户开放,以评估服务器性能。这一功能将仅在Midjourney官网上线,暂不计划支持Discord平台。
阿里巴巴于6月6日正式开源了其全新的千问3向量模型系列 ——Qwen3-Embedding。该模型是基于千问3底座,为文本表征、检索和排序等任务进行优化,标志着阿里在 AI 领域的又一重大突破。
此次开源的千问3向量模型共有9款,涵盖不同尺寸(星空体育网站 星空体育首页0.6B、4B、8B 等)及 GGUF 版本,开发者可以根据需求选择合适的模型,并自由组合模块,甚至可以自定义向量或指令,以实现特定任务、语言和场景的深度优化。这一灵活性将极大提升开发者的工作效率。
人工智能正在重塑创意设计领域,一款全新的开源工具Jaaz引发了广泛关注。Jaaz是一款开源AI设计Agent,支持通过简单的API配置实现自动化批量图像生成,为专业创作者和团队提供了高效的解决方案。
Jaaz是一款专为图像生成设计的开源AI Agent,旨在简化创意生产流程。用户只需配置大型语言模型(LLM)API和图像生成API,即可通过Jaaz自动生成批量图像。这一工具的开源特性使其对开发者友好,允许社区对其进行持续优化和定制。
Jaaz目前仅支持部分官方API,图像生成模型的选择范围有限,未能覆盖市面上所有主流模型,如Flux.1或Midjourney。此外,Jaaz暂不支持视频生成API,也缺乏集成的素材管理功能,这可能限制其在更复杂场景中的应用。
AI 驱动的视频编辑工具 Diffusion Studio Pro 正式亮相。这款号称“CapCut + Cursor”结合的创新产品,以本地优先、浏览器为基础的非线种生成式 AI 模型,为专业视频创作者和开发者提供强大支持。
Diffusion Studio Pro 是一款完全基于 AI 的本地视频编辑工具,运行于浏览器,支持非线性编辑流程。其内置的 智能代理侧边栏 可自动读取和处理视频、图像及音频素材,实现从素材整理到粗剪的自动化工作流。工具集成了16种以上的生成式 AI 模型,覆盖视频生成、图像优化、音频增强等功能,显著提升创作效率。此外,软件提供 视觉构图反馈,通过 AI 分析画面布局,帮助用户优化构图和镜头语言,特别适合专业视频制作和短视频内容创作。
19、字节跳动发布图像编辑模型SeedEdit 3.0 细节保持能力进一步提升
6月6日,字节跳动Seed团队正式发布了图像编辑模型SeedEdit3.0。这一全新版本的图像编辑模型在图像主体保持、背景细节处理以及指令遵循等方面取得了显著进步,极大地提升了图像编辑的可用率和效率。
即梦网页端-图片生成-上传参考图-选择图片3.0模型-输入修改 Prompt(灰度测试中);
Firecrawl推出了一项突破性功能——全新/search API,通过一次API调用即可实现网页搜索与内容抓取,输出AI友好的数据格式。这一功能的发布标志着Firecrawl在AI驱动的网页数据处理领域迈出了重要一步。
/search API的推出为多种AI应用场景提供了强大支持。该功能特别适合以下场景:
Ø智能代理开发:通过搜索和抓取实时网页数据,为AI代理提供最新的知识输入。
Ø内容聚合与分析:快速收集新闻、博客或论坛内容,用于市场洞察或舆情分析。
ØRAG系统优化:为检索增强生成(RAG)系统提供高质量的外部数据源,提升生成内容的准确性。
AI 语音技术领域迎来重要进展,Fish Audio 宣布开源其全新文本转语音(TTS)模型 OpenAudio S1-Mini。作为广受好评的 S1模型的精简版,S1-Mini 以其轻量化设计、高表现力和多语言支持引发行业热议。
全球领先的AI 语音技术公司 ElevenLabs 正式发布了其最新文本转语音模型 Eleven v3(Alpha 版),被誉为迄今最具表现力的 AI 语音模型。这一突破性进展不仅提升了语音合成的自然度和情感表达能力,还为内容创作者和开发者提供了更强大的工具,助力视频、音频书和多媒体工具的开发。
AI视觉生成平台 Higgsfield 再推重磅功能——“Speak”,为数字人内容创作者带来前所未有的便捷体验。用户只需三步:选择预设动作、上传自定义角色并输入语音文本,即可生成具备口型同步与自然动作的数字人视频。目前,Speak功能对 Pro 和 Ultimate 订阅用户开放。
松下控股公司(Panasonic HD)联合美国松下研发公司(PRDCA)及加州大学洛杉矶分校(UCLA)的研究人员,成功开发出名为 “OmniFlow” 的多模态生成 AI。这项技术的亮点在于其具备 “任意对任意” 的生成能力,可以实现文本、图像和音频之间的自由转换,极大地提升了多模态生成 AI 的应用潜力。
在AI语音客服领域的一个关键技术障碍——延迟和不自然的对话体验,终于被打破。人工智能电话支持公司 Phonely、推理优化平台 Maitai 以及芯片制造商 Groq 三方联合,打造出一套可实时切换模型、响应快如人类的电话AI系统,推动语音AI进入“拟人新纪元”。
据披露,通过此次合作,Phonely 的响应速度提升超过70%,AI对线% 基准。这一成果来源于 Groq 的“零延迟 LoRA 热插拔”技术,通过 Maitai 的动态编排平台,可在多个微调模型间无缝切换,无需重新训练,也不会增加延迟。
此番突破证明,技术“恐怖谷”并非无法跨越。Phonely、Groq 与 Maitai 的合作不仅为语音AI提供新范式,也预示着传统客户支持产业即将面临剧烈转型。语音AI的时代,已经提前到来。
人工智能语音合成技术迎来重大突破! Bland AI正式发布了其全新Bland TTS引擎,号称首个跨越“恐怖谷”的语音AI技术。这一引擎利用大型语言模型(LLM)直接生成语音,仅需一个短音频即可实现任意人声克隆,并支持语调、节奏等风格的灵活“混搭”。本文将为您深入解析Bland TTS的创新功能及其对AI语音应用的深远影响。
Adobe持续推进其AI代理生态扩展,正式发布“产品支持代理”,旨在简化Adobe Experience Platform中的故障排除流程,并优化客户体验管理。同时,Adobe宣布其“数据洞察代理”现已在全球范围内上线。
Adobe同时宣布,构建于同一平台之上的“数据洞察代理”(Data Insights Agent)现已全球开放使用。该代理允许用户通过自然语言提出数据分析问题,如“上周哪些渠道促成了最多的对话?”系统随后将通过Adobe Customer Journey Analytics在Analysis Workspace中自动构建可视化数据结果,降低非技术用户的数据访问门槛。
备受海外市场追捧的AI视频生成平台PixVerse正式推出其国内版本 “拍我AI”,并同步上线移动端App和网页版。这一产品的发布标志着PixVerse正式进军中国市场,为国内内容创作者和企业提供了高效、便捷的AI视频生成工具。AIbase深入解析“拍我AI”的核心功能与市场潜力,带您一探这一席卷全球的AI视频平台的国内新篇章。
6月4日,AI 驱动的代码编辑器 Cursor 正式宣布推出1.0版本,这一重大更新标志着 Cursor 从测试阶段迈向成熟产品,为开发者带来了更智能、更高效的编程体验。作为一款基于 Visual Studio Code 分支并深度整合 AI 功能的开发环境,Cursor1.0引入了多项创新功能,旨在优化代码审查、调试和开发流程,显著提升生产力。
Cursor1.0的核心亮点之一是 BugBot,一款智能代码审查工具。BugBot 能够自动分析 GitHub 上的 Pull Request(PR),识别潜在的代码错误和问题,并在 PR 上留下详细的评论。开发者只需点击“Fix in Cursor”按钮,即可跳转至 Cursor 编辑器进行一键修复。这一功能大幅减少了手动审查的时间成本,提升了团队协作效率。
此外,BugBot 支持对复杂代码库的深入分析,结合上下文提供精准的修复建议,特别适合需要快速迭代的大型项目。AIbase 认为,BugBot 的推出将重新定义代码审查的自动化标准,为开发者节省宝贵时间。
开发者可通过Cursor 官方网站(下载1.0版本,现有用户将自动收到更新推送。AIbase 建议开发者加入 Cursor 的 Early Access Program,以抢先体验未来版本的实验性功能,并通过社区反馈进一步优化产品。
日本AI逆袭全球!Shisa V2 405B开源发布,碾压GPT-4的日语神器来了一家专注于日语微调的HuggingFace模型提供者——Shisa.AI,其最新发布的日英双语模型引发业界广泛关注。
Shisa.AI最新发布了基于Llama3.1的Shisa V2405B模型,这一开源模型被誉为“日本有史以来训练的最强大型语言模型”。该模型不仅在日语任务上表现出色,还保留了强大的英语处理能力,展现了日英双语模型的卓越性能。
测试数据显示,Shisa V2405B在多项日语基准测试中超越了GPT-4及GPT-4Turbo,甚至与最新的GPT-4o和DeepSeek-V3在日语任务上不相上下。这一突破标志着日本本土AI实验室在全球AI竞争中的崛起,为日语AI应用开辟了新的可能性。
Shisa.AI的成功表明,即便是小型AI实验室,也能在全球AI竞赛中占据一席之地。其开源模型和数据集的发布,为日语AI应用的普及提供了强有力的支持。
近日,Reddit 向旧金山高等法院提起诉讼,控告 AI 初创公司 Anthropic 在明知其禁止机器人访问的情况下,自2024年7月以来仍对 Reddit 平台进行了超过10万次的违规访问。这一举动引发了广泛关注,Reddit 指责 Anthropic 不仅未遵守平台规则,反而在公众面前假装维护道德与法律。
在诉状中,Reddit 形容 Anthropic 为 “姗姗来迟却自诩为 AI 行业白衣骑士” 的公司,暗示其实际上背离了这一形象。Reddit 的首席法务官本・李表示,Anthropic 对 Reddit 内容的商业化利用,可能给公司带来数十亿美元的潜在收益。他强调,在如今这个被 AI 技术不断改造的时代,Reddit 所传递的人类情感和真实对话显得尤为珍贵。
这起事件不仅反映了当前AI 技术与版权法律之间的紧张关系,也引发了对 AI 公司如何合法利用网络内容的深思。随着 AI 技术的飞速发展,如何在保护版权和促进创新之间找到平衡,将是未来亟待解决的重要课题。
Axel Springer 集团 CEO Mathias Döpfner 表示,集团正利用 AI 自动化非核心任务,以维护新闻质量并提升效率,目标是将 AI 融入可信新闻生产流程之中。
The Verge 聘请资深 AI 记者2025 年 6 月 2 日起,《The Verge》正式任命 Hayden Field 为资深 AI 记者,全面负责旗下 AI 技术及其社会影响的报道。这一举措体现了媒体对 AI 专题深度新闻内容的持续投入与加强。
Alphabet CEO驳斥“AI取代人类”论,称AGI之路仍存不确定性在人工智能带来巨大变革的背景下,Alphabet首席执行官桑达尔·皮查伊(Sundar Pichai)6月4日晚间在接受彭博社采访时,直面外界对AI引发大规模裁员的担忧,强调人工智能将在未来继续推动Alphabet增长,而非导致员工岗位大规模流失。
“我预计我们目前的工程阶段甚至会延续到明年,因为它能让我们做得更多,”皮查伊表示。他强调,AI正帮助工程师减少繁琐事务,将精力集中在高价值项目上,从而成为推动产品开发的“加速器”,而不是岗位的“替代者”。
在最近的 Snowflake Summit2025主题演讲中,OpenAI 首席执行官山姆・奥尔特曼(Sam Altman)指出,越来越多的企业开始将 AI 智能体视为基层员工。奥尔特曼表示,许多公司的员工如今的工作重心已经转向为 AI 智能体分配任务、评估其结果的质量、整合工作内容并提供反馈。这一工作模式与管理基层员工的方式非常相似。
根据风险投资公司SignalFire 近期发布的一份报告,AI 的普遍应用对基层岗位造成了显著冲击。该报告显示,从2023年到2024年,Meta、微软和 Google 等知名科技公司的初级职位招聘量下降了25%。SignalFire 的研究负责人 Asher Bantock 指出,招聘减少的主要原因在于 AI 已经接管了许多基层员工负责的常规任务。
与此同时,麦肯锡公司也在利用AI 来完成一些基础性的工作,例如制作 PowerPoint 和起草提案。麦肯锡预测,到2030年,AI 有可能取代多达3.75亿个工作岗位。这一趋势引起了广泛关注。
Anthropic 公司首席执行官达里奥・阿莫代伊(Dario Amodei)也对这一问题发出了警告。他表示,AI 可能在未来1到5年内淘汰一半的初级白领岗位,这将导致失业率飙升至20%。阿莫代伊坦言,尽管这个预测听起来有些令人难以置信,但现有的趋势已不容忽视。他呼吁社会要正视 AI 带来的职场变革,并提前做好应对准备。
蚂蚁国际正式推出人工智能即服务(AIaaS)平台——Alipay+ GenAI Cockpit,旨在为金融科技公司和超级应用构建AI代理和AI原生金融服务提供底层动力。
这一全新平台融合自动化工作流程与智能任务编排,覆盖支付编排、客户引导、合规检查、欺诈检测、争议解决、绩效优化等金融科技关键流程,标志着智能代理在金融行业的实用化与可扩展性迈出重要一步。
Cockpit 基于20多个大型语言模型打造,已在蚂蚁国际四大核心业务中完成内部试运行,包括:Alipay+ 的钱包网关服务,商户支付服务,WorldFirst 跨境商业账户,全球资金管理、数字借贷与信贷技术的嵌入式金融服务。
平台将在2025年6月起面向东南亚与南亚首批外部客户部署。完整功能囊括安全防护、银行转账与争议规则自动适配、代码修复、商户文档生成等基础任务,同时提供预设代理用于客户服务、精准营销、AI辅助编程等场景。对于更复杂的金融需求,企业可自定义智能代理来处理旅行咨询、退税、跨境汇款和会员激励等专业场景。
黑人单亲妈妈哀求:我要去上班养孩子!抗议者冷笑回应:非法移民正在被抓,他们也有孩子
看看高铁有无靠背,证明厕所确实有门,台湾网红“馆长”登陆开启六天直播之行
美媒爆料:马斯克发帖表达悔意前,曾给特朗普打电线分!CBA冠军广厦亚冠36分惨负卫冕冠军 止步八强
张朝阳回应错失百万Labubu:我后悔把胡润转交给我的那个Labubu又送回去了!王宁:泡泡玛特最后一个亲笔签名
四川逆转北京全运会4连胜:周琦23+14孙铭徽11+15 廖三宁22分