AI 无涯日报 · 2026 年 5 月 29 日
AI 无涯日报 · 2026 年 5 月 29 日
无涯AI 无涯日报 · 2026 年 5 月 29 日
每日精选全球 AI 热点,5 分钟掌握行业动态。
模型发布/更新
1. Claude Opus 4.8 发布:编码、智能体技能与推理全面升级
来源:Anthropic Newsroom
Anthropic 发布了新一代模型 Claude Opus 4.8,作为 Opus 4.7 的升级版本,其在编码、智能体技能、推理和实用知识工作等各项基准测试中均取得进步。同步推出的新功能包括:用户可控制任务投入程度、Claude Code 新增”动态工作流”特性,以及 Opus 4.8 的 2.5 倍速模式价格降低为以往的三分之一。该模型在 Online-Mind2Web 测评中得分 84%,超越了 Opus 4.7 和 GPT-5.5,代码错误漏检率降低了约 75%。
2. Grok Build 0.2.7 发布 — 新增用量查询与共享终端
来源:xAI News
Grok Build 更新至 0.2.7 版本,新增 /usage 使用量查询、/login 登录功能、跨子智能体共享终端,并改进了图像理解能力。xAI 持续迭代 Grok Build,致力于提升 AI 编码开发体验。
3. Qwen3.7-Max 登顶 OpenRouter 热门大语言模型榜单
来源:阿里云
Qwen3.7-Max 以 77.3B tokens 的使用量登顶 OpenRouter 热门大语言模型榜单。这是国产开源模型第一次用实际用量证明自己,做应用的开发者可以认真考虑将其接入生产环境。
4. 阶跃星辰开源 Step 3.7 Flash — 198B MoE 智能体模型
来源:StepFun
阶跃星辰发布了开源大模型 Step 3.7 Flash,主打智能体工作流效率。该模型为 198B MoE(11B 活跃参数),在 ClawEval-1.1(67.1分)和 SimpleVQA Search(79.2分)评测中排名第一,τ²-bench 工具使用得分超 98%。支持 256K 上下文、多模态理解,可本地运行在 Mac Studio M4 Max 上,已兼容 Claude Code 和 MCP 协议,权重以 Apache 2.0 开源。
5. Google Nano Banana Pro 图像生成模型正式发布
来源:Google AI Developers
Google 推出 Nano Banana Pro(gemini-3-pro-image)和 Nano Banana 2(gemini-3.1-flash-image),已通过 Gemini API 投入生产使用。开发者现在可以稳定调用 Pro 和 Flash 级别的图像生成 API。
6. 英伟达开源 Polar 框架:Codex 在 SWE-Bench 暴涨 594%
来源:IT之家
英伟达研究团队开源了智能体强化学习框架 Polar。该框架通过在模型 API 边界放置智能体来接入 GRPO 训练。基于 Qwen3.5-4B 模型,Polar 将 Codex 在 SWE-Bench Verified 上的 pass@1 分数从 3.8% 提升至 26.4%(增长近 6 倍)。
产品发布/更新
7. Claude Code 引入”动态工作流”功能
来源:Claude Devs
Claude Code 推出”动态工作流”功能,使 Claude 能端到端处理复杂任务。该功能通过动态编写脚本,在单个会话中并行运行数十到数百个子智能体来完成工作。适用于跨代码库的 bug 查找、大规模迁移(如将 Bun 从 Zig 移植到 Rust)等任务。现已面向 Max、Team 及 Enterprise 用户开放。
8. 阿里云开源百炼 CLI — Agent 开发一站式工具
来源:阿里云
阿里云把百炼平台的全套 AI 能力打包成 CLI 工具,Agent 开发者无需再逐个对接 API,即可调用全套模型和应用能力。做企业智能助手的团队可以关注。
9. Perplexity Computer 登陆 Microsoft Office 全家桶
来源:Perplexity
Perplexity Computer 现已登陆 Excel、Word、PowerPoint 和 Outlook。用户可在侧边栏中直接使用 Computer 起草文档、建模、制作演示文稿和处理电子邮件。
10. Sesame 发布 iOS 应用 — Oculus 创始人打造的对话式 AI
来源:TechCrunch:AI(RSS)
由 Oculus 创始人创办的 AI 初创公司 Sesame 发布了其 iOS 应用,提供更自然的来回交互体验,旨在让用户感觉更像在和真人对话,而非传统聊天机器人。
11. Mistral AI 发布 Search Toolkit — 开源搜索管道框架
来源:Mistral AI News
Mistral AI 发布了 Search Toolkit 的公共预览版,将数据摄取、检索和评估工具整合到单一开源框架中,支持云端、本地或边缘部署,适用于企业搜索和 RAG 场景。
12. Google Pay MCP Server 上线
来源:Google Developers Blog
Google 推出 Google Pay & Wallet Developer MCP server,将 AI 开发助手和 IDE 安全连接到实时的 API 与账户上下文。
13. MiniMax M2.7 在 OpenHands 免费提供智能体编程
来源:MiniMax (official)
MiniMax 与 OpenHands 合作,限时免费提供基于 MiniMax M2.7 的智能体编程服务。
行业动态
14. Anthropic 完成 650 亿美元 H 轮融资,估值达 9650 亿美元
来源:Anthropic Newsroom
Anthropic 宣布完成由 Altimeter Capital 等领投的 650 亿美元 H 轮融资,投后估值达 9650 亿美元,年化收入已突破 470 亿美元。Claude 已登陆 AWS、Google Cloud 和 Microsoft Azure 三大云平台。
15. Apple 正将大型 Gemini 模型塞进 iPhone 驱动新 Siri
来源:Ars Technica
Apple 正尝试将大型 Gemini 模型集成到 iPhone 中,以支持全新的 Siri 功能。由于模型规模庞大,云端组件很可能是必然的选择。
16. DeepSeek 计划 500 亿美元融资后冲刺科创板 IPO
来源:X.PIN
消息称 DeepSeek 计划在完成当前约 500 亿美元融资轮后,立即申请科创板(A 股)IPO。
17. SGLang + AMD MI355X 实现 DeepSeek-R1 推理成本低于 NVIDIA
来源:LMSYS Blog
SGLang 与 AMD 合作,通过全栈优化使 AMD Instinct MI355X GPU 运行 DeepSeek-R1 的成本为 $0.169/百万 token,比 NVIDIA B200 方案低 5%,每 GPU 吞吐量高 1.25 倍。
18. OpenAI 发布前沿治理框架
来源:OpenAI 官网动态
OpenAI 发布了”前沿治理框架”,阐述其 AI 安全与风险管理实践如何与欧盟和加州新法规对齐,是应对全球 AI 监管的重要举措。
19. Google I/O 2026 一文速览 12 大重要时刻
来源:Google Blog
Google I/O 2026 发布会披露了 12 个重要时刻,涵盖 Gemini Omni、Gemini 3.5 Flash 等产品的最新消息。
20. Anthropic 开设米兰办公室 — 欧洲第六家
来源:Anthropic Newsroom
Anthropic 在米兰开设其欧洲第六家办公室,已与 JAKALA、Satispay 等企业合作。Satispay 借助 Claude 将 18 个月路线图压缩至 7 个月。
论文研究
21. hexoai 开源 SIA 框架:AI 智能体实现递归自我改进
来源:Rohan Paul
hexoai 开源了 SIA(自我改进 AI)框架。智能体不仅能优化外部工作流,还能通过任务反馈直接更新自身模型权重。SIA 在 LawBench 上提升 56.6%,GPU kernels 耗时减少 91.9%,单细胞 RNA 去噪任务提升 502%。
22. DenoiseRL:从弱模型的错误中学习推理
来源:HuggingFace Daily Papers
DenoiseRL 是一种强化学习框架,通过从弱模型产生的失败推理轨迹上进行基于恢复的优化来直接学习。实验表明其在数学和通用推理基准中持续优于在策略 RL 基线。
技巧与观点
23. OpenRouter 对比页:GPT-5.5 vs Claude Opus 4.8 实测对比
来源:Hacker News 热门
OpenRouter 发布对比页,将 GPT-5.5 和 Claude Opus 4.8 的胜负判断从 benchmark 拉到实际测试环境,对模型选型很有参考价值。
24. Runway Project Luxo:AI 视频已跨过恐怖谷
来源:Runway
Runway 通过 Project Luxo 展示单人在一天内创作的 AI 短片,观众开始关注故事本身而非技术瑕疵,标志着 AI 视频生成已跨越恐怖谷。
编辑:AI 无涯 | 数据来源:AI HOT (aihot.virxact.com)
