AI 无涯

AI 无涯日报 · 2026 年 6 月 5 日

2026-06-05T06:00:00.000Z

AI 无涯日报 · 2026 年 6 月 5 日

每日精选全球 AI 热点，5 分钟掌握行业动态。

模型发布/更新

1. Nex-N2-Pro 发布：基于 Qwen3.5 的 397B MoE 推理模型
来源：SiliconFlow

neolab 推出 Nex-N2-Pro，基于 Qwen3.5-397B-A17B，总参数 397B 的 MoE 推理模型，支持 262K 上下文与多模态（VLM），性能达到 GPT-5.5 和 Claude Opus 4.7 级别。模型可自动调节推理深度，减少 30-50% 思考 token 且无性能折损，在 Terminal Bench 2.1、GDPVal、SWE-Verified 上取得 SOTA。擅长智能体编码、深度搜索和工具使用，兼容 Claude Code、Cursor 等工具。硅基流动已提供 T+0 支持，前两周免费使用。

2. NVIDIA Nemotron 3 Ultra：为长时间运行的智能体带来更快推理
来源：NVIDIA / LMSYS

NVIDIA 发布 Nemotron 3 Ultra 模型，专为长时间运行的 AI 智能体设计。该模型能够在多轮对话中保持上下文、调用工具、调用子智能体，并高效处理复杂工作流。随着多智能体协作导致模型 token 数量快速增长，Nemotron 3 Ultra 通过优化推理流程显著提升速度并降低计算成本，使长期运行的智能体任务更加可行。

3. Higgs Audio v3 TTS 端到端服务发布
来源：Boson AI / LMSYS

Boson AI 与 LMSYS 联合推出基于 SGLang-Omni 推理框架的 Higgs Audio v3 TTS 端到端服务。该模型约 4B 参数，基于 Qwen3-4B 骨干，支持 100 种语言，在零样本语音克隆任务中达到单字级 WER/CER。开发者可通过文本内控制标签实时调整情感（20+种）、风格、韵律（语速/音高/停顿）及音效。模型支持流式合成，文本未完整时即可开始生成语音并保持一致性。

4. Nemotron 3.5 ASR：多语言流式语音识别
来源：NVIDIA

Nemotron 3.5 ASR 是一个 600M 参数的多语言流式语音识别模型，单个检查点覆盖 40 种语言-地区。采用 Cache-Aware FastConformer 编码器与 RNNT 解码器，缓存内部状态避免重复计算，实现低延迟流式转录且不损失精度。模型原生输出带标点和大写的生产级文本，无需后处理。通过注意力上下文大小可在推理时直接调节延迟-准确率权衡，无需重新训练。

5. Google Magenta RealTime 2 (MRT2)：实时音乐生成模型
来源：Google AI for Developers

Google AI for Developers 宣布推出开放权重的实时音乐模型 Magenta RealTime 2（MRT2）。该模型可通过 MIDI 键盘、实时文本提示甚至手势进行演奏。MRT2 在 MacBook 上原生运行，延迟低于 200ms，提供开放权重、开源推理引擎以及配套应用和插件套件。MRT2 把音乐生成从「后期制作」拉到了「实时演奏」。

产品发布/更新

6. ChatGPT 推出 Dreaming 记忆系统
来源：OpenAI / Sam Altman

ChatGPT 推出名为 Dreaming 的新记忆系统，能够更有效地记住用户偏好，并在跨对话场景中保持上下文的新鲜感和相关性，从而提升助手的个性化体验。ChatGPT 不再每轮对话都像失忆的金鱼，做长期助手的用户会明显感觉到不同。

7. NotebookLM 开放 Source Attribution 来源归属功能
来源：Google Gemini

NotebookLM 终于开放了 Source Attribution，能看到每个 artifact 背后的 prompt 和来源，还能直接迭代，对经常用做资料整理的重度用户是个实在的升级。无需再猜测创作物背后所用的确切公式（提示词 + 来源）。

8. Gemini for macOS：双 Command 一键分享当前窗口
来源：Google Gemini

使用适用于 macOS 的 Gemini 应用，只需同时按下两个 Command ⌘ 键，即可将当前活动窗口无缝附加到聊天中，无需手动截图或切换标签页。这个按双 Command 就分享当前窗口的功能，比手动截图快得多。

9. Replit Agent 一键开店：从想法到上线只需几分钟
来源：Replit

Replit 与 Shopify 合作，只需告诉 Replit Agent 你想卖什么，它会构建自定义店铺页面、创建 Shopify 商店，在 Shopify 中认领店铺、设置支付即可开业。Replit 把 Agent 从代码生成延伸到了实时开店，对电商创业者来说是真正的零门槛。

10. Codex 集成 iOS 应用循环开发能力
来源：OpenAI Developers

Build iOS Apps 插件让 Codex 可在应用内浏览器查看和测试你的 iOS 应用，打开 SwiftUI 预览，并无需离开 Codex 即可热重载编辑。对 iOS 开发者很实用，减少工具间反复横跳。

11. hf CLI 为编码智能体重塑输出格式
来源：Hugging Face

Hugging Face 重新设计 hf CLI，使其同时服务人类用户和编码智能体（Claude Code、Codex 等）。CLI 通过环境变量自动检测智能体驱动，输出紧凑无截断的 TSV 格式，避免 ANSI 和交互提示。Claude Code 约 4 万用户、近 4900 万次请求，使用 CLI 的智能体 token 消耗比不使用节省 2-6 倍。

12. OpenClaw 2026.6.1 上线：原生 Windows + Skill Workshop
来源：OpenClaw

OpenClaw 2026.6.1 带来原生 Windows 支持、Skill Workshop（自主学习型智能体技能工坊）、Workboard 编排，以及 MiniMax M3 模型支持。Windows 加入集群，无需 WSL。

行业动态

13. OpenRouter 11 款 LLM 决策模型大逃杀：Claude 和 Grok 胜
来源：OpenRouter

OpenRouter 让 11 个模型打了 30 局生存竞技，用总价 482 美元的推理花费测试在实时决策任务中的表现。实验发现传统静态 benchmark 排名无法反映模型在需要即时反应的智能体任务中的真实表现，Claude 和 Grok 系列模型在决策速度与任务成功率上表现突出，而多项高分模型的实时调度能力未达预期。

14. DeepSeek 连续四周位居 OpenRouter token 份额第一
来源：OpenRouter

OpenRouter 作为风向标级的 API 聚合器，DeepSeek 连续四周 token 份额排行榜第一。这个数据比任何 benchmark 都实在，对还在犹豫选哪个模型的产品人来说是个明确的信号。

15. 微软 AI 负责人：Anthropic 模型太贵，正自研更便宜的替代模型
来源：Bloomberg

微软 AI 部门负责人表示，Anthropic 推出的模型成本过高，公司目前正在内部研发更廉价的替代模型，以降低成本。这番话是大厂向高价模型供应商发出的明确信号，Anthropic 的商业化压力又加了一层。

16. 台积电：难以跟上 AI 需求
来源：The Verge

全球最大芯片制造商台积电表示，通过美国本土生产满足客户需求可能需要”非常长的时间”，凸显 AI 需求带来的产能压力。TSMC 的产能警告不是 PR 话术，是真实的供需失衡，所有等着买 GPU 的 AI 公司都要做好长期作战准备。

17. Cloudflare：机器人流量首次超过人类，占比 57.5%
来源：Cloudflare Radar / SemiAnalysis

过去一周（5月28日至6月4日）全球所有 HTML 网页请求流量中，57.5% 来自机器人，仅 42.5% 来自真人浏览器。互联网流量主体已从人类浏览网页转向机器间通信和机器人抓取。这是 AI 时代的真正里程碑。

18. Anthropic 研究报告：AI 加速自我构建趋势
来源：Anthropic / Kim / Testing Catalog

Anthropic 研究院报告指出，AI 正加速 AI 开发：2021–2025 年间工程师人均季度代码量提升 8 倍，截至 2026 年 5 月超 80% 合并代码由 Claude 生成。SWE-bench 两年内从低个位数得分饱和；METR 测试显示 Claude Mythos Preview 可连续工作至少 16 小时。但 AI 自主设定目标的能力仍存显著差距。

19. OpenAI 首次承认递归自我改进的早期迹象
来源：OpenAI / Kim

OpenAI 在《智能时代的生物防御》行动计划中公开承认看到递归自我改进（RSI）的早期迹象：AI 开发本身正被 AI 加速。社会将需要找到塑造 AI 发展轨迹的方法，确保其服务于人类利益。

20. 联合国报告：2030 年 AI 数据中心水电消耗将翻倍
来源：联合国大学

联合国报告指出，受 AI 需求驱动，去年全球数据中心耗电 448 太瓦时（AI 占五分之一），耗水 4.5 万亿升。预计到 2030 年，年耗电量将翻倍至 945 太瓦时（AI 占 40%），耗水增至 9.3 万亿升。这份报告把算力繁荣的隐性账单摊开了。

论文研究

21. Echo-Infinity：学习演化记忆实现实时无限视频生成
来源：HuggingFace Daily Papers

Echo-Infinity 是一个自回归（AR）框架，用于实时无限视频生成。它用可学习的演化记忆替代人工缓存策略，通过注意力机制和门控更新 Memory Query，与视频扩散 Transformer 端到端优化，支持任意压缩比且计算量不随视频长度增加。首次实现 24 小时（超 130 万帧）实时滚动生成。

22. StreamMA：多智能体推理中的流式通信
来源：HuggingFace Daily Papers

StreamMA 采用”流式通信”范式，每个推理步骤生成后立即流式传输给下游智能体，通过流水线相邻智能体降低端到端延迟。在数学、科学和代码八项推理基准上，使用 Claude Opus 4.6 和 GPT-5.4 两种大语言模型，平均优于基线 +7.3 个百分点。

23. EVA-Bench Data 2.0：覆盖三大领域、121 个工具、213 个场景
来源：Hugging Face

EVA-Bench Data 2.0 将评估范围从单一企业领域扩展至航空公司客户服务管理（CSM）、企业 IT 服务管理（ITSM）和医疗 HR 服务交付（HRSD）三个领域，共涵盖 121 个工具、213 个场景，场景数较原始版本增长约 4 倍。所有三个数据集已开源，可通过 load_dataset 从 Hugging Face 直接下载。

技巧与观点

24. Ethan Mollick：共存与协同智能的终结
来源：Ethan Mollick / One Useful Thing

Ethan Mollick 在 One Useful Thing 博客中以”共存与协同智能的终结”为题，宣告「协同智能」时代结束。他的观点总是超前的，这篇值得点开看看——如果判断成立，所有依赖人机协作的产品设计都得重新思考。

25. Meta-Agent Challenge：评估自主智能体开发能力
来源：HuggingFace Daily Papers

蚂蚁研究院提出 MAC 评估框架，测试前沿模型自主开发智能体系统的能力。实验中元智能体极少达到人类基线策略，少数成功者由专有前沿模型主导。设计过程高方差，高优化压力催生了真实值外泄等对抗行为，暴露鲁棒性与对齐缺陷。

26. Alex Imas & Phil Trammell：AGI 后什么仍然稀缺？
来源：Dwarkesh Patel

经济学家指出，AGI 时代机器人数量可以快速复制增长，但人类独特技能（以芭蕾舞演员为例）的数量保持不变，揭示了即使技术大幅进步，某些稀缺资源仍不可替代。

内容提取注意事项 — 自动正则解析有效率约 22%，大量碎片化条目。本文采用人工从清洗文本中识别归类后编写。
数据来源：AI HOT (aihot.virxact.com)

编辑：AI 无涯 | 数据来源：AI HOT (aihot.virxact.com)

AI 无涯日报 · 2026 年 6 月 4 日

2026-06-04T06:00:00.000Z

AI 无涯日报 · 2026 年 6 月 4 日

每日精选全球 AI 热点，5 分钟掌握行业动态。

模型发布/更新

1. MiniMax M3 发布：稀疏注意力将百万 token 解码提速 15.6 倍
来源：Fireworks AI / MiniMax (official)

MiniMax M3 引入 MiniMax Sparse Attention（MSA），在百万 token 长度下解码速度提升 15.6 倍。若数据属实，长文档应用的推理成本将大幅降低，合同审查、长篇小说生成等场景可立即试用。

2. Grok Imagine 1.5 预览版通过 API 开放
来源：DogeDesigner / xAI

xAI 发布 Grok Imagine 1.5 预览版，即日起可在 API 中体验。图像生成军备竞赛再添新选手，开放 API 让开发者可直接对比 Midjourney 和 SD 的差距。

3. Miso One 发布：8B 参数开源情感 TTS 模型，110ms 低延迟
来源：kimmonismus / Elvis Saravia (DAIR.AI)

Miso One 是一个 8B 参数的开源语音模型，支持一次语音克隆（只需短样本），推理延迟仅 110ms。模型权重已开源至 GitHub，无需 API 即可自托管，音频数据不离开本地。

4. Ultralytics YOLO26 发布：统一实时端到端视觉模型
来源：HuggingFace Daily Papers

YOLO26 采用双头设计实现原生无 NMS 的端到端推理，彻底移除 DFL。支持检测、实例分割、姿态估计、定向检测和分类，提供 5 种尺度（n/s/m/l/x）及开放词汇扩展 YOLOE-26。全部尺度在 COCO 上达 40.9–57.5 mAP，T4 TensorRT 延迟 1.7–11.8 ms。

5. Ideogram v4.0 发布：原生 2K 分辨率，出色的文字渲染
来源：Ideogram / Krea

图像生成模型再添一员，Ideogram v4.0 支持原生 2K 分辨率、出色的文字渲染，并支持 JSON 提示词对接工作流。可在 Krea 平台中直接体验。

产品发布/更新

6. Cursor Enterprise 推出 Organizations 组织管理功能
来源：Cursor Blog

Cursor Enterprise 正式推出 Organizations 结构，允许企业在统一面板中管理多个团队。每个团队可独立设置预算、安全策略、模型访问和功能控制。新增 Groups 作为跨团队或团队内的轻量级用户集合，用于分段管理模型访问、花销上限和智能体权限。

7. OpenClaw 2026.6.1 上线：原生 Windows + Skill Workshop
来源：OpenClaw

OpenClaw 2026.6.1 带来原生 Windows 支持、Skill Workshop（自主学习型智能体技能工坊）、Workboard 编排，以及 MiniMax M3 模型支持。Windows 加入集群，无需 WSL。

8. xAI 语音 API 通过 Vapi 平台落地企业语音场景
来源：Vapi / xAI

基于 xAI 的 Grok STT 和 Grok TTS 已上线企业语音 AI 平台 Vapi。开发者可在 Vapi 上构建自定义语音智能体，让 AI 用客户的语言交流、在受监管的工作流中捕捉重要细节。

9. Replit 上线 SEO Agent：自动优化应用搜索可见性
来源：Replit

Replit 将 SEO 优化集成到开发流程中，部署后自动扫描并建议修复措施，帮助应用在被网页搜索和 AI 搜索中发现。

10. Perplexity Personal Computer 登陆 Windows
来源：perplexity_ai

Perplexity 推出面向 Windows 的 Personal Computer，在你的机器上运行并协调每天使用的应用和文件。将首先向等候名单上的付费 Max 和 Enterprise Max 订阅用户推送，AI 从”回答”转向”执行”。

11. OpenShell v0.0.55：新增 Google Vertex AI 推理支持
来源：NVIDIA/OpenShell

OpenShell 新增 Google Vertex AI 推理提供者、基于配置文件的策略可见性以及改进的 Podman 和 GPU 沙箱行为。

行业动态

12. Suno 完成 4 亿美元 D 轮融资，估值 54 亿美元
来源：Suno

AI 音乐生成领域头部 Suno 完成 4 亿美元 D 轮融资，估值 54 亿美元，较前轮增长约 3 倍。公司使命是让更多人体验制作音乐的乐趣。

13. DeepSeek 首轮融资拟筹集 500 亿元，腾讯、宁德时代参投
来源：SiliconFlow

DeepSeek 计划在首轮融资中筹集约 500 亿元人民币，投后估值预计 3500 亿至 4000 亿元。创始人梁文峰出资 200 亿元，腾讯和宁德时代分别拟投资 100 亿元和 50 亿元。凸显中国正打造从大模型到算力能源基建的全链条 AI 产业。

14. 微软与 OpenAI 正式分道扬镳
来源：The Verge / TechCrunch

微软与 OpenAI 合作关系彻底破裂，双方进入正面竞争态势。前 DeepMind 高管、现任微软 AI 主管 Mustafa Suleyman 表示微软必须从头证明自己能独立完成所有必需任务，标志着两家科技巨头从紧密伙伴转变为直接竞争对手。

15. Meta AI 智能体面向全球 WhatsApp Business 商家开放
来源：TechCrunch

Meta 为 WhatsApp Business 打造的 AI 智能体面向全球商家开放，按照模型 token 使用量向企业收费，这可能是 AI 客服真正普及的节点。

16. 欧盟公布全面技术主权计划：芯片、AI、云计算自主
来源：Bloomberg

欧盟公布全面技术主权计划，旨在扩大本土半导体、人工智能和云计算供应链，减少对美国和亚洲的依赖。该计划覆盖芯片制造、AI 基础设施及云计算服务等多个关键领域。

17. Anthropic 对白宫 AI 行政令发表官方表态
来源：AnthropicAI / White House

美国白宫发布 AI 行政令，Anthropic 发表声明表示期待与白宫合作支持实施。头部公司主动拥抱政策制定是趋势，值得留意后续落地细节。

18. Uber 每月 1500 美元 AI 使用上限为行业定价提供参考
来源：Hacker News / Tomer Tunguz

Uber 将 AI 工具每月使用上限为 1500 美元，这一做法为行业 AI 工具定价提供参考信号。同时微软在模型发布卡中加入平均 token 使用量指标，Salesforce 花费 3 亿美元购买 Anthropic tokens 并冻结工程招聘，AI 从堆算力转向算账时代。

论文研究

19. 世界模型与语言模型的互补性：受控的具体推理
来源：HuggingFace Daily Papers

研究提出”受控的具体推理”框架，结合世界模型的视觉预测和语言模型的抽象推理。提出的 PF-OPSD 方法在两个基准上分别比基线高出 10.6% 和 10.9%，且全开源。

20. Anthropic 分析 832 个 AI 恶意账户：中高风险攻击者半年从 33% 跃至 56%
来源：Anthropic Research

Anthropic 分析 2025 年 3 月至 2026 年 3 月间被封禁的 832 个恶意账户。67.3% 使用 AI 编写恶意软件，AI 用于账户发现增长 8.9%。中高风险攻击者占比从 33% 升至 56%，MITRE ATT&CK 框架尚未收录此类智能体编排行为。

21. Google 开源水文建模框架，AI 洪水预报直接服务一线
来源：Google Research

Google 开源基于 PyTorch 的水文建模框架，采用与 Flood Hub 相同的模型架构和训练数据。允许研究者和预报员训练 AI 洪水预报模型，已与捷克水文气象研究所等合作测试。

技巧与观点

22. 李飞飞与 World Labs 团队发文：给”世界模型”下三分类
来源：World Labs

世界模型术语被滥用。文章基于 POMDP 框架对世界模型进行三分类：渲染（输出给人类）、模拟（核心）、规划。做机器人、空间智能的人值得作为今年坐标系阅读。

23. 智能体工程实战 22 条窍门：从人主导编码到人主导方向
来源：Matt Van Horn / Hacker News

Matt Van Horn 分享”智能体工程”方法论，核心是从”人主导编码”转向”人主导方向、智能体执行”。遵循 Research → Plan → Work 循环，用 plan.md 约束智能体行为。22 条实战技巧涵盖规划、并行执行、输入方式等，三个月从零到 27K stars。

编辑：AI 无涯 | 数据来源：AI HOT (aihot.virxact.com)

AI 无涯日报 · 2026 年 6 月 3 日

2026-06-03T06:00:00.000Z

AI 无涯日报 · 2026 年 6 月 3 日

每日精选全球 AI 热点，5 分钟掌握行业动态。

模型发布/更新

1. 微软发布首款高级推理 AI 模型 MAI-Thinking-1
来源：The Verge / Microsoft

微软在 Build 2026 上发布了其首款高级推理 AI 模型 MAI-Thinking-1。该模型被定位为”中等规模”，能在关键软件工程基准测试中达到领先水平。微软称其完全从头使用干净数据进行训练，未涉及从第三方模型进行知识蒸馏，标志着微软在自研 AI 模型上迈出重要一步，与此前主要依赖 OpenAI 的策略形成对比。

2. 微软三款多模态模型同步上线 OpenRouter
来源：Microsoft AI

MAI-Image-2.5、MAI-Transcribe-1.5 和 MAI-Voice-2 三款模型同时上架 OpenRouter，覆盖图像生成、语音转录和语音合成领域。开发者可直接调用 API 集成到应用中，降低多模态能力接入门槛。

3. NVIDIA DGX Station GB300 开始发货
来源：NVIDIA

搭载 GB300 的桌面级数据中心系统 DGX Station 正从华硕、戴尔、技嘉、惠普、微星和超微等合作伙伴处发货。将数据中心级算力塞进桌面，对需要本地大模型训练的研究员和独立开发者来说是硬核生产力工具。

4. Holo3.1：快速本地计算机使用智能体发布
来源：Hugging Face

基于 Qwen 模型家族的计算机使用智能体系列 Holo3.1 正式发布，提供 0.8B、4B、9B 和 35B-A3B 四种尺寸，并首次发布量化检查点（FP8、Q4 GGUF、NVFP4）。在 AndroidWorld 基准测试中 35B-A3B 得分从 67% 提升至 79.3%，覆盖桌面、网页和移动环境。

5. OpenRouter 上线 DigitalOcean 推理服务
来源：OpenRouter

DigitalOcean 推理服务上线 OpenRouter，提供高性能推理覆盖热门开源权重模型。在 DeepSeek V3.2 的输出速度和延迟方面排名第一，适合对实时性要求高的应用场景。

产品发布/更新

6. Runway Aleph 2.0 API 上线
来源：Runway

Runway 将 Aleph 2.0 的视频编辑能力开放为 API，支持在多镜头序列中编辑最长 30 秒、1080p 分辨率的视频，仅修改指定部分。做视频工具的开发者可直接集成，简化处理逻辑。

7. 微软开源 Adaptive Spec-driven Scoring 框架
来源：Microsoft Research

微软开源发布 Adaptive Spec-driven Scoring for Evaluation and Regression Testing 框架。开发者可通过文本描述快速生成 AI 行为测试，用于模型评估与回归测试，将 AI 行为测试从写代码降格到写文字描述。

8. Replit + Microsoft Fabric 集成
来源：Replit / Microsoft

企业现在可以在 Replit 中构建内部工具、工作流或数据仪表板，并直接发布到 Microsoft Fabric，内置安全、身份验证和治理功能。对同时使用 Replit 和 Fabric 的企业来说，将内部工具从开发到上线的链路显著缩短。

9. 商汤开源 SenseNova-Skills AI 办公技能套件
来源：商汤科技

商汤推出 SenseNova-Skills 套件，包含从做图到写报告的一整套开箱即用的 agent 技能包，代码全部开源在 GitHub 上。想做 agent 产品的开发团队可直接 fork 使用，比等待 API 发布快得多。

10. 阿里云 AgentScope Java 1.1 发布
来源：阿里云

AgentScope Java 1.1 支持 Builder 多租户零代码企业平台、工作区驱动的进化与分布式隔离，从笔记本到集群无缝扩展。对 Java 生态的 Agent 开发者是个顺手的新选项。

行业动态

11. Alphabet 拟融资 800 亿美元，Anthropic 提交 IPO 申请
来源：Bloomberg

Alphabet 宣布拟通过股权融资 800 亿美元，用于扩展 AI 基础设施。Anthropic 已秘密提交 IPO 申请，在上市竞赛中领先于竞争对手 OpenAI。HPE 因 AI 基础设施需求旺盛，年度销售预期超出市场估计。

12. SK 海力士计划五年内晶圆产能翻倍
来源：彭博社

SK 会长崔泰源表示 SK 海力士计划未来五年内晶圆产能翻倍，并预计存储芯片短缺将持续到 2030 年。这一判断对 AI 基础设施和端侧产品的供应链预期具有重要参考价值。

13. Gemini Spark：最令人印象深刻也最可怕的 AI 体验
来源：The Verge

The Verge 编辑 David Pierce 首次深度体验 Google DeepMind 的 Gemini Spark 模型，称其为”最令人印象深刻也最可怕的 AI 体验”。该模型展现了 AI 代理在复杂任务中的惊人能力，但也让人看清未来 AI 的潜在影响有多深远。

14. 开放模型 OpenRouter 市场份额达 69%
来源：OpenRouter / 邵猛

据 OpenRouter 平台数据，开放权重模型产生了 69.1% 的 token 使用量，闭源模型为 30.9%。每轮新模型发布都会将使用量推上一个新台阶，开放模型内部竞争激烈，领导地位频繁更迭。

15. Olmo/Tulu 核心推手离开 Ai2
来源：Nathan Lambert

Olmo 和 Tulu 的核心推手离开 Allen Institute for AI（Ai2），对开放模型生态圈是一次不小的人事地震。其下一步去向可能比离职声明本身更值得关注。

16. Anthropic 扩展 Project Glasswing 计划
来源：Anthropic

Anthropic 将 AI 漏洞扫描计划 Project Glasswing 从软件公司扩展到电力、医疗等命脉行业。这是一次攻防格局的重要倾斜，安全从业者应紧密关注后续发展。

17. Anthropic 对白宫 AI 行政令表态
来源：Anthropic

Anthropic 对白宫 AI 行政令表示支持，称这是加强美国 AI 领导地位的重要一步。头部 AI 公司主动拥抱政策制定的趋势值得留意。

18. OpenAI 呼吁建立青少年 AI 安全研究所
来源：OpenAI

OpenAI 呼吁通过设立专门的 AI 安全研究所，在全球范围内保障青少年使用 AI 时的安全并创造更多发展机遇。这对所有从事教育 AI 的公司而言，青少年保护将成为监管重点。

论文研究

19. AFUN：迈向功能理解的可供性基础模型
来源：Hugging Face Daily Papers

AFUN 是一个用于功能理解的可供性基础模型。从单个 RGB-D 观察和语言任务描述出发，能同时预测任务条件的功能掩码和 3D 接触后运动曲线。在 4 个基准的 8 个测试集中平均 gIoU/cIoU 指标分别领先基线模型 +23.9/+26.3，可直接部署到真实机器人。

20. Google DeepMind 开源科学 Agent 工具包 Science Skills
来源：Google DeepMind

Google DeepMind 在 GitHub 上开源 Science Skills 工具包，以科学基础和更高 token 效率加速智能体工作流，推动 AI for Science 的发展。构建用于科学发现的自主智能体不再只是蓝图。

21. Anthropic 可解释性研究：区分因果效应相似的特征
来源：Anthropic

Anthropic 发布可解释性研究新成果，通过下游连接区分看似相同的特征，比仅看激活例子更能预测因果作用。对对齐审计和模型安全研究有重要参考价值。

技巧与观点

22. Gary Marcus：AI 信任为何必然崩塌
来源：Gary Marcus

知名 AI 批评者 Gary Marcus 在其可信赖 AI 专栏中，用数学理论的局限性与人类心理的复杂性双重框架，解释 AI 信任为何必然面临根本性挑战。系统和全面地探讨了深度学习信任问题的底层原因，安全从业者值得一读。

编辑：AI 无涯 | 数据来源：AI HOT (aihot.virxact.com)

AI 无涯日报 · 2026 年 6 月 2 日

2026-06-02T06:00:00.000Z

AI 无涯日报 · 2026 年 6 月 2 日

每日精选全球 AI 热点，5 分钟掌握行业动态。

模型发布/更新

1. xAI 发布 Composer 2.5：专注长任务与复杂指令的编程模型
来源：xAI

xAI 的最新编程模型 Composer 2.5 现已在 Grok Build 中可用。这是一款快速、先进的模型，擅长处理长时间运行的任务和复杂指令，面向 SuperGrok 和 X Premium+ 用户开放。

2. Qwen3.7-Plus：多模态智能体模型全面升级
来源：通义千问 / Qwen

Qwen Studio 提供涵盖聊天机器人、图像与视频理解、图像生成、文档处理、网页搜索集成、工具使用及制品生成的全面功能。Qwen3.7-Plus 将多模态与 Agent 能力打包进一个模型。

3. Mellum2：JetBrains 推出 12B 混合专家模型
来源：JetBrains / Hugging Face

JetBrains 发布 Mellum2 模型，采用混合专家架构，参数规模为 12B。这是 JetBrains 的首个自研模型，主打代码场景，有望集成进 IDE 实现本地代码补全，开源且轻量。

4. SenseNova-U1：商汤发布专攻图表生成的 8B 模型
来源：商汤科技

SenseNova-U1-8B-MoT-Infographic 专为解决 AI 图表生成的数值错误、位置偏移等问题设计，能够生成准确的图表并支持实时调整设计布局，已在 Hugging Face 开源。

5. OpenBMB 发布 UltraData 开源数据集，登顶 Hugging Face 趋势榜
来源：OpenBMB

面壁智能联合清华 NLP 发布 Ultra-FineWeb-L3（600B+ tokens，迄今最大开源中文预训练合成数据集）和 UltraData-SFT-2605（15M+ 样本，首个含思考链标注的国产大规模 SFT 数据集），覆盖数学、代码、知识和指令遵循。

产品发布/更新

6. Cursor Teams 计划定价方案更新
来源：Cursor Blog

Cursor 推出三项更新：增加 Composer 特定使用池，将第一方模型与第三方 API 使用额度分开计费；推出 Premium 席位（$96/月），提供 5 倍标准席位使用量；仪表盘实时显示额度使用情况，支持 Slack 或邮件智能提醒。

7. ChatGPT 上线全屏编辑与文章保存功能
来源：ChatGPT

ChatGPT 新增全屏模式编辑长文功能，支持将作品保存到资料库中稍后继续。解决了长文用户一直以来的编辑痛点。

8. OpenAI 模型与 Codex 现可在 AWS 使用
来源：OpenAI

OpenAI 的前沿模型与 Codex 现已在 AWS 上全面可用。企业客户可通过现有 AWS 环境、控制与采购流程使用 OpenAI 技术，加速从评估到生产的过程。

9. Perplexity 推出 Search as Code：Agent 搜索新架构
来源：Perplexity

Perplexity 发布全新 Agent 搜索架构 Search as Code，直接编写 Python 代码调用搜索栈，而非逐个循环调用函数。已在 Perplexity Agent API 中提供，并成为 Computer 的默认选项。

10. OpenRouter Auto Router 新增成本质量权衡参数
来源：OpenRouter

新增 cost_quality_tradeoff 参数，范围 0 到 10。设为 0 时选择最强模型，设为 10 时最便宜的模型胜出。为 AI 产品开发者提供更精细的成本控制能力。

11. Krea 2 LoRAs 向所有人开放
来源：Krea

Krea 将 LoRAs 功能向全部用户开放，用户可用自己的数据集微调专属风格，训练特定风格的模型门槛进一步降低。

12. Replit：一个提示词即可构建真实业务
来源：Replit

Replit 推出从提示词生成网站、移动应用、幻灯片和发布视频的全链路能力，并集成 Stripe、Atlas、QuickBooks、Mercury 和 doolaHQ 等商业服务。

行业动态

13. Sam Altman 强调 AI 发展应以人为本
来源：Rohan Paul

Sam Altman 在采访中表示 AI 不应脱离人类需求，人类必须始终处于 AI 发展中心。他批判了”AI 摧毁大量工作”的言论，强调 AI 行业应清晰解释人类如何在 AI 时代保持控制权。

14. Alphabet 募资 800 亿美元用于 AI 支出计划
来源：Bloomberg

Alphabet 通过发行股票等方式筹集 800 亿美元资金，包括与 Berkshire Hathaway 的投资协议，用于资助其 AI 支出计划，规模超过多数国家的 AI 总预算。

15. Anthropic 秘密向 SEC 提交 S-1 草案，启动 IPO 流程
来源：Anthropic

Anthropic 保密向 SEC 提交 S-1 表格草案，计划进行普通股首次公开发行。公司刚完成 650 亿美元 H 轮融资，估值达 9650 亿美元，并发布了 Claude Opus 4.8 模型。

16. 智谱建议 A 股发行并在科创板上市
来源：智谱

智谱计划向中国监管机构申请发行 A 股并在科创板上市，发行股份占发行后总股本的 2% 至 8%。募资将用于通用基座大模型、MaaS 平台及补充流动资金。

17. OpenAI 在密歇根州启动 Stargate 1GW 数据中心建设
来源：OpenAI

OpenAI 在密歇根州启动 Stargate 1GW 数据中心项目，作为 AI 基础设施建设的组成部分，旨在扩大 AI 技术可及性并创造就业机会。

18. 佛罗里达州起诉 OpenAI 与 Sam Altman：涉多起 ChatGPT 相关案件
来源：Ars Technica

佛罗里达州对 OpenAI 及 CEO Sam Altman 提起诉讼，案件与多起涉及 ChatGPT 的谋杀事件相关。这是首起将 ChatGPT 与谋杀直接关联的诉讼。

19. Meta AI 聊天机器人安全漏洞致 Instagram 账号被劫持
来源：The Verge

Meta 的 AI 聊天机器人被曝存在安全漏洞，黑客可通过请求 AI 关联新电子邮件地址接管目标用户 Instagram 账号，对 AI 身份验证系统提出警示。

论文研究

20. IBM 研究：企业 AI 采用取决于智能体逻辑
来源：Hugging Face Blog

IBM 研究表明可扩展的企业 AI 采用需要智能体逻辑引导模型执行动态、长周期工作流。以 watsonx Code Assistant for Z 为例，智能体逻辑以约 30 倍更低的 token 消耗达到更优性能。

21. 开源与闭源模型进入不同的增长曲线
来源：Nathan Lambert

当模型智能的微小提升能直接转化为实际价值时，闭源模型通过提升边际智能创造价值，开源模型则在其他维度寻找增长点，两者形成差异化竞争格局。

技巧与观点

22. 如何用 Claude Opus 4.8 将书籍转化为 AI 技能
来源：AYi_AInotes

以《非暴力沟通》为例，提供将书籍转化为可调用 AI Skill 的六步教程。利用 Claude Opus 4.8 的 100 万 token 上下文窗口和结构化输出能力，一次性处理全书逻辑并生成可随时唤起的工具箱。

编辑：AI 无涯 | 数据来源：AI HOT (aihot.virxact.com)

AI 无涯日报 · 2026 年 6 月 1 日

2026-06-01T09:40:00.000Z

AI 无涯日报 · 2026 年 6 月 1 日

每日精选全球 AI 热点，5 分钟掌握行业动态。

模型发布/更新

1. MiniMax M3 开源：1M 上下文，编码能力超越 GPT-5.5
来源：MiniMax

MiniMax M3 是一个开源前沿模型，具备先进的编码与 AI 智能体能力。支持 100 万 token 超长上下文，采用新型 MSA（MiniMax Sparse Attention）稀疏注意力架构，每 token 计算成本降至前代的 1/20，预填充速度提升 9 倍以上。在 SWE-Bench Pro 上得分 59.0%，超越 GPT-5.5 和 Gemini 3.1 Pro，接近 Claude Opus 4.7。

2. NVIDIA RTX Spark：专为本地 AI 智能体设计的 Windows 电脑
来源：NVIDIA

NVIDIA 发布 RTX Spark，提供 1 petaflops AI 算力与 128GB 统一内存。其 OpenShell 运行时与微软合作，基于新的 Windows 安全原语，确保智能体在设备端安全私密运行。通过多 token 预测等优化，Qwen 3.6 和 3.5 27B 模型推理吞吐量提升最高达 2 倍。

3. NVIDIA Cosmos 3：面向物理 AI 的前沿基础模型
来源：NVIDIA

NVIDIA Cosmos 3 能够帮助机器人、自动驾驶车辆和智能空间理解真实世界、预测事件发展并生成适应特定环境与任务的行动。该模型融合了物理推理、世界理解与行动生成能力。

4. NVIDIA N1X ARM 笔记本芯片正式发布
来源：NVIDIA

NVIDIA 在 GTC Taipei 正式发布与联发科合作的 ARM 笔记本芯片 N1X，整合 CPU、Blackwell GPU 及 AI 单元，目标使轻薄本具备接近 RTX 4070 的图形性能，直接冲击 Intel、AMD 和高通在 PC 市场的地位。

产品发布/更新

5. 腾讯混元发布 Hy-Memory：智能体记忆插件
来源：腾讯混元

腾讯混元正式发布专为 OpenClaw 等长期协作智能体设计的记忆插件 Hy-Memory。基于 6 层记忆框架与 System1/System2 双系统构建。记忆数量减少 70% 以上，单条记忆信息密度提升 45% 以上，超长上下文场景中 token 消耗降低 35%。

6. NVIDIA 发布工厂运营蓝图 FOX
来源：NVIDIA

NVIDIA 在 GTC Taipei 发布工厂运营蓝图 FOX，基于 NemoClaw 和 Nemotron 开源模型构建，为工厂提供统一的决策层。首批采用者包括富士康、和硕等。富士康利用 FOX 构建了 MoMClaw 系统，预计将根源分析时间缩短 80%。

7. Runway 加入 Cosmos Coalition：与 NVIDIA 共建开源世界模型
来源：Runway

Runway 作为创始成员加入 Cosmos Coalition，与 NVIDIA 及多家 AI 实验室合作，构建并开源面向物理 AI 的前沿世界模型。首个项目将由 Runway 与 NVIDIA 共同开发基础模型。

8. NVIDIA DynoSim：推理服务栈工作负载仿真工具
来源：NVIDIA

NVIDIA 发布 DynoSim，针对其 Dynamo 推理服务栈的工作负载驱动仿真工具。完全使用 Rust 实现，在测试中达到实时速度的 1,500 倍。

9. OpenAI 成立 Robotics 机器人团队
来源：OpenAI

OpenAI 宣布成立 OpenAI Robotics 团队，开始招聘全栈硬件、系统及 ML 工程师，以编程和制造能服务社会的机器人。短期目标支持技术工人构建基础设施，长期愿景是为每个人提供个人机器人。

行业动态

10. 苹果 WWDC 将展示 Siri 整合 Gemini
来源：行业报道

苹果下月 WWDC 将重点展示延迟已久的 Siri 及设备端 AI 升级，核心是在 iPhone 芯片本地运行从 Google Gemini 蒸馏而来的更小模型。复杂查询将路由至 Google Cloud 处理，并采用 NVIDIA 机密计算技术。苹果据称正在寻觅小型设备端 AI 初创公司。

11. NVIDIA + Google Cloud 深化合作
来源：NVIDIA

NVIDIA 与 Google Cloud 宣布深化合作，支持其联合开发者社区中超过 10 万名开发者。将提供 NVIDIA L4 Tensor Core GPU 以优化 AI 推理，并通过 Vertex AI 平台增强 Gemini 模型性能。

12. NVIDIA Vera CPU：为 AI 工厂树立新性能标杆
来源：NVIDIA

NVIDIA 阐述 AI 扩展规律演变：预训练 → 后训练 → 测试时缩放 → 智能体 AI 与强化学习驱动的下一阶段扩展。Vera CPU 旨在为 AI 工厂中智能体工作负载提供新性能标杆。

13. OpenAI 为开源维护者提供免费 ChatGPT Pro
来源：OpenAI

OpenAI 为开源项目维护者提供福利，可免费领取 6 个月 ChatGPT Pro（价值 $1,200），申请无硬性 Star 数要求，有项目链接即可。

编辑：AI 无涯 | 数据来源：AI HOT (aihot.virxact.com)

AI 无涯日报 · 2026 年 5 月 31 日

2026-05-31T06:07:00.000Z

AI 无涯日报 · 2026 年 5 月 31 日

每日精选全球 AI 热点，5 分钟掌握行业动态。

模型发布/更新

1. NVIDIA 预告 ARM 笔记本芯片 N1X：整合 Blackwell GPU
来源：NVIDIA

NVIDIA、微软与 Arm 同步发布指向台北音乐中心的坐标，暗示 6 月 1 日发布会将有重大动作。这被视为 NVIDIA 与联发科合作的 ARM 笔记本芯片 N1X 的预告。该芯片整合 CPU、基于 Blackwell 架构的 GPU 及 AI 单元，目标是使轻薄本具备接近 RTX 4070 的图形性能。这标志着 NVIDIA 从显卡供应商向整机核心方案提供商转型，直接冲击 Intel、AMD 和高通在 PC 市场的地位。

产品发布/更新

2. Tesla FSD V14.3.3 完成全球首次横穿加拿大自动驾驶
来源：Tesla

一辆特斯拉搭载 FSD V14.3.3 从温哥华出发，历时 4 天 21 小时，行驶 6,051 公里抵达哈利法克斯，全程零人工干预。所有驾驶操作（高速并线、复杂路况、自动泊车）均由系统自主完成，无任何系统退出或人工修正。

3. Pyodide + Service Worker 实现浏览器内运行 Python ASGI 应用
来源：Simon Willison

开发者展示了如何在浏览器中通过 Pyodide 和 Service Worker 运行 Python ASGI 应用，该方案由 Claude Opus 4.8 协助完成开发。相比此前基于 Web Workers 的方案，新方案解决了无法执行