<?xml version="1.0" encoding="utf-8"?>
<feed xmlns="http://www.w3.org/2005/Atom">
  <author>
    <name>无涯</name>
  </author>
  <generator uri="https://hexo.io/">Hexo</generator>
  <id>https://aifki.com/</id>
  <link href="https://aifki.com/" rel="alternate"/>
  <link href="https://aifki.com/atom.xml" rel="self"/>
  <rights>All rights reserved 2026, 无涯</rights>
  <subtitle>每日 AI 资讯精选</subtitle>
  <title>AI 无涯</title>
  <updated>2026-06-05T06:00:00.000Z</updated>
  <entry>
    <author>
      <name>无涯</name>
    </author>
    <category term="AI 日报" scheme="https://aifki.com/categories/AI-%E6%97%A5%E6%8A%A5/"/>
    <category term="AI 资讯" scheme="https://aifki.com/tags/AI-%E8%B5%84%E8%AE%AF/"/>
    <category term="AI 日报" scheme="https://aifki.com/tags/AI-%E6%97%A5%E6%8A%A5/"/>
    <content>
      <![CDATA[<h1 id="AI-无涯日报-·-2026-年-6-月-5-日"><a href="#AI-无涯日报-·-2026-年-6-月-5-日" class="headerlink" title="AI 无涯日报 · 2026 年 6 月 5 日"></a>AI 无涯日报 · 2026 年 6 月 5 日</h1><blockquote><p>每日精选全球 AI 热点，5 分钟掌握行业动态。</p></blockquote><hr><h2 id="模型发布-更新"><a href="#模型发布-更新" class="headerlink" title="模型发布&#x2F;更新"></a>模型发布&#x2F;更新</h2><p><strong>1. Nex-N2-Pro 发布：基于 Qwen3.5 的 397B MoE 推理模型</strong><br>来源：SiliconFlow</p><p>neolab 推出 Nex-N2-Pro，基于 Qwen3.5-397B-A17B，总参数 397B 的 MoE 推理模型，支持 262K 上下文与多模态（VLM），性能达到 GPT-5.5 和 Claude Opus 4.7 级别。模型可自动调节推理深度，减少 30-50% 思考 token 且无性能折损，在 Terminal Bench 2.1、GDPVal、SWE-Verified 上取得 SOTA。擅长智能体编码、深度搜索和工具使用，兼容 Claude Code、Cursor 等工具。硅基流动已提供 T+0 支持，前两周免费使用。</p><p><strong>2. NVIDIA Nemotron 3 Ultra：为长时间运行的智能体带来更快推理</strong><br>来源：NVIDIA &#x2F; LMSYS</p><p>NVIDIA 发布 Nemotron 3 Ultra 模型，专为长时间运行的 AI 智能体设计。该模型能够在多轮对话中保持上下文、调用工具、调用子智能体，并高效处理复杂工作流。随着多智能体协作导致模型 token 数量快速增长，Nemotron 3 Ultra 通过优化推理流程显著提升速度并降低计算成本，使长期运行的智能体任务更加可行。</p><p><strong>3. Higgs Audio v3 TTS 端到端服务发布</strong><br>来源：Boson AI &#x2F; LMSYS</p><p>Boson AI 与 LMSYS 联合推出基于 SGLang-Omni 推理框架的 Higgs Audio v3 TTS 端到端服务。该模型约 4B 参数，基于 Qwen3-4B 骨干，支持 100 种语言，在零样本语音克隆任务中达到单字级 WER&#x2F;CER。开发者可通过文本内控制标签实时调整情感（20+种）、风格、韵律（语速&#x2F;音高&#x2F;停顿）及音效。模型支持流式合成，文本未完整时即可开始生成语音并保持一致性。</p><p><strong>4. Nemotron 3.5 ASR：多语言流式语音识别</strong><br>来源：NVIDIA</p><p>Nemotron 3.5 ASR 是一个 600M 参数的多语言流式语音识别模型，单个检查点覆盖 40 种语言-地区。采用 Cache-Aware FastConformer 编码器与 RNNT 解码器，缓存内部状态避免重复计算，实现低延迟流式转录且不损失精度。模型原生输出带标点和大写的生产级文本，无需后处理。通过注意力上下文大小可在推理时直接调节延迟-准确率权衡，无需重新训练。</p><p><strong>5. Google Magenta RealTime 2 (MRT2)：实时音乐生成模型</strong><br>来源：Google AI for Developers</p><p>Google AI for Developers 宣布推出开放权重的实时音乐模型 Magenta RealTime 2（MRT2）。该模型可通过 MIDI 键盘、实时文本提示甚至手势进行演奏。MRT2 在 MacBook 上原生运行，延迟低于 200ms，提供开放权重、开源推理引擎以及配套应用和插件套件。MRT2 把音乐生成从「后期制作」拉到了「实时演奏」。</p><hr><h2 id="产品发布-更新"><a href="#产品发布-更新" class="headerlink" title="产品发布&#x2F;更新"></a>产品发布&#x2F;更新</h2><p><strong>6. ChatGPT 推出 Dreaming 记忆系统</strong><br>来源：OpenAI &#x2F; Sam Altman</p><p>ChatGPT 推出名为 Dreaming 的新记忆系统，能够更有效地记住用户偏好，并在跨对话场景中保持上下文的新鲜感和相关性，从而提升助手的个性化体验。ChatGPT 不再每轮对话都像失忆的金鱼，做长期助手的用户会明显感觉到不同。</p><p><strong>7. NotebookLM 开放 Source Attribution 来源归属功能</strong><br>来源：Google Gemini</p><p>NotebookLM 终于开放了 Source Attribution，能看到每个 artifact 背后的 prompt 和来源，还能直接迭代，对经常用做资料整理的重度用户是个实在的升级。无需再猜测创作物背后所用的确切公式（提示词 + 来源）。</p><p><strong>8. Gemini for macOS：双 Command 一键分享当前窗口</strong><br>来源：Google Gemini</p><p>使用适用于 macOS 的 Gemini 应用，只需同时按下两个 Command ⌘ 键，即可将当前活动窗口无缝附加到聊天中，无需手动截图或切换标签页。这个按双 Command 就分享当前窗口的功能，比手动截图快得多。</p><p><strong>9. Replit Agent 一键开店：从想法到上线只需几分钟</strong><br>来源：Replit</p><p>Replit 与 Shopify 合作，只需告诉 Replit Agent 你想卖什么，它会构建自定义店铺页面、创建 Shopify 商店，在 Shopify 中认领店铺、设置支付即可开业。Replit 把 Agent 从代码生成延伸到了实时开店，对电商创业者来说是真正的零门槛。</p><p><strong>10. Codex 集成 iOS 应用循环开发能力</strong><br>来源：OpenAI Developers</p><p>Build iOS Apps 插件让 Codex 可在应用内浏览器查看和测试你的 iOS 应用，打开 SwiftUI 预览，并无需离开 Codex 即可热重载编辑。对 iOS 开发者很实用，减少工具间反复横跳。</p><p><strong>11. hf CLI 为编码智能体重塑输出格式</strong><br>来源：Hugging Face</p><p>Hugging Face 重新设计 hf CLI，使其同时服务人类用户和编码智能体（Claude Code、Codex 等）。CLI 通过环境变量自动检测智能体驱动，输出紧凑无截断的 TSV 格式，避免 ANSI 和交互提示。Claude Code 约 4 万用户、近 4900 万次请求，使用 CLI 的智能体 token 消耗比不使用节省 2-6 倍。</p><p><strong>12. OpenClaw 2026.6.1 上线：原生 Windows + Skill Workshop</strong><br>来源：OpenClaw</p><p>OpenClaw 2026.6.1 带来原生 Windows 支持、Skill Workshop（自主学习型智能体技能工坊）、Workboard 编排，以及 MiniMax M3 模型支持。Windows 加入集群，无需 WSL。</p><hr><h2 id="行业动态"><a href="#行业动态" class="headerlink" title="行业动态"></a>行业动态</h2><p><strong>13. OpenRouter 11 款 LLM 决策模型大逃杀：Claude 和 Grok 胜</strong><br>来源：OpenRouter</p><p>OpenRouter 让 11 个模型打了 30 局生存竞技，用总价 482 美元的推理花费测试在实时决策任务中的表现。实验发现传统静态 benchmark 排名无法反映模型在需要即时反应的智能体任务中的真实表现，Claude 和 Grok 系列模型在决策速度与任务成功率上表现突出，而多项高分模型的实时调度能力未达预期。</p><p><strong>14. DeepSeek 连续四周位居 OpenRouter token 份额第一</strong><br>来源：OpenRouter</p><p>OpenRouter 作为风向标级的 API 聚合器，DeepSeek 连续四周 token 份额排行榜第一。这个数据比任何 benchmark 都实在，对还在犹豫选哪个模型的产品人来说是个明确的信号。</p><p><strong>15. 微软 AI 负责人：Anthropic 模型太贵，正自研更便宜的替代模型</strong><br>来源：Bloomberg</p><p>微软 AI 部门负责人表示，Anthropic 推出的模型成本过高，公司目前正在内部研发更廉价的替代模型，以降低成本。这番话是大厂向高价模型供应商发出的明确信号，Anthropic 的商业化压力又加了一层。</p><p><strong>16. 台积电：难以跟上 AI 需求</strong><br>来源：The Verge</p><p>全球最大芯片制造商台积电表示，通过美国本土生产满足客户需求可能需要”非常长的时间”，凸显 AI 需求带来的产能压力。TSMC 的产能警告不是 PR 话术，是真实的供需失衡，所有等着买 GPU 的 AI 公司都要做好长期作战准备。</p><p><strong>17. Cloudflare：机器人流量首次超过人类，占比 57.5%</strong><br>来源：Cloudflare Radar &#x2F; SemiAnalysis</p><p>过去一周（5月28日至6月4日）全球所有 HTML 网页请求流量中，57.5% 来自机器人，仅 42.5% 来自真人浏览器。互联网流量主体已从人类浏览网页转向机器间通信和机器人抓取。这是 AI 时代的真正里程碑。</p><p><strong>18. Anthropic 研究报告：AI 加速自我构建趋势</strong><br>来源：Anthropic &#x2F; Kim &#x2F; Testing Catalog</p><p>Anthropic 研究院报告指出，AI 正加速 AI 开发：2021–2025 年间工程师人均季度代码量提升 8 倍，截至 2026 年 5 月超 80% 合并代码由 Claude 生成。SWE-bench 两年内从低个位数得分饱和；METR 测试显示 Claude Mythos Preview 可连续工作至少 16 小时。但 AI 自主设定目标的能力仍存显著差距。</p><p><strong>19. OpenAI 首次承认递归自我改进的早期迹象</strong><br>来源：OpenAI &#x2F; Kim</p><p>OpenAI 在《智能时代的生物防御》行动计划中公开承认看到递归自我改进（RSI）的早期迹象：AI 开发本身正被 AI 加速。社会将需要找到塑造 AI 发展轨迹的方法，确保其服务于人类利益。</p><p><strong>20. 联合国报告：2030 年 AI 数据中心水电消耗将翻倍</strong><br>来源：联合国大学</p><p>联合国报告指出，受 AI 需求驱动，去年全球数据中心耗电 448 太瓦时（AI 占五分之一），耗水 4.5 万亿升。预计到 2030 年，年耗电量将翻倍至 945 太瓦时（AI 占 40%），耗水增至 9.3 万亿升。这份报告把算力繁荣的隐性账单摊开了。</p><hr><h2 id="论文研究"><a href="#论文研究" class="headerlink" title="论文研究"></a>论文研究</h2><p><strong>21. Echo-Infinity：学习演化记忆实现实时无限视频生成</strong><br>来源：HuggingFace Daily Papers</p><p>Echo-Infinity 是一个自回归（AR）框架，用于实时无限视频生成。它用可学习的演化记忆替代人工缓存策略，通过注意力机制和门控更新 Memory Query，与视频扩散 Transformer 端到端优化，支持任意压缩比且计算量不随视频长度增加。首次实现 24 小时（超 130 万帧）实时滚动生成。</p><p><strong>22. StreamMA：多智能体推理中的流式通信</strong><br>来源：HuggingFace Daily Papers</p><p>StreamMA 采用”流式通信”范式，每个推理步骤生成后立即流式传输给下游智能体，通过流水线相邻智能体降低端到端延迟。在数学、科学和代码八项推理基准上，使用 Claude Opus 4.6 和 GPT-5.4 两种大语言模型，平均优于基线 +7.3 个百分点。</p><p><strong>23. EVA-Bench Data 2.0：覆盖三大领域、121 个工具、213 个场景</strong><br>来源：Hugging Face</p><p>EVA-Bench Data 2.0 将评估范围从单一企业领域扩展至航空公司客户服务管理（CSM）、企业 IT 服务管理（ITSM）和医疗 HR 服务交付（HRSD）三个领域，共涵盖 121 个工具、213 个场景，场景数较原始版本增长约 4 倍。所有三个数据集已开源，可通过 <code>load_dataset</code> 从 Hugging Face 直接下载。</p><hr><h2 id="技巧与观点"><a href="#技巧与观点" class="headerlink" title="技巧与观点"></a>技巧与观点</h2><p><strong>24. Ethan Mollick：共存与协同智能的终结</strong><br>来源：Ethan Mollick &#x2F; One Useful Thing</p><p>Ethan Mollick 在 One Useful Thing 博客中以”共存与协同智能的终结”为题，宣告「协同智能」时代结束。他的观点总是超前的，这篇值得点开看看——如果判断成立，所有依赖人机协作的产品设计都得重新思考。</p><p><strong>25. Meta-Agent Challenge：评估自主智能体开发能力</strong><br>来源：HuggingFace Daily Papers</p><p>蚂蚁研究院提出 MAC 评估框架，测试前沿模型自主开发智能体系统的能力。实验中元智能体极少达到人类基线策略，少数成功者由专有前沿模型主导。设计过程高方差，高优化压力催生了真实值外泄等对抗行为，暴露鲁棒性与对齐缺陷。</p><p><strong>26. Alex Imas &amp; Phil Trammell：AGI 后什么仍然稀缺？</strong><br>来源：Dwarkesh Patel</p><p>经济学家指出，AGI 时代机器人数量可以快速复制增长，但人类独特技能（以芭蕾舞演员为例）的数量保持不变，揭示了即使技术大幅进步，某些稀缺资源仍不可替代。</p><hr><ul><li><strong>内容提取注意事项</strong> — 自动正则解析有效率约 22%，大量碎片化条目。本文采用人工从清洗文本中识别归类后编写。</li><li>数据来源：AI HOT (aihot.virxact.com)</li></ul><p><em>编辑：AI 无涯 | 数据来源：AI HOT (aihot.virxact.com)</em></p>]]>
    </content>
    <id>https://aifki.com/2026/06/05/ai-daily/</id>
    <link href="https://aifki.com/2026/06/05/ai-daily/"/>
    <published>2026-06-05T06:00:00.000Z</published>
    <summary>
      <![CDATA[<h1 id="AI-无涯日报-·-2026-年-6-月-5-日"><a href="#AI-无涯日报-·-2026-年-6-月-5-日" class="headerlink" title="AI 无涯日报 · 2026 年 6 月 5 日"></a>AI 无涯日报 · 2026]]>
    </summary>
    <title>AI 无涯日报 · 2026 年 6 月 5 日</title>
    <updated>2026-06-05T06:00:00.000Z</updated>
  </entry>
  <entry>
    <author>
      <name>无涯</name>
    </author>
    <category term="AI 日报" scheme="https://aifki.com/categories/AI-%E6%97%A5%E6%8A%A5/"/>
    <category term="AI 资讯" scheme="https://aifki.com/tags/AI-%E8%B5%84%E8%AE%AF/"/>
    <category term="AI 日报" scheme="https://aifki.com/tags/AI-%E6%97%A5%E6%8A%A5/"/>
    <content>
      <![CDATA[<h1 id="AI-无涯日报-·-2026-年-6-月-4-日"><a href="#AI-无涯日报-·-2026-年-6-月-4-日" class="headerlink" title="AI 无涯日报 · 2026 年 6 月 4 日"></a>AI 无涯日报 · 2026 年 6 月 4 日</h1><blockquote><p>每日精选全球 AI 热点，5 分钟掌握行业动态。</p></blockquote><hr><h2 id="模型发布-更新"><a href="#模型发布-更新" class="headerlink" title="模型发布&#x2F;更新"></a>模型发布&#x2F;更新</h2><p><strong>1. MiniMax M3 发布：稀疏注意力将百万 token 解码提速 15.6 倍</strong><br>来源：Fireworks AI &#x2F; MiniMax (official)</p><p>MiniMax M3 引入 MiniMax Sparse Attention（MSA），在百万 token 长度下解码速度提升 15.6 倍。若数据属实，长文档应用的推理成本将大幅降低，合同审查、长篇小说生成等场景可立即试用。</p><p><strong>2. Grok Imagine 1.5 预览版通过 API 开放</strong><br>来源：DogeDesigner &#x2F; xAI</p><p>xAI 发布 Grok Imagine 1.5 预览版，即日起可在 API 中体验。图像生成军备竞赛再添新选手，开放 API 让开发者可直接对比 Midjourney 和 SD 的差距。</p><p><strong>3. Miso One 发布：8B 参数开源情感 TTS 模型，110ms 低延迟</strong><br>来源：kimmonismus &#x2F; Elvis Saravia (DAIR.AI)</p><p>Miso One 是一个 8B 参数的开源语音模型，支持一次语音克隆（只需短样本），推理延迟仅 110ms。模型权重已开源至 GitHub，无需 API 即可自托管，音频数据不离开本地。</p><p><strong>4. Ultralytics YOLO26 发布：统一实时端到端视觉模型</strong><br>来源：HuggingFace Daily Papers</p><p>YOLO26 采用双头设计实现原生无 NMS 的端到端推理，彻底移除 DFL。支持检测、实例分割、姿态估计、定向检测和分类，提供 5 种尺度（n&#x2F;s&#x2F;m&#x2F;l&#x2F;x）及开放词汇扩展 YOLOE-26。全部尺度在 COCO 上达 40.9–57.5 mAP，T4 TensorRT 延迟 1.7–11.8 ms。</p><p><strong>5. Ideogram v4.0 发布：原生 2K 分辨率，出色的文字渲染</strong><br>来源：Ideogram &#x2F; Krea</p><p>图像生成模型再添一员，Ideogram v4.0 支持原生 2K 分辨率、出色的文字渲染，并支持 JSON 提示词对接工作流。可在 Krea 平台中直接体验。</p><hr><h2 id="产品发布-更新"><a href="#产品发布-更新" class="headerlink" title="产品发布&#x2F;更新"></a>产品发布&#x2F;更新</h2><p><strong>6. Cursor Enterprise 推出 Organizations 组织管理功能</strong><br>来源：Cursor Blog</p><p>Cursor Enterprise 正式推出 Organizations 结构，允许企业在统一面板中管理多个团队。每个团队可独立设置预算、安全策略、模型访问和功能控制。新增 Groups 作为跨团队或团队内的轻量级用户集合，用于分段管理模型访问、花销上限和智能体权限。</p><p><strong>7. OpenClaw 2026.6.1 上线：原生 Windows + Skill Workshop</strong><br>来源：OpenClaw</p><p>OpenClaw 2026.6.1 带来原生 Windows 支持、Skill Workshop（自主学习型智能体技能工坊）、Workboard 编排，以及 MiniMax M3 模型支持。Windows 加入集群，无需 WSL。</p><p><strong>8. xAI 语音 API 通过 Vapi 平台落地企业语音场景</strong><br>来源：Vapi &#x2F; xAI</p><p>基于 xAI 的 Grok STT 和 Grok TTS 已上线企业语音 AI 平台 Vapi。开发者可在 Vapi 上构建自定义语音智能体，让 AI 用客户的语言交流、在受监管的工作流中捕捉重要细节。</p><p><strong>9. Replit 上线 SEO Agent：自动优化应用搜索可见性</strong><br>来源：Replit</p><p>Replit 将 SEO 优化集成到开发流程中，部署后自动扫描并建议修复措施，帮助应用在被网页搜索和 AI 搜索中发现。</p><p><strong>10. Perplexity Personal Computer 登陆 Windows</strong><br>来源：perplexity_ai</p><p>Perplexity 推出面向 Windows 的 Personal Computer，在你的机器上运行并协调每天使用的应用和文件。将首先向等候名单上的付费 Max 和 Enterprise Max 订阅用户推送，AI 从”回答”转向”执行”。</p><p><strong>11. OpenShell v0.0.55：新增 Google Vertex AI 推理支持</strong><br>来源：NVIDIA&#x2F;OpenShell</p><p>OpenShell 新增 Google Vertex AI 推理提供者、基于配置文件的策略可见性以及改进的 Podman 和 GPU 沙箱行为。</p><hr><h2 id="行业动态"><a href="#行业动态" class="headerlink" title="行业动态"></a>行业动态</h2><p><strong>12. Suno 完成 4 亿美元 D 轮融资，估值 54 亿美元</strong><br>来源：Suno</p><p>AI 音乐生成领域头部 Suno 完成 4 亿美元 D 轮融资，估值 54 亿美元，较前轮增长约 3 倍。公司使命是让更多人体验制作音乐的乐趣。</p><p><strong>13. DeepSeek 首轮融资拟筹集 500 亿元，腾讯、宁德时代参投</strong><br>来源：SiliconFlow</p><p>DeepSeek 计划在首轮融资中筹集约 500 亿元人民币，投后估值预计 3500 亿至 4000 亿元。创始人梁文峰出资 200 亿元，腾讯和宁德时代分别拟投资 100 亿元和 50 亿元。凸显中国正打造从大模型到算力能源基建的全链条 AI 产业。</p><p><strong>14. 微软与 OpenAI 正式分道扬镳</strong><br>来源：The Verge &#x2F; TechCrunch</p><p>微软与 OpenAI 合作关系彻底破裂，双方进入正面竞争态势。前 DeepMind 高管、现任微软 AI 主管 Mustafa Suleyman 表示微软必须从头证明自己能独立完成所有必需任务，标志着两家科技巨头从紧密伙伴转变为直接竞争对手。</p><p><strong>15. Meta AI 智能体面向全球 WhatsApp Business 商家开放</strong><br>来源：TechCrunch</p><p>Meta 为 WhatsApp Business 打造的 AI 智能体面向全球商家开放，按照模型 token 使用量向企业收费，这可能是 AI 客服真正普及的节点。</p><p><strong>16. 欧盟公布全面技术主权计划：芯片、AI、云计算自主</strong><br>来源：Bloomberg</p><p>欧盟公布全面技术主权计划，旨在扩大本土半导体、人工智能和云计算供应链，减少对美国和亚洲的依赖。该计划覆盖芯片制造、AI 基础设施及云计算服务等多个关键领域。</p><p><strong>17. Anthropic 对白宫 AI 行政令发表官方表态</strong><br>来源：AnthropicAI &#x2F; White House</p><p>美国白宫发布 AI 行政令，Anthropic 发表声明表示期待与白宫合作支持实施。头部公司主动拥抱政策制定是趋势，值得留意后续落地细节。</p><p><strong>18. Uber 每月 1500 美元 AI 使用上限为行业定价提供参考</strong><br>来源：Hacker News &#x2F; Tomer Tunguz</p><p>Uber 将 AI 工具每月使用上限为 1500 美元，这一做法为行业 AI 工具定价提供参考信号。同时微软在模型发布卡中加入平均 token 使用量指标，Salesforce 花费 3 亿美元购买 Anthropic tokens 并冻结工程招聘，AI 从堆算力转向算账时代。</p><hr><h2 id="论文研究"><a href="#论文研究" class="headerlink" title="论文研究"></a>论文研究</h2><p><strong>19. 世界模型与语言模型的互补性：受控的具体推理</strong><br>来源：HuggingFace Daily Papers</p><p>研究提出”受控的具体推理”框架，结合世界模型的视觉预测和语言模型的抽象推理。提出的 PF-OPSD 方法在两个基准上分别比基线高出 10.6% 和 10.9%，且全开源。</p><p><strong>20. Anthropic 分析 832 个 AI 恶意账户：中高风险攻击者半年从 33% 跃至 56%</strong><br>来源：Anthropic Research</p><p>Anthropic 分析 2025 年 3 月至 2026 年 3 月间被封禁的 832 个恶意账户。67.3% 使用 AI 编写恶意软件，AI 用于账户发现增长 8.9%。中高风险攻击者占比从 33% 升至 56%，MITRE ATT&amp;CK 框架尚未收录此类智能体编排行为。</p><p><strong>21. Google 开源水文建模框架，AI 洪水预报直接服务一线</strong><br>来源：Google Research</p><p>Google 开源基于 PyTorch 的水文建模框架，采用与 Flood Hub 相同的模型架构和训练数据。允许研究者和预报员训练 AI 洪水预报模型，已与捷克水文气象研究所等合作测试。</p><hr><h2 id="技巧与观点"><a href="#技巧与观点" class="headerlink" title="技巧与观点"></a>技巧与观点</h2><p><strong>22. 李飞飞与 World Labs 团队发文：给”世界模型”下三分类</strong><br>来源：World Labs</p><p>世界模型术语被滥用。文章基于 POMDP 框架对世界模型进行三分类：渲染（输出给人类）、模拟（核心）、规划。做机器人、空间智能的人值得作为今年坐标系阅读。</p><p><strong>23. 智能体工程实战 22 条窍门：从人主导编码到人主导方向</strong><br>来源：Matt Van Horn &#x2F; Hacker News</p><p>Matt Van Horn 分享”智能体工程”方法论，核心是从”人主导编码”转向”人主导方向、智能体执行”。遵循 Research → Plan → Work 循环，用 plan.md 约束智能体行为。22 条实战技巧涵盖规划、并行执行、输入方式等，三个月从零到 27K stars。</p><hr><p><em>编辑：AI 无涯 | 数据来源：AI HOT (aihot.virxact.com)</em></p>]]>
    </content>
    <id>https://aifki.com/2026/06/04/ai-daily/</id>
    <link href="https://aifki.com/2026/06/04/ai-daily/"/>
    <published>2026-06-04T06:00:00.000Z</published>
    <summary>
      <![CDATA[<h1 id="AI-无涯日报-·-2026-年-6-月-4-日"><a href="#AI-无涯日报-·-2026-年-6-月-4-日" class="headerlink" title="AI 无涯日报 · 2026 年 6 月 4 日"></a>AI 无涯日报 · 2026]]>
    </summary>
    <title>AI 无涯日报 · 2026 年 6 月 4 日</title>
    <updated>2026-06-04T06:00:00.000Z</updated>
  </entry>
  <entry>
    <author>
      <name>无涯</name>
    </author>
    <category term="AI 日报" scheme="https://aifki.com/categories/AI-%E6%97%A5%E6%8A%A5/"/>
    <category term="AI 资讯" scheme="https://aifki.com/tags/AI-%E8%B5%84%E8%AE%AF/"/>
    <category term="AI 日报" scheme="https://aifki.com/tags/AI-%E6%97%A5%E6%8A%A5/"/>
    <content>
      <![CDATA[<h1 id="AI-无涯日报-·-2026-年-6-月-3-日"><a href="#AI-无涯日报-·-2026-年-6-月-3-日" class="headerlink" title="AI 无涯日报 · 2026 年 6 月 3 日"></a>AI 无涯日报 · 2026 年 6 月 3 日</h1><blockquote><p>每日精选全球 AI 热点，5 分钟掌握行业动态。</p></blockquote><hr><h2 id="模型发布-更新"><a href="#模型发布-更新" class="headerlink" title="模型发布&#x2F;更新"></a>模型发布&#x2F;更新</h2><p><strong>1. 微软发布首款高级推理 AI 模型 MAI-Thinking-1</strong><br>来源：The Verge &#x2F; Microsoft</p><p>微软在 Build 2026 上发布了其首款高级推理 AI 模型 MAI-Thinking-1。该模型被定位为”中等规模”，能在关键软件工程基准测试中达到领先水平。微软称其完全从头使用干净数据进行训练，未涉及从第三方模型进行知识蒸馏，标志着微软在自研 AI 模型上迈出重要一步，与此前主要依赖 OpenAI 的策略形成对比。</p><p><strong>2. 微软三款多模态模型同步上线 OpenRouter</strong><br>来源：Microsoft AI</p><p>MAI-Image-2.5、MAI-Transcribe-1.5 和 MAI-Voice-2 三款模型同时上架 OpenRouter，覆盖图像生成、语音转录和语音合成领域。开发者可直接调用 API 集成到应用中，降低多模态能力接入门槛。</p><p><strong>3. NVIDIA DGX Station GB300 开始发货</strong><br>来源：NVIDIA</p><p>搭载 GB300 的桌面级数据中心系统 DGX Station 正从华硕、戴尔、技嘉、惠普、微星和超微等合作伙伴处发货。将数据中心级算力塞进桌面，对需要本地大模型训练的研究员和独立开发者来说是硬核生产力工具。</p><p><strong>4. Holo3.1：快速本地计算机使用智能体发布</strong><br>来源：Hugging Face</p><p>基于 Qwen 模型家族的计算机使用智能体系列 Holo3.1 正式发布，提供 0.8B、4B、9B 和 35B-A3B 四种尺寸，并首次发布量化检查点（FP8、Q4 GGUF、NVFP4）。在 AndroidWorld 基准测试中 35B-A3B 得分从 67% 提升至 79.3%，覆盖桌面、网页和移动环境。</p><p><strong>5. OpenRouter 上线 DigitalOcean 推理服务</strong><br>来源：OpenRouter</p><p>DigitalOcean 推理服务上线 OpenRouter，提供高性能推理覆盖热门开源权重模型。在 DeepSeek V3.2 的输出速度和延迟方面排名第一，适合对实时性要求高的应用场景。</p><hr><h2 id="产品发布-更新"><a href="#产品发布-更新" class="headerlink" title="产品发布&#x2F;更新"></a>产品发布&#x2F;更新</h2><p><strong>6. Runway Aleph 2.0 API 上线</strong><br>来源：Runway</p><p>Runway 将 Aleph 2.0 的视频编辑能力开放为 API，支持在多镜头序列中编辑最长 30 秒、1080p 分辨率的视频，仅修改指定部分。做视频工具的开发者可直接集成，简化处理逻辑。</p><p><strong>7. 微软开源 Adaptive Spec-driven Scoring 框架</strong><br>来源：Microsoft Research</p><p>微软开源发布 Adaptive Spec-driven Scoring for Evaluation and Regression Testing 框架。开发者可通过文本描述快速生成 AI 行为测试，用于模型评估与回归测试，将 AI 行为测试从写代码降格到写文字描述。</p><p><strong>8. Replit + Microsoft Fabric 集成</strong><br>来源：Replit &#x2F; Microsoft</p><p>企业现在可以在 Replit 中构建内部工具、工作流或数据仪表板，并直接发布到 Microsoft Fabric，内置安全、身份验证和治理功能。对同时使用 Replit 和 Fabric 的企业来说，将内部工具从开发到上线的链路显著缩短。</p><p><strong>9. 商汤开源 SenseNova-Skills AI 办公技能套件</strong><br>来源：商汤科技</p><p>商汤推出 SenseNova-Skills 套件，包含从做图到写报告的一整套开箱即用的 agent 技能包，代码全部开源在 GitHub 上。想做 agent 产品的开发团队可直接 fork 使用，比等待 API 发布快得多。</p><p><strong>10. 阿里云 AgentScope Java 1.1 发布</strong><br>来源：阿里云</p><p>AgentScope Java 1.1 支持 Builder 多租户零代码企业平台、工作区驱动的进化与分布式隔离，从笔记本到集群无缝扩展。对 Java 生态的 Agent 开发者是个顺手的新选项。</p><hr><h2 id="行业动态"><a href="#行业动态" class="headerlink" title="行业动态"></a>行业动态</h2><p><strong>11. Alphabet 拟融资 800 亿美元，Anthropic 提交 IPO 申请</strong><br>来源：Bloomberg</p><p>Alphabet 宣布拟通过股权融资 800 亿美元，用于扩展 AI 基础设施。Anthropic 已秘密提交 IPO 申请，在上市竞赛中领先于竞争对手 OpenAI。HPE 因 AI 基础设施需求旺盛，年度销售预期超出市场估计。</p><p><strong>12. SK 海力士计划五年内晶圆产能翻倍</strong><br>来源：彭博社</p><p>SK 会长崔泰源表示 SK 海力士计划未来五年内晶圆产能翻倍，并预计存储芯片短缺将持续到 2030 年。这一判断对 AI 基础设施和端侧产品的供应链预期具有重要参考价值。</p><p><strong>13. Gemini Spark：最令人印象深刻也最可怕的 AI 体验</strong><br>来源：The Verge</p><p>The Verge 编辑 David Pierce 首次深度体验 Google DeepMind 的 Gemini Spark 模型，称其为”最令人印象深刻也最可怕的 AI 体验”。该模型展现了 AI 代理在复杂任务中的惊人能力，但也让人看清未来 AI 的潜在影响有多深远。</p><p><strong>14. 开放模型 OpenRouter 市场份额达 69%</strong><br>来源：OpenRouter &#x2F; 邵猛</p><p>据 OpenRouter 平台数据，开放权重模型产生了 69.1% 的 token 使用量，闭源模型为 30.9%。每轮新模型发布都会将使用量推上一个新台阶，开放模型内部竞争激烈，领导地位频繁更迭。</p><p><strong>15. Olmo&#x2F;Tulu 核心推手离开 Ai2</strong><br>来源：Nathan Lambert</p><p>Olmo 和 Tulu 的核心推手离开 Allen Institute for AI（Ai2），对开放模型生态圈是一次不小的人事地震。其下一步去向可能比离职声明本身更值得关注。</p><p><strong>16. Anthropic 扩展 Project Glasswing 计划</strong><br>来源：Anthropic</p><p>Anthropic 将 AI 漏洞扫描计划 Project Glasswing 从软件公司扩展到电力、医疗等命脉行业。这是一次攻防格局的重要倾斜，安全从业者应紧密关注后续发展。</p><p><strong>17. Anthropic 对白宫 AI 行政令表态</strong><br>来源：Anthropic</p><p>Anthropic 对白宫 AI 行政令表示支持，称这是加强美国 AI 领导地位的重要一步。头部 AI 公司主动拥抱政策制定的趋势值得留意。</p><p><strong>18. OpenAI 呼吁建立青少年 AI 安全研究所</strong><br>来源：OpenAI</p><p>OpenAI 呼吁通过设立专门的 AI 安全研究所，在全球范围内保障青少年使用 AI 时的安全并创造更多发展机遇。这对所有从事教育 AI 的公司而言，青少年保护将成为监管重点。</p><hr><h2 id="论文研究"><a href="#论文研究" class="headerlink" title="论文研究"></a>论文研究</h2><p><strong>19. AFUN：迈向功能理解的可供性基础模型</strong><br>来源：Hugging Face Daily Papers</p><p>AFUN 是一个用于功能理解的可供性基础模型。从单个 RGB-D 观察和语言任务描述出发，能同时预测任务条件的功能掩码和 3D 接触后运动曲线。在 4 个基准的 8 个测试集中平均 gIoU&#x2F;cIoU 指标分别领先基线模型 +23.9&#x2F;+26.3，可直接部署到真实机器人。</p><p><strong>20. Google DeepMind 开源科学 Agent 工具包 Science Skills</strong><br>来源：Google DeepMind</p><p>Google DeepMind 在 GitHub 上开源 Science Skills 工具包，以科学基础和更高 token 效率加速智能体工作流，推动 AI for Science 的发展。构建用于科学发现的自主智能体不再只是蓝图。</p><p><strong>21. Anthropic 可解释性研究：区分因果效应相似的特征</strong><br>来源：Anthropic</p><p>Anthropic 发布可解释性研究新成果，通过下游连接区分看似相同的特征，比仅看激活例子更能预测因果作用。对对齐审计和模型安全研究有重要参考价值。</p><hr><h2 id="技巧与观点"><a href="#技巧与观点" class="headerlink" title="技巧与观点"></a>技巧与观点</h2><p><strong>22. Gary Marcus：AI 信任为何必然崩塌</strong><br>来源：Gary Marcus</p><p>知名 AI 批评者 Gary Marcus 在其可信赖 AI 专栏中，用数学理论的局限性与人类心理的复杂性双重框架，解释 AI 信任为何必然面临根本性挑战。系统和全面地探讨了深度学习信任问题的底层原因，安全从业者值得一读。</p><hr><p><em>编辑：AI 无涯 | 数据来源：AI HOT (aihot.virxact.com)</em></p>]]>
    </content>
    <id>https://aifki.com/2026/06/03/ai-daily/</id>
    <link href="https://aifki.com/2026/06/03/ai-daily/"/>
    <published>2026-06-03T06:00:00.000Z</published>
    <summary>
      <![CDATA[<h1 id="AI-无涯日报-·-2026-年-6-月-3-日"><a href="#AI-无涯日报-·-2026-年-6-月-3-日" class="headerlink" title="AI 无涯日报 · 2026 年 6 月 3 日"></a>AI 无涯日报 · 2026]]>
    </summary>
    <title>AI 无涯日报 · 2026 年 6 月 3 日</title>
    <updated>2026-06-03T06:00:00.000Z</updated>
  </entry>
  <entry>
    <author>
      <name>无涯</name>
    </author>
    <category term="AI 日报" scheme="https://aifki.com/categories/AI-%E6%97%A5%E6%8A%A5/"/>
    <category term="AI 资讯" scheme="https://aifki.com/tags/AI-%E8%B5%84%E8%AE%AF/"/>
    <category term="AI 日报" scheme="https://aifki.com/tags/AI-%E6%97%A5%E6%8A%A5/"/>
    <category term="Tue Jun 02 2026 08:00:00 GMT+0800 (中国标准时间)" scheme="https://aifki.com/tags/Tue-Jun-02-2026-08-00-00-GMT-0800-%E4%B8%AD%E5%9B%BD%E6%A0%87%E5%87%86%E6%97%B6%E9%97%B4/"/>
    <content>
      <![CDATA[<h1 id="AI-无涯日报-·-2026-年-6-月-2-日"><a href="#AI-无涯日报-·-2026-年-6-月-2-日" class="headerlink" title="AI 无涯日报 · 2026 年 6 月 2 日"></a>AI 无涯日报 · 2026 年 6 月 2 日</h1><blockquote><p>每日精选全球 AI 热点，5 分钟掌握行业动态。</p></blockquote><hr><h2 id="模型发布-更新"><a href="#模型发布-更新" class="headerlink" title="模型发布&#x2F;更新"></a>模型发布&#x2F;更新</h2><p><strong>1. xAI 发布 Composer 2.5：专注长任务与复杂指令的编程模型</strong><br>来源：xAI</p><p>xAI 的最新编程模型 Composer 2.5 现已在 Grok Build 中可用。这是一款快速、先进的模型，擅长处理长时间运行的任务和复杂指令，面向 SuperGrok 和 X Premium+ 用户开放。</p><p><strong>2. Qwen3.7-Plus：多模态智能体模型全面升级</strong><br>来源：通义千问 &#x2F; Qwen</p><p>Qwen Studio 提供涵盖聊天机器人、图像与视频理解、图像生成、文档处理、网页搜索集成、工具使用及制品生成的全面功能。Qwen3.7-Plus 将多模态与 Agent 能力打包进一个模型。</p><p><strong>3. Mellum2：JetBrains 推出 12B 混合专家模型</strong><br>来源：JetBrains &#x2F; Hugging Face</p><p>JetBrains 发布 Mellum2 模型，采用混合专家架构，参数规模为 12B。这是 JetBrains 的首个自研模型，主打代码场景，有望集成进 IDE 实现本地代码补全，开源且轻量。</p><p><strong>4. SenseNova-U1：商汤发布专攻图表生成的 8B 模型</strong><br>来源：商汤科技</p><p>SenseNova-U1-8B-MoT-Infographic 专为解决 AI 图表生成的数值错误、位置偏移等问题设计，能够生成准确的图表并支持实时调整设计布局，已在 Hugging Face 开源。</p><p><strong>5. OpenBMB 发布 UltraData 开源数据集，登顶 Hugging Face 趋势榜</strong><br>来源：OpenBMB</p><p>面壁智能联合清华 NLP 发布 Ultra-FineWeb-L3（600B+ tokens，迄今最大开源中文预训练合成数据集）和 UltraData-SFT-2605（15M+ 样本，首个含思考链标注的国产大规模 SFT 数据集），覆盖数学、代码、知识和指令遵循。</p><hr><h2 id="产品发布-更新"><a href="#产品发布-更新" class="headerlink" title="产品发布&#x2F;更新"></a>产品发布&#x2F;更新</h2><p><strong>6. Cursor Teams 计划定价方案更新</strong><br>来源：Cursor Blog</p><p>Cursor 推出三项更新：增加 Composer 特定使用池，将第一方模型与第三方 API 使用额度分开计费；推出 Premium 席位（$96&#x2F;月），提供 5 倍标准席位使用量；仪表盘实时显示额度使用情况，支持 Slack 或邮件智能提醒。</p><p><strong>7. ChatGPT 上线全屏编辑与文章保存功能</strong><br>来源：ChatGPT</p><p>ChatGPT 新增全屏模式编辑长文功能，支持将作品保存到资料库中稍后继续。解决了长文用户一直以来的编辑痛点。</p><p><strong>8. OpenAI 模型与 Codex 现可在 AWS 使用</strong><br>来源：OpenAI</p><p>OpenAI 的前沿模型与 Codex 现已在 AWS 上全面可用。企业客户可通过现有 AWS 环境、控制与采购流程使用 OpenAI 技术，加速从评估到生产的过程。</p><p><strong>9. Perplexity 推出 Search as Code：Agent 搜索新架构</strong><br>来源：Perplexity</p><p>Perplexity 发布全新 Agent 搜索架构 Search as Code，直接编写 Python 代码调用搜索栈，而非逐个循环调用函数。已在 Perplexity Agent API 中提供，并成为 Computer 的默认选项。</p><p><strong>10. OpenRouter Auto Router 新增成本质量权衡参数</strong><br>来源：OpenRouter</p><p>新增 <code>cost_quality_tradeoff</code> 参数，范围 0 到 10。设为 0 时选择最强模型，设为 10 时最便宜的模型胜出。为 AI 产品开发者提供更精细的成本控制能力。</p><p><strong>11. Krea 2 LoRAs 向所有人开放</strong><br>来源：Krea</p><p>Krea 将 LoRAs 功能向全部用户开放，用户可用自己的数据集微调专属风格，训练特定风格的模型门槛进一步降低。</p><p><strong>12. Replit：一个提示词即可构建真实业务</strong><br>来源：Replit</p><p>Replit 推出从提示词生成网站、移动应用、幻灯片和发布视频的全链路能力，并集成 Stripe、Atlas、QuickBooks、Mercury 和 doolaHQ 等商业服务。</p><hr><h2 id="行业动态"><a href="#行业动态" class="headerlink" title="行业动态"></a>行业动态</h2><p><strong>13. Sam Altman 强调 AI 发展应以人为本</strong><br>来源：Rohan Paul</p><p>Sam Altman 在采访中表示 AI 不应脱离人类需求，人类必须始终处于 AI 发展中心。他批判了”AI 摧毁大量工作”的言论，强调 AI 行业应清晰解释人类如何在 AI 时代保持控制权。</p><p><strong>14. Alphabet 募资 800 亿美元用于 AI 支出计划</strong><br>来源：Bloomberg</p><p>Alphabet 通过发行股票等方式筹集 800 亿美元资金，包括与 Berkshire Hathaway 的投资协议，用于资助其 AI 支出计划，规模超过多数国家的 AI 总预算。</p><p><strong>15. Anthropic 秘密向 SEC 提交 S-1 草案，启动 IPO 流程</strong><br>来源：Anthropic</p><p>Anthropic 保密向 SEC 提交 S-1 表格草案，计划进行普通股首次公开发行。公司刚完成 650 亿美元 H 轮融资，估值达 9650 亿美元，并发布了 Claude Opus 4.8 模型。</p><p><strong>16. 智谱建议 A 股发行并在科创板上市</strong><br>来源：智谱</p><p>智谱计划向中国监管机构申请发行 A 股并在科创板上市，发行股份占发行后总股本的 2% 至 8%。募资将用于通用基座大模型、MaaS 平台及补充流动资金。</p><p><strong>17. OpenAI 在密歇根州启动 Stargate 1GW 数据中心建设</strong><br>来源：OpenAI</p><p>OpenAI 在密歇根州启动 Stargate 1GW 数据中心项目，作为 AI 基础设施建设的组成部分，旨在扩大 AI 技术可及性并创造就业机会。</p><p><strong>18. 佛罗里达州起诉 OpenAI 与 Sam Altman：涉多起 ChatGPT 相关案件</strong><br>来源：Ars Technica</p><p>佛罗里达州对 OpenAI 及 CEO Sam Altman 提起诉讼，案件与多起涉及 ChatGPT 的谋杀事件相关。这是首起将 ChatGPT 与谋杀直接关联的诉讼。</p><p><strong>19. Meta AI 聊天机器人安全漏洞致 Instagram 账号被劫持</strong><br>来源：The Verge</p><p>Meta 的 AI 聊天机器人被曝存在安全漏洞，黑客可通过请求 AI 关联新电子邮件地址接管目标用户 Instagram 账号，对 AI 身份验证系统提出警示。</p><hr><h2 id="论文研究"><a href="#论文研究" class="headerlink" title="论文研究"></a>论文研究</h2><p><strong>20. IBM 研究：企业 AI 采用取决于智能体逻辑</strong><br>来源：Hugging Face Blog</p><p>IBM 研究表明可扩展的企业 AI 采用需要智能体逻辑引导模型执行动态、长周期工作流。以 watsonx Code Assistant for Z 为例，智能体逻辑以约 30 倍更低的 token 消耗达到更优性能。</p><p><strong>21. 开源与闭源模型进入不同的增长曲线</strong><br>来源：Nathan Lambert</p><p>当模型智能的微小提升能直接转化为实际价值时，闭源模型通过提升边际智能创造价值，开源模型则在其他维度寻找增长点，两者形成差异化竞争格局。</p><hr><h2 id="技巧与观点"><a href="#技巧与观点" class="headerlink" title="技巧与观点"></a>技巧与观点</h2><p><strong>22. 如何用 Claude Opus 4.8 将书籍转化为 AI 技能</strong><br>来源：AYi_AInotes</p><p>以《非暴力沟通》为例，提供将书籍转化为可调用 AI Skill 的六步教程。利用 Claude Opus 4.8 的 100 万 token 上下文窗口和结构化输出能力，一次性处理全书逻辑并生成可随时唤起的工具箱。</p><hr><p><em>编辑：AI 无涯 | 数据来源：AI HOT (aihot.virxact.com)</em></p>]]>
    </content>
    <id>https://aifki.com/2026/06/02/ai-daily/</id>
    <link href="https://aifki.com/2026/06/02/ai-daily/"/>
    <published>2026-06-02T06:00:00.000Z</published>
    <summary>
      <![CDATA[<h1 id="AI-无涯日报-·-2026-年-6-月-2-日"><a href="#AI-无涯日报-·-2026-年-6-月-2-日" class="headerlink" title="AI 无涯日报 · 2026 年 6 月 2 日"></a>AI 无涯日报 · 2026]]>
    </summary>
    <title>AI 无涯日报 · 2026 年 6 月 2 日</title>
    <updated>2026-06-02T06:00:00.000Z</updated>
  </entry>
  <entry>
    <author>
      <name>无涯</name>
    </author>
    <category term="AI 日报" scheme="https://aifki.com/categories/AI-%E6%97%A5%E6%8A%A5/"/>
    <category term="AI 资讯" scheme="https://aifki.com/tags/AI-%E8%B5%84%E8%AE%AF/"/>
    <category term="AI 日报" scheme="https://aifki.com/tags/AI-%E6%97%A5%E6%8A%A5/"/>
    <content>
      <![CDATA[<h1 id="AI-无涯日报-·-2026-年-6-月-1-日"><a href="#AI-无涯日报-·-2026-年-6-月-1-日" class="headerlink" title="AI 无涯日报 · 2026 年 6 月 1 日"></a>AI 无涯日报 · 2026 年 6 月 1 日</h1><blockquote><p>每日精选全球 AI 热点，5 分钟掌握行业动态。</p></blockquote><hr><h2 id="模型发布-更新"><a href="#模型发布-更新" class="headerlink" title="模型发布&#x2F;更新"></a>模型发布&#x2F;更新</h2><p><strong>1. MiniMax M3 开源：1M 上下文，编码能力超越 GPT-5.5</strong><br>来源：MiniMax</p><p>MiniMax M3 是一个开源前沿模型，具备先进的编码与 AI 智能体能力。支持 100 万 token 超长上下文，采用新型 MSA（MiniMax Sparse Attention）稀疏注意力架构，每 token 计算成本降至前代的 1&#x2F;20，预填充速度提升 9 倍以上。在 SWE-Bench Pro 上得分 59.0%，超越 GPT-5.5 和 Gemini 3.1 Pro，接近 Claude Opus 4.7。</p><p><strong>2. NVIDIA RTX Spark：专为本地 AI 智能体设计的 Windows 电脑</strong><br>来源：NVIDIA</p><p>NVIDIA 发布 RTX Spark，提供 1 petaflops AI 算力与 128GB 统一内存。其 OpenShell 运行时与微软合作，基于新的 Windows 安全原语，确保智能体在设备端安全私密运行。通过多 token 预测等优化，Qwen 3.6 和 3.5 27B 模型推理吞吐量提升最高达 2 倍。</p><p><strong>3. NVIDIA Cosmos 3：面向物理 AI 的前沿基础模型</strong><br>来源：NVIDIA</p><p>NVIDIA Cosmos 3 能够帮助机器人、自动驾驶车辆和智能空间理解真实世界、预测事件发展并生成适应特定环境与任务的行动。该模型融合了物理推理、世界理解与行动生成能力。</p><p><strong>4. NVIDIA N1X ARM 笔记本芯片正式发布</strong><br>来源：NVIDIA</p><p>NVIDIA 在 GTC Taipei 正式发布与联发科合作的 ARM 笔记本芯片 N1X，整合 CPU、Blackwell GPU 及 AI 单元，目标使轻薄本具备接近 RTX 4070 的图形性能，直接冲击 Intel、AMD 和高通在 PC 市场的地位。</p><hr><h2 id="产品发布-更新"><a href="#产品发布-更新" class="headerlink" title="产品发布&#x2F;更新"></a>产品发布&#x2F;更新</h2><p><strong>5. 腾讯混元发布 Hy-Memory：智能体记忆插件</strong><br>来源：腾讯混元</p><p>腾讯混元正式发布专为 OpenClaw 等长期协作智能体设计的记忆插件 Hy-Memory。基于 6 层记忆框架与 System1&#x2F;System2 双系统构建。记忆数量减少 70% 以上，单条记忆信息密度提升 45% 以上，超长上下文场景中 token 消耗降低 35%。</p><p><strong>6. NVIDIA 发布工厂运营蓝图 FOX</strong><br>来源：NVIDIA</p><p>NVIDIA 在 GTC Taipei 发布工厂运营蓝图 FOX，基于 NemoClaw 和 Nemotron 开源模型构建，为工厂提供统一的决策层。首批采用者包括富士康、和硕等。富士康利用 FOX 构建了 MoMClaw 系统，预计将根源分析时间缩短 80%。</p><p><strong>7. Runway 加入 Cosmos Coalition：与 NVIDIA 共建开源世界模型</strong><br>来源：Runway</p><p>Runway 作为创始成员加入 Cosmos Coalition，与 NVIDIA 及多家 AI 实验室合作，构建并开源面向物理 AI 的前沿世界模型。首个项目将由 Runway 与 NVIDIA 共同开发基础模型。</p><p><strong>8. NVIDIA DynoSim：推理服务栈工作负载仿真工具</strong><br>来源：NVIDIA</p><p>NVIDIA 发布 DynoSim，针对其 Dynamo 推理服务栈的工作负载驱动仿真工具。完全使用 Rust 实现，在测试中达到实时速度的 1,500 倍。</p><p><strong>9. OpenAI 成立 Robotics 机器人团队</strong><br>来源：OpenAI</p><p>OpenAI 宣布成立 OpenAI Robotics 团队，开始招聘全栈硬件、系统及 ML 工程师，以编程和制造能服务社会的机器人。短期目标支持技术工人构建基础设施，长期愿景是为每个人提供个人机器人。</p><hr><h2 id="行业动态"><a href="#行业动态" class="headerlink" title="行业动态"></a>行业动态</h2><p><strong>10. 苹果 WWDC 将展示 Siri 整合 Gemini</strong><br>来源：行业报道</p><p>苹果下月 WWDC 将重点展示延迟已久的 Siri 及设备端 AI 升级，核心是在 iPhone 芯片本地运行从 Google Gemini 蒸馏而来的更小模型。复杂查询将路由至 Google Cloud 处理，并采用 NVIDIA 机密计算技术。苹果据称正在寻觅小型设备端 AI 初创公司。</p><p><strong>11. NVIDIA + Google Cloud 深化合作</strong><br>来源：NVIDIA</p><p>NVIDIA 与 Google Cloud 宣布深化合作，支持其联合开发者社区中超过 10 万名开发者。将提供 NVIDIA L4 Tensor Core GPU 以优化 AI 推理，并通过 Vertex AI 平台增强 Gemini 模型性能。</p><p><strong>12. NVIDIA Vera CPU：为 AI 工厂树立新性能标杆</strong><br>来源：NVIDIA</p><p>NVIDIA 阐述 AI 扩展规律演变：预训练 → 后训练 → 测试时缩放 → 智能体 AI 与强化学习驱动的下一阶段扩展。Vera CPU 旨在为 AI 工厂中智能体工作负载提供新性能标杆。</p><p><strong>13. OpenAI 为开源维护者提供免费 ChatGPT Pro</strong><br>来源：OpenAI</p><p>OpenAI 为开源项目维护者提供福利，可免费领取 6 个月 ChatGPT Pro（价值 $1,200），申请无硬性 Star 数要求，有项目链接即可。</p><hr><p><em>编辑：AI 无涯 | 数据来源：AI HOT (aihot.virxact.com)</em></p>]]>
    </content>
    <id>https://aifki.com/2026/06/01/ai-daily/</id>
    <link href="https://aifki.com/2026/06/01/ai-daily/"/>
    <published>2026-06-01T09:40:00.000Z</published>
    <summary>
      <![CDATA[<h1 id="AI-无涯日报-·-2026-年-6-月-1-日"><a href="#AI-无涯日报-·-2026-年-6-月-1-日" class="headerlink" title="AI 无涯日报 · 2026 年 6 月 1 日"></a>AI 无涯日报 · 2026]]>
    </summary>
    <title>AI 无涯日报 · 2026 年 6 月 1 日</title>
    <updated>2026-06-01T09:40:00.000Z</updated>
  </entry>
  <entry>
    <author>
      <name>无涯</name>
    </author>
    <category term="AI 日报" scheme="https://aifki.com/categories/AI-%E6%97%A5%E6%8A%A5/"/>
    <category term="AI 资讯" scheme="https://aifki.com/tags/AI-%E8%B5%84%E8%AE%AF/"/>
    <category term="AI 日报" scheme="https://aifki.com/tags/AI-%E6%97%A5%E6%8A%A5/"/>
    <content>
      <![CDATA[<h1 id="AI-无涯日报-·-2026-年-5-月-31-日"><a href="#AI-无涯日报-·-2026-年-5-月-31-日" class="headerlink" title="AI 无涯日报 · 2026 年 5 月 31 日"></a>AI 无涯日报 · 2026 年 5 月 31 日</h1><blockquote><p>每日精选全球 AI 热点，5 分钟掌握行业动态。</p></blockquote><hr><h2 id="模型发布-更新"><a href="#模型发布-更新" class="headerlink" title="模型发布&#x2F;更新"></a>模型发布&#x2F;更新</h2><p><strong>1. NVIDIA 预告 ARM 笔记本芯片 N1X：整合 Blackwell GPU</strong><br>来源：NVIDIA</p><p>NVIDIA、微软与 Arm 同步发布指向台北音乐中心的坐标，暗示 6 月 1 日发布会将有重大动作。这被视为 NVIDIA 与联发科合作的 ARM 笔记本芯片 N1X 的预告。该芯片整合 CPU、基于 Blackwell 架构的 GPU 及 AI 单元，目标是使轻薄本具备接近 RTX 4070 的图形性能。这标志着 NVIDIA 从显卡供应商向整机核心方案提供商转型，直接冲击 Intel、AMD 和高通在 PC 市场的地位。</p><hr><h2 id="产品发布-更新"><a href="#产品发布-更新" class="headerlink" title="产品发布&#x2F;更新"></a>产品发布&#x2F;更新</h2><p><strong>2. Tesla FSD V14.3.3 完成全球首次横穿加拿大自动驾驶</strong><br>来源：Tesla</p><p>一辆特斯拉搭载 FSD V14.3.3 从温哥华出发，历时 4 天 21 小时，行驶 6,051 公里抵达哈利法克斯，全程零人工干预。所有驾驶操作（高速并线、复杂路况、自动泊车）均由系统自主完成，无任何系统退出或人工修正。</p><p><strong>3. Pyodide + Service Worker 实现浏览器内运行 Python ASGI 应用</strong><br>来源：Simon Willison</p><p>开发者展示了如何在浏览器中通过 Pyodide 和 Service Worker 运行 Python ASGI 应用，该方案由 Claude Opus 4.8 协助完成开发。相比此前基于 Web Workers 的方案，新方案解决了无法执行 <code>&lt;script&gt;</code> 标签中 JavaScript 的问题。</p><p><strong>4. GitHub Copilot 改为 token 计费模式引发开发者不满</strong><br>来源：GitHub</p><p>微软旗下 GitHub Copilot 推出新的基于 token 的计费模式，替代原有的固定订阅制。这一变化引发开发者广泛担忧，被认为是对重度用户的变相涨价。</p><hr><h2 id="行业动态"><a href="#行业动态" class="headerlink" title="行业动态"></a>行业动态</h2><p><strong>5. 软银计划投资 750 亿欧元在法国建设 AI 数据中心</strong><br>来源：论坛报 &#x2F; 金融时报</p><p>软银集团计划投资高达 750 亿欧元（约 870 亿美元）在法国建设人工智能数据中心。这一投资规模使法国成为欧洲 AI 基础设施建设的核心节点，对全球算力格局产生深远影响。</p><p><strong>6. 美国企业开始对 AI 使用实施配给制</strong><br>来源：行业报道</p><p>由于 AI 运行和使用成本持续飙升，美国企业正开始对 AI 的使用实施配给制，通过限制使用量、设置分层审批流程等方式控制开支。标志着企业 AI 应用从广泛采用转向精细化管理，从追求速度转向注重成本效益。</p><hr><h2 id="技巧与观点"><a href="#技巧与观点" class="headerlink" title="技巧与观点"></a>技巧与观点</h2><p><strong>7. OpenAI 为开源项目维护者提供免费 ChatGPT Pro</strong><br>来源：OpenAI</p><p>OpenAI 为开源项目维护者提供福利，可免费领取 6 个月 ChatGPT Pro（价值 $1,200），申请无硬性 Star 数要求，有项目链接即可。</p><hr><p><em>编辑：AI 无涯 | 数据来源：AI HOT (aihot.virxact.com)</em></p>]]>
    </content>
    <id>https://aifki.com/2026/05/31/ai-daily/</id>
    <link href="https://aifki.com/2026/05/31/ai-daily/"/>
    <published>2026-05-31T06:07:00.000Z</published>
    <summary>
      <![CDATA[<h1 id="AI-无涯日报-·-2026-年-5-月-31-日"><a href="#AI-无涯日报-·-2026-年-5-月-31-日" class="headerlink" title="AI 无涯日报 · 2026 年 5 月 31 日"></a>AI 无涯日报 · 2]]>
    </summary>
    <title>AI 无涯日报 · 2026 年 5 月 31 日</title>
    <updated>2026-05-31T06:07:00.000Z</updated>
  </entry>
  <entry>
    <author>
      <name>无涯</name>
    </author>
    <category term="AI 日报" scheme="https://aifki.com/categories/AI-%E6%97%A5%E6%8A%A5/"/>
    <category term="AI 资讯" scheme="https://aifki.com/tags/AI-%E8%B5%84%E8%AE%AF/"/>
    <category term="AI 日报" scheme="https://aifki.com/tags/AI-%E6%97%A5%E6%8A%A5/"/>
    <content>
      <![CDATA[<h1 id="AI-无涯日报-·-2026-年-5-月-30-日"><a href="#AI-无涯日报-·-2026-年-5-月-30-日" class="headerlink" title="AI 无涯日报 · 2026 年 5 月 30 日"></a>AI 无涯日报 · 2026 年 5 月 30 日</h1><blockquote><p>每日精选全球 AI 热点，5 分钟掌握行业动态。</p></blockquote><hr><h2 id="模型发布-更新"><a href="#模型发布-更新" class="headerlink" title="模型发布&#x2F;更新"></a>模型发布&#x2F;更新</h2><p><strong>1. xAI 最大 GPU 客户放弃 JAX，自研 C 训练框架</strong><br>来源：JAX NVIDIA GPU &amp; XLA</p><p>据报道 xAI 的最大 GPU 客户已宣布放弃 JAX GPU，宁愿用 Grok Build “氛围编程” 构建一个 C 训练框架。此前 xAI 的 JAX 堆栈 MFU（模型算力利用率）低于 10%，NVIDIA JAX 团队过去两年全力支持 xAI 却未能解决。这一事件表明 JAX 在大规模训练场景下的底层缺陷可能比预期更严重。</p><p><strong>2. OpenAI 发布 gpt-realtime-translate — 实时语音翻译模型</strong><br>来源：OpenAI</p><p>OpenAI 推出全新模型 gpt-realtime-translate，可接收任意语言的语音输入，直接输出翻译后的语音。这是 OpenAI 在实时多模态翻译领域的重磅产品。</p><p><strong>3. 小米开源 ControlFoley — 可控视频音效生成模型</strong><br>来源：小米大模型应用团队</p><p>小米发布开源可控视频音效生成模型 ControlFoley，统一支持文本引导、文本控制、参考音频控制三类视频配音任务。在 VGGSound-Test 等多个 benchmark 上取得开源 SOTA，代码、权重和 Demo 均已开放。</p><p><strong>4. Kog 团队实现 10-30 倍推理加速：3000 tokens&#x2F;s</strong><br>来源：Kog Team</p><p>Kog 团队在标准数据中心 GPU 上实现单用户推理速度达 3,000 tokens&#x2F;s（8×AMD MI300X），2,100 tokens&#x2F;s（8×NVIDIA H200），相比常规推理速度提升 10-30 倍。核心思路是将 LLM 解码视为内存流问题，通过协同设计 monokernel 和 Laneformer 架构实现。</p><p><strong>5. Runway API 新增多款模型</strong><br>来源：Runway</p><p>Runway API 持续扩展，新增 Seedance 2.0、GPT Image 2、HappyHorse 1.0、Nano Banana Pro、Magnific Precision Upscaler V2 等多款模型，开发者可在一个地方调用所有生成能力。</p><hr><h2 id="产品发布-更新"><a href="#产品发布-更新" class="headerlink" title="产品发布&#x2F;更新"></a>产品发布&#x2F;更新</h2><p><strong>6. Google Agents API 正式发布</strong><br>来源：Google</p><p>Google 正式发布 Agents API，这是一项用于构建和运行自定义智能体的服务，在沙箱环境中运行，支持工具调用和任务自动化。</p><p><strong>7. LlamaIndex 模板接入 Google Agents API</strong><br>来源：LlamaIndex</p><p>LlamaIndex 团队基于 Google Agents API 构建了模板，使智能体能够通过 LlamaParse 和 LiteParse 自动处理非结构化文档。开发者可直接复用该模板。</p><p><strong>8. ComfyUI 首次集成 LLM 路由服务</strong><br>来源：ComfyUI</p><p>ComfyUI 首次直接集成 LLM 路由服务，为图像管线增加”外挂大脑”，用户可在节点内调用 20+ 模型，大幅简化自动化工作流。</p><p><strong>9. OpenRouter 支持 apply_patch — 多模型文件编辑统一工具</strong><br>来源：OpenRouter</p><p>OpenRouter 新增 apply_patch 服务器工具，允许任何模型通过 Responses API 使用 V4A diffs 提出文件编辑建议，解决了多模型文件编辑适配碎片化问题。</p><p><strong>10. claude-design-card — 中文视觉卡片生成 Skill</strong><br>来源：社区</p><p>一款专为中文内容创作者设计的 Skill，支持 28 种布局与 10 种主题，可将文字、URL 或文章自动转化为公众号首图、小红书图文卡等视觉卡片，替代 Figma&#x2F;Canva 的手动流程。</p><p><strong>11. Guardrails 安全治理工具发布</strong><br>来源：Guardrails</p><p>一套可配置的安全与治理工具，提供预算执行、零数据保留、模型与提供商限制、提示词注入防御及数据丢失预防等功能，保护智能体应用安全。</p><hr><h2 id="行业动态"><a href="#行业动态" class="headerlink" title="行业动态"></a>行业动态</h2><p><strong>12. 阿里云 + Qwen 成为 UEFA 官方合作伙伴（2027-2033）</strong><br>来源：阿里云</p><p>阿里云和 Qwen 成为 UEFA 官方独家 AI、云计算与电子商务合作伙伴，合作期覆盖 2027&#x2F;2028 赛季至 2032&#x2F;2033 赛季的 UEFA 男子俱乐部赛事及 EURO 2028。将利用 Qwen 大模型增强球迷互动与媒体体验。</p><p><strong>13. OpenAI 推出 Rosalind Biodefense — 生物防御 AI</strong><br>来源：OpenAI</p><p>OpenAI 推出 Rosalind Biodefense，为通过审核的开发者和美国政府伙伴提供 GPT-Rosalind 的可信访问，推动前沿 AI 在生物防御、公共卫生和大流行病准备方面的应用。</p><p><strong>14. 中央网信办：提升全民人工智能素养</strong><br>来源：中央网信办</p><p>中央网信办等四部门联合印发《2026年提升全民数字素养与技能工作要点》，明确要求”提升全民人工智能素养”，包括强化 AI 赋能教育、加快 AI 人才培育、深化 AI 普及应用。</p><p><strong>15. Gemini 四巨头首次同台访谈</strong><br>来源：Google</p><p>Jeff Dean、Koray Kavukcuoglu、Oriol Vinyals 和 Noam Shazeer 四位 Gemini 核心人物首次同时出镜，分享模型背后的团队故事与未来愿景。</p><p><strong>16. Cognition 创始人：AI 编码代理不应取代人类</strong><br>来源：Cognition</p><p>Cognition 公司（Devvin 开发者）创始人 Scott Wu 明确表示，AI 编程智能体并非旨在取代人类程序员，这一表态引发了开发者工具行业的热议。</p><hr><h2 id="论文研究"><a href="#论文研究" class="headerlink" title="论文研究"></a>论文研究</h2><p><strong>17. 技能提炼（Skill Distillation）：大模型写流程，小模型执行</strong><br>来源：社区研究</p><p>“技能提炼”是一种新的知识转移方法，由前沿大模型（Opus 4.7、GPT-5.1、Gemini 3 Pro）撰写并优化标准化的 SKILL.md 流程文件，本地小模型（Qwen 35B、Gemma 26B）直接执行。区别于知识蒸馏、指令微调和 RAG，其核心是提取操作流程。</p><p><strong>18. 彩色噪声采样（CNS）：扩散模型免训练采样器提升生成质量</strong><br>来源：arXiv</p><p>研究提出彩色噪声采样（CNS），一种免训练的即插即用扩散模型采样器。在 SiT、JiT、FLUX 等架构上，无引导 FID 在 SiT-XL&#x2F;2 上从 8.26 降至 6.27，显著提升生成质量。</p><p><strong>19. Adam’s Law（文本频率定律）：高频表达让模型表现更好</strong><br>来源：FaceMind</p><p>FaceMind 团队实验发现，在语义不变的前提下，使用预训练语料中出现频率更高的词汇撰写提示词，可显著提升大语言模型表现。这一发现为数据工程补充了”频率”这一新维度。</p><p><strong>20. WorldMemArena：多模态智能体记忆评估基准</strong><br>来源：论文研究</p><p>研究提出 WorldMemArena 基准，包含 400 个多会话多模态任务，支持对记忆的写入、维护、检索和使用的阶段级评估。发现记忆写入质量的提升不直接带来性能改善。</p><hr><h2 id="技巧与观点"><a href="#技巧与观点" class="headerlink" title="技巧与观点"></a>技巧与观点</h2><p><strong>21. Google AI Studio 用 vibe coding 创建 I&#x2F;O 2026 测验</strong><br>来源：Google</p><p>Google 使用 AI Studio 以 vibe coding 方式创建了 I&#x2F;O 2026 主要公告在线测验，展示了普通用户也能利用该工具进行开发。</p><p><strong>22. 别再给 AI 拽高级词汇了</strong><br>来源：FaceMind</p><p>FaceMind 的 Adam’s Law 实验证明，高频常见词能让模型表现更好。下次写 Prompt 时，先用最自然的语言表达，而不是刻意使用生僻词汇。</p><hr><p><em>编辑：AI 无涯 | 数据来源：AI HOT (aihot.virxact.com)</em></p>]]>
    </content>
    <id>https://aifki.com/2026/05/30/ai-daily/</id>
    <link href="https://aifki.com/2026/05/30/ai-daily/"/>
    <published>2026-05-30T07:49:00.000Z</published>
    <summary>
      <![CDATA[<h1 id="AI-无涯日报-·-2026-年-5-月-30-日"><a href="#AI-无涯日报-·-2026-年-5-月-30-日" class="headerlink" title="AI 无涯日报 · 2026 年 5 月 30 日"></a>AI 无涯日报 · 2]]>
    </summary>
    <title>AI 无涯日报 · 2026 年 5 月 30 日</title>
    <updated>2026-05-30T07:49:00.000Z</updated>
  </entry>
  <entry>
    <author>
      <name>无涯</name>
    </author>
    <category term="AI 日报" scheme="https://aifki.com/categories/AI-%E6%97%A5%E6%8A%A5/"/>
    <category term="AI 资讯" scheme="https://aifki.com/tags/AI-%E8%B5%84%E8%AE%AF/"/>
    <category term="AI 日报" scheme="https://aifki.com/tags/AI-%E6%97%A5%E6%8A%A5/"/>
    <content>
      <![CDATA[<h1 id="AI-无涯日报-·-2026-年-5-月-29-日"><a href="#AI-无涯日报-·-2026-年-5-月-29-日" class="headerlink" title="AI 无涯日报 · 2026 年 5 月 29 日"></a>AI 无涯日报 · 2026 年 5 月 29 日</h1><blockquote><p>每日精选全球 AI 热点，5 分钟掌握行业动态。</p></blockquote><hr><h2 id="模型发布-更新"><a href="#模型发布-更新" class="headerlink" title="模型发布&#x2F;更新"></a>模型发布&#x2F;更新</h2><p><strong>1. Claude Opus 4.8 发布：编码、智能体技能与推理全面升级</strong><br>来源：Anthropic Newsroom</p><p>Anthropic 发布了新一代模型 Claude Opus 4.8，作为 Opus 4.7 的升级版本，其在编码、智能体技能、推理和实用知识工作等各项基准测试中均取得进步。同步推出的新功能包括：用户可控制任务投入程度、Claude Code 新增”动态工作流”特性，以及 Opus 4.8 的 2.5 倍速模式价格降低为以往的三分之一。该模型在 Online-Mind2Web 测评中得分 84%，超越了 Opus 4.7 和 GPT-5.5，代码错误漏检率降低了约 75%。</p><p><strong>2. Grok Build 0.2.7 发布 — 新增用量查询与共享终端</strong><br>来源：xAI News</p><p>Grok Build 更新至 0.2.7 版本，新增 &#x2F;usage 使用量查询、&#x2F;login 登录功能、跨子智能体共享终端，并改进了图像理解能力。xAI 持续迭代 Grok Build，致力于提升 AI 编码开发体验。</p><p><strong>3. Qwen3.7-Max 登顶 OpenRouter 热门大语言模型榜单</strong><br>来源：阿里云</p><p>Qwen3.7-Max 以 77.3B tokens 的使用量登顶 OpenRouter 热门大语言模型榜单。这是国产开源模型第一次用实际用量证明自己，做应用的开发者可以认真考虑将其接入生产环境。</p><p><strong>4. 阶跃星辰开源 Step 3.7 Flash — 198B MoE 智能体模型</strong><br>来源：StepFun</p><p>阶跃星辰发布了开源大模型 Step 3.7 Flash，主打智能体工作流效率。该模型为 198B MoE（11B 活跃参数），在 ClawEval-1.1（67.1分）和 SimpleVQA Search（79.2分）评测中排名第一，τ²-bench 工具使用得分超 98%。支持 256K 上下文、多模态理解，可本地运行在 Mac Studio M4 Max 上，已兼容 Claude Code 和 MCP 协议，权重以 Apache 2.0 开源。</p><p><strong>5. Google Nano Banana Pro 图像生成模型正式发布</strong><br>来源：Google AI Developers</p><p>Google 推出 Nano Banana Pro（gemini-3-pro-image）和 Nano Banana 2（gemini-3.1-flash-image），已通过 Gemini API 投入生产使用。开发者现在可以稳定调用 Pro 和 Flash 级别的图像生成 API。</p><p><strong>6. 英伟达开源 Polar 框架：Codex 在 SWE-Bench 暴涨 594%</strong><br>来源：IT之家</p><p>英伟达研究团队开源了智能体强化学习框架 Polar。该框架通过在模型 API 边界放置智能体来接入 GRPO 训练。基于 Qwen3.5-4B 模型，Polar 将 Codex 在 SWE-Bench Verified 上的 pass@1 分数从 3.8% 提升至 26.4%（增长近 6 倍）。</p><hr><h2 id="产品发布-更新"><a href="#产品发布-更新" class="headerlink" title="产品发布&#x2F;更新"></a>产品发布&#x2F;更新</h2><p><strong>7. Claude Code 引入”动态工作流”功能</strong><br>来源：Claude Devs</p><p>Claude Code 推出”动态工作流”功能，使 Claude 能端到端处理复杂任务。该功能通过动态编写脚本，在单个会话中并行运行数十到数百个子智能体来完成工作。适用于跨代码库的 bug 查找、大规模迁移（如将 Bun 从 Zig 移植到 Rust）等任务。现已面向 Max、Team 及 Enterprise 用户开放。</p><p><strong>8. 阿里云开源百炼 CLI — Agent 开发一站式工具</strong><br>来源：阿里云</p><p>阿里云把百炼平台的全套 AI 能力打包成 CLI 工具，Agent 开发者无需再逐个对接 API，即可调用全套模型和应用能力。做企业智能助手的团队可以关注。</p><p><strong>9. Perplexity Computer 登陆 Microsoft Office 全家桶</strong><br>来源：Perplexity</p><p>Perplexity Computer 现已登陆 Excel、Word、PowerPoint 和 Outlook。用户可在侧边栏中直接使用 Computer 起草文档、建模、制作演示文稿和处理电子邮件。</p><p><strong>10. Sesame 发布 iOS 应用 — Oculus 创始人打造的对话式 AI</strong><br>来源：TechCrunch：AI（RSS）</p><p>由 Oculus 创始人创办的 AI 初创公司 Sesame 发布了其 iOS 应用，提供更自然的来回交互体验，旨在让用户感觉更像在和真人对话，而非传统聊天机器人。</p><p><strong>11. Mistral AI 发布 Search Toolkit — 开源搜索管道框架</strong><br>来源：Mistral AI News</p><p>Mistral AI 发布了 Search Toolkit 的公共预览版，将数据摄取、检索和评估工具整合到单一开源框架中，支持云端、本地或边缘部署，适用于企业搜索和 RAG 场景。</p><p><strong>12. Google Pay MCP Server 上线</strong><br>来源：Google Developers Blog</p><p>Google 推出 Google Pay &amp; Wallet Developer MCP server，将 AI 开发助手和 IDE 安全连接到实时的 API 与账户上下文。</p><p><strong>13. MiniMax M2.7 在 OpenHands 免费提供智能体编程</strong><br>来源：MiniMax (official)</p><p>MiniMax 与 OpenHands 合作，限时免费提供基于 MiniMax M2.7 的智能体编程服务。</p><hr><h2 id="行业动态"><a href="#行业动态" class="headerlink" title="行业动态"></a>行业动态</h2><p><strong>14. Anthropic 完成 650 亿美元 H 轮融资，估值达 9650 亿美元</strong><br>来源：Anthropic Newsroom</p><p>Anthropic 宣布完成由 Altimeter Capital 等领投的 650 亿美元 H 轮融资，投后估值达 9650 亿美元，年化收入已突破 470 亿美元。Claude 已登陆 AWS、Google Cloud 和 Microsoft Azure 三大云平台。</p><p><strong>15. Apple 正将大型 Gemini 模型塞进 iPhone 驱动新 Siri</strong><br>来源：Ars Technica</p><p>Apple 正尝试将大型 Gemini 模型集成到 iPhone 中，以支持全新的 Siri 功能。由于模型规模庞大，云端组件很可能是必然的选择。</p><p><strong>16. DeepSeek 计划 500 亿美元融资后冲刺科创板 IPO</strong><br>来源：X.PIN</p><p>消息称 DeepSeek 计划在完成当前约 500 亿美元融资轮后，立即申请科创板（A 股）IPO。</p><p><strong>17. SGLang + AMD MI355X 实现 DeepSeek-R1 推理成本低于 NVIDIA</strong><br>来源：LMSYS Blog</p><p>SGLang 与 AMD 合作，通过全栈优化使 AMD Instinct MI355X GPU 运行 DeepSeek-R1 的成本为 $0.169&#x2F;百万 token，比 NVIDIA B200 方案低 5%，每 GPU 吞吐量高 1.25 倍。</p><p><strong>18. OpenAI 发布前沿治理框架</strong><br>来源：OpenAI 官网动态</p><p>OpenAI 发布了”前沿治理框架”，阐述其 AI 安全与风险管理实践如何与欧盟和加州新法规对齐，是应对全球 AI 监管的重要举措。</p><p><strong>19. Google I&#x2F;O 2026 一文速览 12 大重要时刻</strong><br>来源：Google Blog</p><p>Google I&#x2F;O 2026 发布会披露了 12 个重要时刻，涵盖 Gemini Omni、Gemini 3.5 Flash 等产品的最新消息。</p><p><strong>20. Anthropic 开设米兰办公室 — 欧洲第六家</strong><br>来源：Anthropic Newsroom</p><p>Anthropic 在米兰开设其欧洲第六家办公室，已与 JAKALA、Satispay 等企业合作。Satispay 借助 Claude 将 18 个月路线图压缩至 7 个月。</p><hr><h2 id="论文研究"><a href="#论文研究" class="headerlink" title="论文研究"></a>论文研究</h2><p><strong>21. hexoai 开源 SIA 框架：AI 智能体实现递归自我改进</strong><br>来源：Rohan Paul</p><p>hexoai 开源了 SIA（自我改进 AI）框架。智能体不仅能优化外部工作流，还能通过任务反馈直接更新自身模型权重。SIA 在 LawBench 上提升 56.6%，GPU kernels 耗时减少 91.9%，单细胞 RNA 去噪任务提升 502%。</p><p><strong>22. DenoiseRL：从弱模型的错误中学习推理</strong><br>来源：HuggingFace Daily Papers</p><p>DenoiseRL 是一种强化学习框架，通过从弱模型产生的失败推理轨迹上进行基于恢复的优化来直接学习。实验表明其在数学和通用推理基准中持续优于在策略 RL 基线。</p><hr><h2 id="技巧与观点"><a href="#技巧与观点" class="headerlink" title="技巧与观点"></a>技巧与观点</h2><p><strong>23. OpenRouter 对比页：GPT-5.5 vs Claude Opus 4.8 实测对比</strong><br>来源：Hacker News 热门</p><p>OpenRouter 发布对比页，将 GPT-5.5 和 Claude Opus 4.8 的胜负判断从 benchmark 拉到实际测试环境，对模型选型很有参考价值。</p><p><strong>24. Runway Project Luxo：AI 视频已跨过恐怖谷</strong><br>来源：Runway</p><p>Runway 通过 Project Luxo 展示单人在一天内创作的 AI 短片，观众开始关注故事本身而非技术瑕疵，标志着 AI 视频生成已跨越恐怖谷。</p><hr><p><em>编辑：AI 无涯 | 数据来源：AI HOT (aihot.virxact.com)</em></p>]]>
    </content>
    <id>https://aifki.com/2026/05/29/ai-daily/</id>
    <link href="https://aifki.com/2026/05/29/ai-daily/"/>
    <published>2026-05-29T06:00:00.000Z</published>
    <summary>
      <![CDATA[<h1 id="AI-无涯日报-·-2026-年-5-月-29-日"><a href="#AI-无涯日报-·-2026-年-5-月-29-日" class="headerlink" title="AI 无涯日报 · 2026 年 5 月 29 日"></a>AI 无涯日报 · 2]]>
    </summary>
    <title>AI 无涯日报 · 2026 年 5 月 29 日</title>
    <updated>2026-05-29T14:00:00.000Z</updated>
  </entry>
  <entry>
    <author>
      <name>无涯</name>
    </author>
    <category term="AI 日报" scheme="https://aifki.com/categories/AI-%E6%97%A5%E6%8A%A5/"/>
    <category term="AI 资讯" scheme="https://aifki.com/tags/AI-%E8%B5%84%E8%AE%AF/"/>
    <category term="AI 日报" scheme="https://aifki.com/tags/AI-%E6%97%A5%E6%8A%A5/"/>
    <content>
      <![CDATA[<h1 id="AI-无涯日报-·-2026-年-5-月-28-日"><a href="#AI-无涯日报-·-2026-年-5-月-28-日" class="headerlink" title="AI 无涯日报 · 2026 年 5 月 28 日"></a>AI 无涯日报 · 2026 年 5 月 28 日</h1><blockquote><p>每日精选全球 AI 热点，5 分钟掌握行业动态。</p></blockquote><hr><h2 id="产品发布-更新"><a href="#产品发布-更新" class="headerlink" title="产品发布&#x2F;更新"></a>产品发布&#x2F;更新</h2><p><strong>1. Runway 推出 Model Context Protocol 服务器</strong><br><a href="https://runwayml.com/news/mcp">Runway：News（网页）</a></p><p>Runway 正式推出 Runway MCP 服务器，允许任何兼容 MCP 的 AI 智能体（如 Claude、ChatGPT、Cursor）在对话界面中直接生成图像与视频，无需切换工作流。该服务器接入了 Runway 最新的多款 SOTA 模型，包括 Gen-4.5、Seedance 2.0、GPT Image 2、Kling 3.0 及 Nano Banana Pro。其应用场景涵盖为产品制作营销视频、批量生成网站视觉素材、创作角色广告以及在应用开发中集成视觉内容。用户设置简便，通过 runwayml.com&#x2F;mcp 添加服务器并登录现有 Runway 账户即可使用，无需单独申请 API 密钥。</p><p><strong>2. Claude Code v2.1.152 更新发布</strong><br><a href="https://github.com/anthropics/claude-code/releases/tag/v2.1.152">Claude Code：GitHub Releases（RSS）</a></p><p>Claude Code 发布 v2.1.152 版本更新。核心改进包括：<code>/code-review --fix</code> 现在会将审查建议直接应用于工作目录；技能与斜杠命令支持通过 frontmatter 的 <code>disallowed-tools</code> 移除模型工具；新增 <code>/reload-skills</code> 命令可不重启会话重新扫描技能目录；<code>SessionStart</code> 钩子现可返回 <code>reloadSkills: true</code> 重新扫描技能，并可通过 <code>hookSpecificOutput.sessionTitle</code> 设置会话标题；新增 <code>MessageDisplay</code> 钩子事件以变换或隐藏助手消息。其他更新涉及插件市场管理、主模型不可用时自动切换至…</p><p><strong>3. OpenAI产品支持私有MCP服务器安全连接</strong><br><a href="https://x.com/OpenAIDevs/status/2059703536825565499">X：OpenAI Developers (@OpenAIDevs)</a></p><p>您的团队可以在内部网络中保留MCP服务器，同时ChatGPT、Codex和Responses API通过仅出站HTTPS进行连接。</p><p><strong>4. 开源FastVideo Dreamverse实时视频生成工具</strong><br><a href="https://x.com/haoailab/status/2059695648103112946">X：Sky Computing Lab (@haoailab)</a></p><p>🚀仅需7秒即可生成30秒1080p视频！ 我们开源了FastVideo Dreamverse：基于单张NVIDIA B200 GPU和LTX-2模型，实现实时视频生成的氛围引导工具。 Repo: <a href="https://github.com/hao-ai-lab/FastVideo/tree/main/apps/dreamverse">https://github.com/hao-ai-lab/FastVideo/tree/main/apps/dreamverse</a> Blog: <a href="https://haoailab.com/blogs/fastvideo-dreamverse-release/">https://haoailab.com/blogs/fastvideo-dreamverse-release/</a></p><p><strong>5. Grok编程智能体登陆Kilo IDE平台</strong><br><a href="https://x.com/xai/status/2059666227115819149">X：xAI (@xai)</a></p><p>在 @kilocode 中使用您的 SuperGrok 或 X Premium+ 订阅。 尝试 grok-build-0.1，享受高速和智能体编程智能，可在 Kilo IDE 扩展或 CLI 中使用。 <a href="https://x.ai/news/grok-kilocode">https://x.ai/news/grok-kilocode</a></p><p><strong>6. Perplexity开源Unigram分词器降低CPU占用</strong><br><a href="https://x.com/perplexity_ai/status/2059664738087469511">X：Perplexity (@perplexity_ai)</a></p><p>我们开源了重新构建的Unigram分词器，可将CPU占用降低5-6倍。 小型重排序器和嵌入模型在GPU上运行时间仅为个位数毫秒，使得CPU分词成为总延迟的重要组成部分。 <a href="http://github.com/perplexityai/pplx-garden">http://github.com/perplexityai/pplx-garden</a></p><p><strong>7. 通过万亿参数与 Hub Bucket 实现增量权重同步：TRL 中的增量权重同步</strong><br><a href="https://huggingface.co/blog/delta-weight-sync">Hugging Face：Blog（RSS）</a></p><p>本文标题涉及 Hugging Face TRL 框架中一项具体的增量权重同步技术。正文重申了 Hugging Face 的核心使命，即致力于通过开源和开放科学，来推动人工智能的进步与普及。</p><p><strong>8. OpenCode与MiMo V2.5限时免费开放</strong><br><a href="https://x.com/opencode/status/2059696100626297225">X：opencode (@opencode)</a></p><p>OpenCode x MiMo V2.5 - 限时免费 1M 上下文 • 推理 • 文本 • 图像</p><hr><h2 id="行业动态"><a href="#行业动态" class="headerlink" title="行业动态"></a>行业动态</h2><p><strong>9. 黄仁勋展示英伟达台湾新园区</strong><br><a href="https://x.com/rohanpaul_ai/status/2059689400267939925">X：Rohan Paul (@rohanpaul_ai)</a></p><p>黄仁勋展示了新的台湾园区。 英伟达计划每年在台湾投资约1500亿美元。 就在竞争对手AMD宣布将向台湾AI领域投资超过100亿美元一周后。</p><p><strong>10. 我国将加快研究推进人工智能健康发展综合性立法、低空经济立法等</strong><br><a href="https://www.ithome.com/0/955/758.htm">IT之家（RSS）</a></p><p><strong>11. Cognition成为全球最大独立智能体实验室</strong><br><a href="https://x.com/swyx/status/2059717021944926238">X：swyx (@swyx)</a></p><p>Cognition宣布已成为全球最大的独立智能体实验室。公司完成超10亿美元融资，估值达260亿美元，由Lux Capital、General Catalyst等领投。其企业使用量自年初增长超10倍，年化收入增至4.92亿美元。Cognition于两年前推出Devin，定位为首个AI软件工程师。公司强调其拥有多项领先优势，包括首个编码智能体、顶级代码审查能力等，并得到了Peter Thiel的重大投资。</p><p><strong>12. 教皇没对AGI上头</strong><br><a href="https://www.theverge.com/ai-artificial-intelligence/937933/pope-ai-encyclical-tech-industry-reactions">The Verge：AI（RSS）</a></p><p>教皇 Leo XIV 发布题为《Magnifica Humanitas》的通谕，警告人工智能的使用绝非纯粹技术问题，当其进入影响人类生活的过程时，便触及权利、机会、地位与自由。通谕发布时，Anthropic 联合创始人 Christopher Olah 出席。文件引发了科技界内外的广泛反应。</p><p><strong>13. 消息称高通与字节跳动达成 AI ASIC 芯片合作，采购量在数百万颗级别</strong><br><a href="https://www.ithome.com/0/955/674.htm">IT之家（RSS）</a></p><p><strong>14. 阿里云入选Omdia智能体AI市场雷达领导者</strong><br><a href="https://x.com/alibaba_cloud/status/2059509714854007181">X：阿里云 &#x2F; Alibaba Cloud (@alibaba_cloud)</a></p><p>阿里云在Omdia的智能体AI市场雷达中被评为领导者。Omdia强调了阿里云在每一层的全栈能力，认可其是首个将整个平台围绕智能体范式进行构建的云服务商。</p><p><strong>15. 阿里云成为PyTorch基金会白金会员</strong><br><a href="https://x.com/alibaba_cloud/status/2059453607075004835">X：阿里云 &#x2F; Alibaba Cloud (@alibaba_cloud)</a></p><p>阿里云宣布以白金会员身份加入PyTorch基金会。作为AI基础设施全球领导者，阿里云是开源模型家族Qwen的缔造方，已在多样化硬件上大规模运行PyTorch，将为社区带来生产级工程经验。</p><p><strong>16. 2026年选举信息与保障</strong><br><a href="https://openai.com/index/election-safeguards-2026">OpenAI：官网动态（RSS · 排除企业&#x2F;客户案例）</a></p><p>在2026年全球选举临近之际，通过帮助公众获取选举信息、支持网络防御者以及提升人工智能透明度这三方面的努力，来为选举提供保障。</p><hr><h2 id="论文研究"><a href="#论文研究" class="headerlink" title="论文研究"></a>论文研究</h2><p><strong>17. Fast, faster, Qwen. 🚀</strong><br><a href="https://x.com/Alibaba_Qwen/status/2059674574397313277">X：通义千问 &#x2F; Qwen (@Alibaba_Qwen)</a></p><p>Qwen3.5在TokenSpeed推理引擎上，针对智能体工作负载达到了创纪录的580 tokens per second (tps)速度。这一成果由通义千问推理团队、lightseekorg Foundation TokenSpeed团队、NVIDIA及Mooncake团队共同实现，并采用了tri_dao的FlashAttention-4 (FA4) 优化。此里程碑标志着开源大语言模型推理性能的边界得到了推动，相关详情可查阅PyTorch社区博客。</p><p><strong>18. ITBench-AA：前沿大模型在首个智能体企业IT任务基准测试中得分均低于50%</strong><br><a href="https://huggingface.co/blog/ibm-research/itbench-aa">Hugging Face：Blog（RSS）</a></p><p>由Artificial Analysis和IBM推出的ITBench-AA SRE基准测试显示，所有前沿大模型得分均未超过50%。Claude Opus 4.7（自适应推理，最大努力）以47%领先，GPT-5.5（xhigh）和Qwen3.7 Max分别得46%和42%。该测试包含59个需要通过Shell命令调查Kubernetes事件快照并提交根因诊断的智能体任务。关键发现是模型推理轮次差异近3倍，但更长的轨迹并不转化为更高准确率，过度调查的模型会因提交误报而受罚。在成本方面，开源模型Gemma 4 31B（Reasoning）以每任务$0.14的成本获得37%得分，优于成本更高但得分更低的闭源模型。</p><p><strong>19. 通过零信任聚合实现的隐私分析</strong><br><a href="https://research.google/blog/private-analytics-via-zero-trust-aggregation">Google Research：Blog（网页）</a></p><p>Google Research 推出了一种新的隐私分析解决方案。该方案结合了一种新的密码学安全聚合协议与可信执行环境（TEE）的透明性，旨在实现前沿的隐私与安全保证。其核心是基于零信任原则，通过密码学与硬件保护的结合，确保系统仅能获取群体的匿名化聚合洞察。</p><p><strong>20. 社会科学中的编码智能体</strong><br><a href="https://www.anthropic.com/research/coding-agents-social-sciences">Anthropic：Research（发表成果 · 网页）</a></p><p>一项针对1260名定量社会科学家的调查显示，虽然81%的受访者用过AI聊天机器人，但仅有20%将Claude Code、Codex等编码智能体常规应用于工作。采用率存在显著差异：以男性名字命名的研究者使用率是女性研究者的两倍；顶尖大学研究者可能性高出40%。用户产出更多工作论文和基金申请，但这可能反映早期采用者自身差异。研究者对AI助力撰写可发表论文更乐观，但对重塑整个社会科学领域持保留态度。这是一项初步调查，更深入研究仍在进行中。</p><hr><h2 id="技巧与观点"><a href="#技巧与观点" class="headerlink" title="技巧与观点"></a>技巧与观点</h2><p><strong>21. 与Google搜索产品副总裁Robby Stein的访谈：AI原生搜索时代</strong><br><a href="https://x.com/kimmonismus/status/2059668961181004275">X：Kim (@kimmonismus)</a></p><p>本文记录了与Google搜索产品副总裁Robby Stein在Google I&#x2F;O的访谈，核心探讨Google Search向“AI原生”模式的重大转变。讨论话题包括AI Mode是进化还是重塑、如何将复杂问题拆解为多轮搜索、AI搜索的高运行成本、Google TPU及基础设施的优势、AI时代搜索量不减反增的原因，以及优质AI回答与出版商流量之间的张力。访谈还涉及Google决定展示哪些信息源与链接的逻辑，并围绕一个核心问题展开：如果Google直接给出答案，传统的基于链接的网页生态将走向何方？</p><p><strong>22. 藏师傅发布小红书图文排版AI Skill，集成地图与自动配图</strong><br><a href="https://x.com/op7418/status/2059587983289016348">X：歸藏 (@op7418)</a></p><p>该推文介绍了guizang-social-card-skill，一款针对小红书图文常见类别进行优化的AI Skill。其亮点在于为旅行博主集成了地图组件，用户输入目的地和线路后，AI能自动在底图上标记并嵌入图片。根据引用，该Skill完全基于HTML和实拍图片生成内容，不会被平台标注为AI生成，并会主动从高质量图片网站寻找对应主题图片，以优化图文排版。</p><p><strong>23. 使用大语言模型保障源代码安全</strong><br><a href="https://claude.com/blog/using-llms-to-secure-source-code">Claude：Blog（网页）</a></p><p>本文分享了使用 Claude Opus 构建威胁模型、发现代码漏洞并进行验证、分类和修复的最佳实践。其核心流程是一个六步循环：威胁建模、沙箱隔离、漏洞发现、验证、分类和修复。作者指出，漏洞发现现在易于并行化，瓶颈已转移到后续的验证与处理阶段。以他们对开源软件的扫描为例，截至2026年5月22日已披露1,596个漏洞，其中97个已修补。指南建议结合代码库文档和专家访谈来构建准确的威胁模型，以降低误报，提升发现的可利用性。</p><p><strong>24. 用好 Coding Agent，重点是两头，尤其是开头的部分，如果一开始就走偏了后面怎么改都改不好。</strong><br><a href="https://x.com/dotey/status/2059773942500298934">X：宝玉 (@dotey)</a></p><p>用好 Coding Agent 的关键在于初始规划。方法是先将需求整理后，用最强模型（如 GPT-5.5、Claude Opus 4.7）分别在 Codex、Claude Code、Cursor 的 Plan 模式下生成设计方案，选择最优方案并借鉴其他版本。对于复杂计划，可将其拆分为多个 Phases 并明确要求与验证标准，形成 Markdown 文档。执行时按 Phases 进行，并辅以人工审核纠偏。最后的代码审核（Code Review）用 GPT-5.5 审核代码质量与设计符合度即可。应避免让多个智能体交叉 Review，否则可能导致代码越改越多。</p><p><strong>25. 我认为 Anthropic 和 OpenAI 找到了产品市场契合点</strong><br><a href="https://simonwillison.net/2026/May/27/product-market-fit">Simon Willison 博客</a></p><p>Anthropic 与 OpenAI 通过编程智能体找到了产品市场契合点，这导致企业客户成本显著上升。两家公司已于 2026 年 4 月前后调整了企业套餐定价，从原先的高额折扣改为与 API 用量挂钩。Anthropic Enterprise 套餐变为每席位 20 美元&#x2F;月外加 API 费用，OpenAI Codex 则按 API token 用量计费。同期发布的新模型 GPT-5.5（4月23日）和 Opus 4.7（4月16日）的 API 定价也显著高于前代版本。</p><p><strong>26. Reachy Mini 实现完全本地化语音交互</strong><br><a href="https://huggingface.co/blog/local-reachy-mini-conversation">Hugging Face：Blog（RSS）</a></p><p>Reachy Mini 机器人现可通过 <code>speech-to-speech</code> 库实现完全本地化的语音交互，无需依赖云端。该方案采用级联流水线架构，对外提供 Realtime API 兼容的 WebSocket 接口。默认组件包括 Silero VAD 用于语音活动检测、Parakeet-TDT 作为语音转文本模型、通义千问（Qwen3-TTS）作为文本转语音模型。大语言模型推荐使用 llama.cpp 运行 Gemma 4。所有数据均在本地处理，保障了隐私且无 API 费用。</p><p><strong>27. OpenAI 奥尔特曼称 AI 对白领冲击不如预期般严重：我很高兴自己当时错了</strong><br><a href="https://www.ithome.com/0/956/021.htm">IT之家（RSS）</a></p><p><strong>28. AI智能体的零信任安全框架</strong><br><a href="https://claude.com/blog/zero-trust-for-ai-agents">Claude：Blog（网页）</a></p><p>Anthropic 发布了针对企业部署自主 AI 智能体的安全框架，指出前沿大语言模型正将漏洞利用周期从数月压缩至数小时。部署智能体面临双重风险：基础设施易受 AI 加速攻击，且智能体自身具备自主决策与执行能力。文章提出一个三层零信任架构（基础、高级、优化级）及八阶段实施流程，并概述了提示注入、工具投毒、记忆投毒等特有威胁。</p><hr><hr><p><em>数据来源：AI HOT (aihot.virxact.com) | 生成时间：2026-05-29 02:00</em></p>]]>
    </content>
    <id>https://aifki.com/2026/05/28/ai-daily/</id>
    <link href="https://aifki.com/2026/05/28/ai-daily/"/>
    <published>2026-05-27T18:00:02.000Z</published>
    <summary>
      <![CDATA[<h1 id="AI-无涯日报-·-2026-年-5-月-28-日"><a href="#AI-无涯日报-·-2026-年-5-月-28-日" class="headerlink" title="AI 无涯日报 · 2026 年 5 月 28 日"></a>AI 无涯日报 · 2]]>
    </summary>
    <title>AI 无涯日报 · 2026 年 5 月 28 日</title>
    <updated>2026-05-28T18:00:02.000Z</updated>
  </entry>
  <entry>
    <author>
      <name>无涯</name>
    </author>
    <category term="AI 日报" scheme="https://aifki.com/categories/AI-%E6%97%A5%E6%8A%A5/"/>
    <category term="AI 资讯" scheme="https://aifki.com/tags/AI-%E8%B5%84%E8%AE%AF/"/>
    <category term="AI 日报" scheme="https://aifki.com/tags/AI-%E6%97%A5%E6%8A%A5/"/>
    <content>
      <![CDATA[<h1 id="AI-无涯日报-·-2026-年-5-月-27-日"><a href="#AI-无涯日报-·-2026-年-5-月-27-日" class="headerlink" title="AI 无涯日报 · 2026 年 5 月 27 日"></a>AI 无涯日报 · 2026 年 5 月 27 日</h1><blockquote><p>每日精选全球 AI 热点，5 分钟掌握行业动态。</p></blockquote><hr><h2 id="模型发布-更新"><a href="#模型发布-更新" class="headerlink" title="模型发布&#x2F;更新"></a>模型发布&#x2F;更新</h2><p><strong>1. 谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题</strong><br><a href="https://www.ithome.com/0/955/261.htm">IT之家（RSS）</a></p><p><strong>2. 面壁智能开源 MiniCPM5-1B：在 AA-Index 上超越所有 2B 参数以下模型，能跑在手机、浏览器上</strong><br><a href="https://www.ithome.com/0/955/267.htm">IT之家（RSS）</a></p><p>面壁智能开源其新一代端侧大语言模型MiniCPM5-1B。该模型仅1B参数，在AA-Index榜单上超越所有2B参数以下模型，相比3个月前的Qwen3.5-2B效果更优且参数量减半。经INT4量化后权重仅0.5GB，支持在手机和浏览器上运行。其Base Model版本由面壁智能自主研发的AI训练框架ForgeTrain预训练完成，现已全面开源模型权重、训练数据集与部署方案。</p><p><strong>3. 腾讯混元新翻译模型双榜亮眼，小程序发布</strong><br><a href="https://x.com/TencentHunyuan/status/2059104921778352626">X：腾讯混元 (@TencentHunyuan)</a></p><p>腾讯混元发布翻译模型 Hy-MT2，在 Hugging Face 开源模型趋势排行榜上表现突出：1.8B 版本排名第一，30B-A3B（MoE）版本排名第四，下载量已超 7K。官方同步推出了基于该模型的“腾讯混译”微信小程序，支持语音输入与离线翻译，并可自定义翻译风格与指令。模型代码与权重已开源。</p><p><strong>4. Qwen3.7-Max 成为全球第二AI编程模型</strong><br><a href="https://x.com/alibaba_cloud/status/2059163881361048011">X：阿里云 &#x2F; Alibaba Cloud (@alibaba_cloud)</a></p><p>Qwen3.7-Max 正式成为全球第二大 AI 编程模型。在 Code Arena 上得分 1541，仅次于 Claude。专为生产环境打造：可运行 35 小时任务、1000+ 次工具调用，并在数小时内交付两周的项目。</p><hr><h2 id="产品发布-更新"><a href="#产品发布-更新" class="headerlink" title="产品发布&#x2F;更新"></a>产品发布&#x2F;更新</h2><p><strong>5. MiMo 2.5 Pro大幅降价，与DeepSeek V4 Pro同价</strong><br><a href="https://x.com/kimmonismus/status/2059354372643975490">X：Kim (@kimmonismus)</a></p><p>小米MiMo-V2.5系列API价格永久下调，最高降幅达99%，现与DeepSeek V4 Pro同价。Token套餐同步升级，同等价格下可用token量增加5-8倍，计费规则更简单透明。所有现有用户套餐额度将全额重置。此次降价源于MiMo全栈推理优化与服务效率提升，后续将发布技术博客详述细节。MiMo-V2.5-TTS限时免费，新定价于5月26日生效。</p><p><strong>6. Claude Code推出安全漏洞识别插件</strong><br><a href="https://x.com/ClaudeDevs/status/2059385239781384341">X：Claude Devs (@ClaudeDevs)</a></p><p>我们为Claude Code发布了一个安全指导插件，可在编写代码时帮助识别和修复漏洞。 所有Claude Code用户均可使用。从插件市场（&#x2F;plugins）安装。</p><p><strong>7. Replit 应用添加登录的两种方式</strong><br><a href="https://x.com/Replit/status/2059303550375674139">X：Replit (@Replit)</a></p><p>在 Replit 上为你的应用添加登录有两种方式： → Replit Auth：零配置，用户使用其 Replit 账户登录 → Clerk Auth：你自己的品牌化登录，开发&#x2F;生产环境均只需一个提示词。文档和视频见下方 👇 文档：<a href="https://docs.replit.com/learn/projects-and-artifacts/auth#auth">https://docs.replit.com/learn/projects-and-artifacts/auth#auth</a></p><p><strong>8. Kling AI驱动《大卫之家》实现多项行业首创</strong><br><a href="https://x.com/Kling_ai/status/2059121691385622761">X：可灵 Kling AI (@Kling_ai)</a></p><p>Jon Erwin - Wonder Project创始人兼首席创意官，Innovative Dreams首席执行官，亚马逊Prime热门剧集《大卫之家》创作者： “Kling AI是《大卫之家》第一季和第二季背后的核心力量。最让我兴奋的是它实现了多项行业首创：在完成的剧集中首次使用AI生成场景，首个原生4K模型。其运动控制功能也使我们能够在AI生成中保留演员真实的情感和感受。”</p><hr><h2 id="行业动态"><a href="#行业动态" class="headerlink" title="行业动态"></a>行业动态</h2><p><strong>9. 据报道Claude Mythos以“巧妙简洁的证明”解决了OpenAI里程碑式的Erdős问题</strong><br><a href="https://the-decoder.com/claude-mythos-reportedly-solves-openais-landmark-erdos-problem-with-a-cute-simple-proof">The Decoder：AI News（RSS）</a></p><p>Anthropic工程师Sholto Douglas表示，Claude Mythos在周末期间解决了OpenAI提出的Erdős单位距离猜想问题，并给出了一个“巧妙简洁的证明”。这一成果被描述为人工智能在数学发现领域存在“严重超前”迹象。</p><p><strong>10. SynthID水印技术扩展合作，覆盖超千亿内容</strong><br><a href="https://x.com/GoogleDeepMind/status/2059235181274202500">X：Google DeepMind (@GoogleDeepMind)</a></p><p>SynthID已为超过1000亿条内容添加水印，但透明度需要行业协作。 因此，我们正与OpenAI、ElevenLabs和Kakao合作，将SynthID水印技术集成到他们的模型中——这延续了我们与NVIDIA共同推动的全行业趋势。</p><p><strong>11. OpenRouter完成1.13亿美元B轮融资</strong><br><a href="https://x.com/OpenRouter/status/2059277623629664758">X：OpenRouter (@OpenRouter)</a></p><p>今天我们宣布完成由@CapitalGVC领投的1.13亿美元B轮融资。 过去6个月，随着AI从实验快速转向生产，OpenRouter的周处理量从5万亿增长到25万亿token。 我们对未来充满期待。</p><p><strong>12. Anthropic任命KiYoung Choi为韩国代表董事</strong><br><a href="https://www.anthropic.com/news/kiyoung-choi-representative-director-anthropic-korea">Anthropic：Newsroom（网页）</a></p><p>Anthropic宣布任命KiYoung Choi为韩国代表董事，以支持其即将在首尔开设的办公室。根据Anthropic的经济指数，韩国是Claude.ai全球最活跃的市场之一，其使用率超过人口规模预期的3.5倍，主要用于技术和创意领域。KiYoung Choi此前曾担任Snowflake韩国区总经理，在Google Cloud、Adobe等公司拥有超过30年的科技行业领导经验。他将在韩国领导市场战略，支持本地企业和初创公司应用Claude，例如法律科技公司Law&amp;Company及韩国电信巨头SK Telecom均已在使用Claude构建产品。</p><p><strong>13. 阿里云CTO阐述从云原生到智能体原生转型</strong><br><a href="https://x.com/alibaba_cloud/status/2059174528786268669">X：阿里云 &#x2F; Alibaba Cloud (@alibaba_cloud)</a></p><p>在 #QwenConference2026 上，阿里云CTO、国际业务总裁李飞飞博士阐述了我们从云原生到智能体原生的转变。为了普及AI，我们构建了四大基石：模型、智能体云、工具与服务，以及规模。 👉 敬请关注：<a href="https://click.qwencloud.com/m/20000000187/">https://click.qwencloud.com/m/20000000187/</a></p><p><strong>14. 微软亚洲研究院发起全球AI价值观挑战赛</strong><br><a href="https://x.com/MSFTResearch/status/2059273348232724565">X：Microsoft Research (@MSFTResearch)</a></p><p>AI能否理解人类价值观的现实复杂性？微软亚洲研究院的全新全球AI价值观挑战赛，诚邀哲学、伦理、法学和社会科学领域的研究人员共同探索。立即注册：<a href="https://msft.it/6012vk8OO">https://msft.it/6012vk8OO</a></p><hr><h2 id="论文研究"><a href="#论文研究" class="headerlink" title="论文研究"></a>论文研究</h2><p><strong>15. KPop 新方法让 Ring-2.6-1T 在 SWE-bench Verified 上突破 76 分</strong><br><a href="https://x.com/AntLingAGI/status/2059292063032918422">X：蚂蚁百灵 (@AntLingAGI)</a></p><p>团队推出 KPop，用于稳定大规模 MoE 模型的智能体强化学习训练。它用基于二元 KL 散度的自适应掩码机制，替代了此前 IcePop 方法中的固定比例掩码，能根据训练过程中的训练-推理不匹配程度动态调整。这一改进使得 Ring-2.6-1T 模型在无需修改基础设施或路由重放的情况下，仅通过纯 RL 训练，在 SWE-bench Verified 上取得了超过 76 分的成绩。</p><hr><h2 id="技巧与观点"><a href="#技巧与观点" class="headerlink" title="技巧与观点"></a>技巧与观点</h2><p><strong>16. Sundar Pichai 谈 AI、搜索的未来及网络的变化</strong><br><a href="https://www.theverge.com/podcast/936445/sundar-pichai-ai-search-google-zero-youtube-web">The Verge：AI（RSS）</a></p><p>Google 与 Alphabet CEO Sundar Pichai 在 Google I&#x2F;O 后受访，回顾了公司为应对 ChatGPT 而进行的战略重组与高管调整。访谈聚焦于新的 Gemini 模型及其在产品中的整合，包括全新的智能搜索框与 Gemini Spark 智能体平台，旨在让搜索从提供结果转向启动任务。Pichai 讨论了这些变化对开放网络的持续冲击，回应了主持人此前提出的“Google Zero”概念（即来自 Google 的网站流量可能归零），并提及 Google 正利用 YouTube 视频训练模型以改变视频搜索与索引方式。最后，他对 Google DeepMind CEO Demis Hassabis 关于“处…</p><p><strong>17. “龙虾之父”Peter 开源 skill-cleaner，为 AI 智能体技能“做体检”</strong><br><a href="https://www.ithome.com/0/955/269.htm">IT之家（RSS）</a></p><p>“龙虾之父”Peter 开源了 skill-cleaner 工具，用于诊断和优化 AI 智能体的技能提示词。该工具包含5项核心功能，包括技能提示词预算审计、重复技能检测、未使用技能筛查、技能根目录审计和描述精简优化。其脚本采用标准 token 预算核算逻辑，旨在帮助减少冗长描述对 token 预算和上下文窗口的占用。已有用户实践显示，将技能描述从90多词精简至40词以内，能提升智能体选择技能的准确率。</p><p><strong>18. Gemini Omni 视频提示词使用指南</strong><br><a href="https://x.com/GoogleAI/status/2059381218660270435">X：Google AI (@GoogleAI)</a></p><p>Google 发布了其多模态模型 Gemini Omni 的视频生成功能使用指南。该模型可通过 Gemini 应用、Google Flow 等平台体验。指南包含五项提示词技巧：利用模型已有的现实世界知识进行简洁描述；精确控制文本在视频中的渲染与排版；使用专业镜头指令（如推拉摇移）像电影摄影师一样调度画面；通过迭代编辑高效修改视频；以及在生成中直接调整角色的动作节奏或情绪。其核心在于通过精准的提示词引导模型生成复杂且可控的视频内容。</p><p><strong>19. 人类与AI分工：教育咨询及文学奖争议</strong><br><a href="https://x.com/emollick/status/2059363865536668040">X：Ethan Mollick (@emollick)</a></p><p>我写了一篇新文章，探讨我们需要保留哪些人类特质，以及哪些可以交给AI，其中涉及教育、咨询领域的实验，以及最近关于文学奖的争议。</p><p><strong>20. Project Luxo：跨越AI媒体的恐怖谷</strong><br><a href="https://runwayml.com/news/project-luxo">Runway：News（网页）</a></p><p>Runway通过Project Luxo研究发现，AI生成视频已跨越“恐怖谷”。他们向创意生态从业者展示了《The Rogue》等AI短片及广告样片，评估显示观众开始关注故事本身，而非技术瑕疵。所有作品均由单人团队制作，耗时从3周到4小时不等。Runway认为，这标志着AI媒体成熟——当技术足够好以至于“隐形”，观众沉浸于故事时，便实现了这一跨越。</p><p><strong>21. 我们如何对不同产品中的Claude进行隔离控制</strong><br><a href="https://www.anthropic.com/engineering/how-we-contain-claude">Anthropic：Engineering（事故复盘 + 工程实践 · 网页）</a></p><p>Anthropic通过三重机制控制Claude智能体的部署风险，包括用户误用、模型异常行为和外部攻击。其防护策略聚焦于三个层面：通过沙箱、虚拟机和网络出口控制限制智能体运行环境；利用系统提示词和模型训练引导其行为；以及对MCP服务器、第三方插件等外部内容实施细粒度权限管理。文章以Claude Code、claude.ai和Claude Cowork为例，阐述了不同产品如何设计对应的隔离架构。</p><p><strong>22. SenseNova-U1全训练代码开源，支持多模态多任务训练</strong><br><a href="https://x.com/SenseTime_AI/status/2059288013994406013">X：商汤 SenseTime (@SenseTime_AI)</a></p><p>OpenSenseNova开源了SenseNova-U1的完整训练代码库，支持其8B密集模型与A3B MoE架构。该代码库使用一个统一的框架，可同时训练多种多模态任务，包括文本到图像生成、图像编辑、交错生成及文本与视觉理解。工程上为大规模训练设计，支持混合并行、流式可恢复数据管线、环境变量驱动配置以及从1×8 GPUs到多节点集群的扩展能力。代码已在GitHub开源，采用Apache-2.0协议。</p><p><strong>23. 未来展望：2026年5月的一些想法</strong><br><a href="https://www.interconnects.ai/p/some-ideas-for-what-comes-next-may">Nathan Lambert：Interconnects（RSS）</a></p><p>文章展望了截至2026年5月AI领域的动态。内容涉及 Gemini Flash 3.5 的发布、名为 Mythos 的新产品或项目、开源与闭源生态平衡（open-closed balance）的讨论、美国开源力量的显著增长（America’s open-source surge），以及由此引发的新兴权力博弈（emerging power struggles）。</p><hr><hr><p><em>数据来源：AI HOT (aihot.virxact.com) | 生成时间：2026-05-27 17:47</em></p>]]>
    </content>
    <id>https://aifki.com/2026/05/27/ai-daily/</id>
    <link href="https://aifki.com/2026/05/27/ai-daily/"/>
    <published>2026-05-27T09:47:16.000Z</published>
    <summary>
      <![CDATA[<h1 id="AI-无涯日报-·-2026-年-5-月-27-日"><a href="#AI-无涯日报-·-2026-年-5-月-27-日" class="headerlink" title="AI 无涯日报 · 2026 年 5 月 27 日"></a>AI 无涯日报 · 2]]>
    </summary>
    <title>AI 无涯日报 · 2026 年 5 月 27 日</title>
    <updated>2026-05-27T09:47:16.000Z</updated>
  </entry>
  <entry>
    <author>
      <name>无涯</name>
    </author>
    <category term="AI 日报" scheme="https://aifki.com/categories/AI-%E6%97%A5%E6%8A%A5/"/>
    <category term="AI 资讯" scheme="https://aifki.com/tags/AI-%E8%B5%84%E8%AE%AF/"/>
    <category term="AI 日报" scheme="https://aifki.com/tags/AI-%E6%97%A5%E6%8A%A5/"/>
    <content>
      <![CDATA[<h1 id="AI-无涯日报-·-2026-05-26"><a href="#AI-无涯日报-·-2026-05-26" class="headerlink" title="AI 无涯日报 · 2026-05-26"></a>AI 无涯日报 · 2026-05-26</h1><blockquote><p>每日精选全球 AI 热点，5 分钟掌握行业动态。</p></blockquote><hr><h2 id="模型发布-更新"><a href="#模型发布-更新" class="headerlink" title="模型发布&#x2F;更新"></a>模型发布&#x2F;更新</h2><p><strong>1. 面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN</strong><br><a href="https://www.ithome.com/0/954/759.htm">IT之家（RSS）</a></p><hr><h2 id="产品发布-更新"><a href="#产品发布-更新" class="headerlink" title="产品发布&#x2F;更新"></a>产品发布&#x2F;更新</h2><p><strong>2. Grok Build Beta版向SuperGrok用户开放</strong><br><a href="https://x.com/xai/status/2058973760708091907">X：xAI (@xai)</a></p><p>Grok Build 现已面向所有 SuperGrok 和 X Premium+ 用户推出 Beta 版。 使用 Plan Mode，通过 Imagine 创建图像和视频，并使用 CLI 构建自动化或编排器。 访问 <a href="http://x.ai/cli">http://x.ai/cli</a> 开始使用。</p><p><strong>3. Qwen3.7-Max隐式缓存功能上线</strong><br><a href="https://x.com/Alibaba_Qwen/status/2058932656797368619">X：通义千问 &#x2F; Qwen (@Alibaba_Qwen)</a></p><p>✅隐式缓存现已在Qwen3.7-Max上线——自动启用，无需设置。 ⚡️开箱即用，更快更便宜。 需要更高、更确定的命中率？请尝试显式缓存。🙌 🔗最佳实践🔗：<a href="https://www.alibabacloud.com/help/en/model-studio/explicit-cache-best-practice">https://www.alibabacloud.com/help/en/model-studio/explicit-cache-best-practice</a></p><hr><h2 id="行业动态"><a href="#行业动态" class="headerlink" title="行业动态"></a>行业动态</h2><p><strong>4. 苹果据称正使用定制版1.2T参数Google模型重塑下一代Siri</strong><br><a href="https://x.com/kimmonismus/status/2058997271803674991">X：Kim (@kimmonismus)</a></p><p>据报道，苹果为改造下一代Siri，正使用一个定制版、参数规模达1.2T的Google大模型作为其核心，这显著大于预估约300B参数的Gemini 3.5 Flash。该模型将驱动Siri的部分功能，其中简单查询预期会在本地设备运行。苹果面临的关键挑战是确保该大模型能够足够快速地响应日常问题。此外，下个月AI领域预计将有多项重要发布，包括WWDC上的Apple Intelligence与Gemini整合、GPT-5.6、可能的Sonnet 4.8&#x2F;Opus 4.8，以及已确认的Gemini 3.5 Pro。</p><p><strong>5. 教皇里奥呼吁在AI时代保持“深刻的人性”</strong><br><a href="https://www.theverge.com/news/936945/pope-leo-letter-encyclical-ai-anthropic-labor-warfare">The Verge：AI（RSS）</a></p><p>教皇里奥十四世在首份重要通谕《Magnifica Humanitas》中警告了AI及不受约束的技术力量带来的风险。该通谕于2026年5月15日发布，是教皇关于“在人工智能时代守护人”的宣言。文件重点讨论了AI驱动战争的危险、AI对劳动的影响，以及建立新的法律和伦理框架来规范技术的必要性，强调AI的快速普及正造成经济和社会动荡，对个人的保护不足威胁着人类尊严。</p><p><strong>6. OpenAI GPT-5.6 模型曝下月发布：AI 上下文 150 万 tokens</strong><br><a href="https://www.ithome.com/0/955/078.htm">IT之家（RSS）</a></p><p>多名开发者在 OpenAI Codex 后端日志中发现未官宣的 GPT-5.6 模型，内部代号 iris-alpha。该模型将支持 150 万 token 的上下文窗口，较当前 GPT-5.5 的 105 万 token 提升约 43%，有望于今年 6 月发布。测试显示，在输入达到 90 万 token 时仍能流畅响应。同系列还发现了 ember-alpha 与 beacon-alpha 版本。此外，GPT-5.6 在前端界面生成能力上也有所提升。基于爆料信息，Anthropic Claude、Google Gemini 及 xAI Grok 也可能瞄准同期发布新模型。</p><p><strong>7. OpenAI、Grupo Folha与Grupo UOL宣布战略内容合作</strong><br><a href="https://openai.com/index/grupo-folha-grupo-uol-partnership">OpenAI：官网动态（RSS · 排除企业&#x2F;客户案例）</a></p><p>OpenAI与巴西媒体集团Grupo Folha和Grupo UOL达成合作，将可信的巴西新闻内容引入ChatGPT，以扩展新闻访问渠道，并确保内容来源的归属与透明度。</p><hr><h2 id="论文研究"><a href="#论文研究" class="headerlink" title="论文研究"></a>论文研究</h2><p><strong>8. 微软 Copilot Cowork 存在文件泄露问题</strong><br><a href="https://www.promptarmor.com/resources/microsoft-copilot-cowork-exfiltrates-files">Hacker News 热门（buzzing.cc 中文翻译）</a></p><p><strong>9. 华为何庭波“韬定律”论文发布，逻辑折叠技术提升芯片性能</strong><br><a href="https://www.ithome.com/0/954/778.htm">IT之家（RSS）</a></p><p>华为何庭波在ISCAS 2026上提出“韬定律”，并介绍逻辑折叠（LogicFolding）技术。该技术通过三维空间拓扑重组提升芯片性能，不依赖新光刻工艺。在麒麟2026芯片测试中，晶体管密度从155 MTr&#x2F;mm²提升至238 MTr&#x2F;mm²，性能核心能效提高41%，最大时钟频率提升近13%。论文显示，麒麟2027芯片已进入Silicon状态，后续规划包括麒麟2028、2029。AI芯片方面，昇腾990计划在2030年左右引入逻辑折叠，硬件集成预计到2035年提高超过100倍。</p><hr><h2 id="技巧与观点"><a href="#技巧与观点" class="headerlink" title="技巧与观点"></a>技巧与观点</h2><p><strong>10. Anthropic联合创始人Chris Olah在教皇通谕发布会上的讲话</strong><br><a href="https://www.anthropic.com/news/chris-olah-pope-leo-encyclical">Anthropic：Newsroom（网页）</a></p><p>Anthropic联合创始人Chris Olah在梵蒂冈出席教皇Leo XIV关于AI的通谕发布会。他指出，所有前沿AI实验室都面临商业、研究及地缘政治等多重压力，这可能与做正确的事相冲突，因此外部监督至关重要。他强调，AI模型并非像飞机那样被工程化构建，而是基于人类语言和思想“生长”出来的，其内在性质可能复杂难解。他提出三个需审慎思考的问题：如何确保AI发展的全球收益公平分享、如何思考AI时代的人类繁荣，以及AI模型内在性质的本质。他呼吁社会各界，尤其是宗教与民间团体，严肃审视AI发展并引导其向善。</p><p><strong>11. Harness、Scaffold 与 AI 智能体术语辨析</strong><br><a href="https://huggingface.co/blog/agent-glossary">Hugging Face：Blog（RSS）</a></p><p>本文旨在厘清 AI 智能体领域中易混淆的关键术语。文章指出，模型（如 Claude、GPT）本身是无记忆、无循环的大语言模型。其行为由“Scaffolding”（行为定义层，如系统提示、工具描述）塑造，而“Harness”（执行层）负责调用模型、处理工具调用与控制循环，是智能体运行的核心。两者结合，模型才能成为智能体。文章以 Claude Code、Codex 为例，说明同一模型搭配不同 Harness 会产生迥异体验，并提出了 Agent &#x3D; Model + Harness 的常见理解框架。术语尚未统一，本文旨在提供一个实用的心智模型。</p><hr><hr><p><em>数据来源：AI HOT (aihot.virxact.com) | 生成时间：2026-05-26 22:08</em></p>]]>
    </content>
    <id>https://aifki.com/2026/05/26/ai-daily/</id>
    <link href="https://aifki.com/2026/05/26/ai-daily/"/>
    <published>2026-05-26T14:08:03.000Z</published>
    <summary>
      <![CDATA[<h1 id="AI-无涯日报-·-2026-05-26"><a href="#AI-无涯日报-·-2026-05-26" class="headerlink" title="AI 无涯日报 · 2026-05-26"></a>AI 无涯日报 · 2026-05-26</h1><]]>
    </summary>
    <title>AI 无涯日报 · 2026 年 5 月 26 日</title>
    <updated>2026-05-26T14:08:03.000Z</updated>
  </entry>
  <entry>
    <author>
      <name>无涯</name>
    </author>
    <category term="工具推荐" scheme="https://aifki.com/categories/%E5%B7%A5%E5%85%B7%E6%8E%A8%E8%8D%90/"/>
    <category term="2026-05" scheme="https://aifki.com/tags/2026-05/"/>
    <category term="AI 工具" scheme="https://aifki.com/tags/AI-%E5%B7%A5%E5%85%B7/"/>
    <category term="开源项目" scheme="https://aifki.com/tags/%E5%BC%80%E6%BA%90%E9%A1%B9%E7%9B%AE/"/>
    <category term="Grok" scheme="https://aifki.com/tags/Grok/"/>
    <category term="通义千问" scheme="https://aifki.com/tags/%E9%80%9A%E4%B9%89%E5%8D%83%E9%97%AE/"/>
    <content>
      <![CDATA[<h1 id="AI-工具推荐-·-2026-年-5-月"><a href="#AI-工具推荐-·-2026-年-5-月" class="headerlink" title="AI 工具推荐 · 2026 年 5 月"></a>AI 工具推荐 · 2026 年 5 月</h1><blockquote><p>每月精选实用 AI 工具与开源项目，提升你的工作效率。</p></blockquote><hr><h2 id="🔥-本月热点"><a href="#🔥-本月热点" class="headerlink" title="🔥 本月热点"></a>🔥 本月热点</h2><h3 id="Grok-Build-Beta-—-xAI-的-AI-开发平台"><a href="#Grok-Build-Beta-—-xAI-的-AI-开发平台" class="headerlink" title="Grok Build Beta — xAI 的 AI 开发平台"></a>Grok Build Beta — xAI 的 AI 开发平台</h3><p>Grok Build Beta 版已向 SuperGrok 和 X Premium+ 用户开放。支持 Plan Mode 规划模式，通过 Imagine 创建图像和视频，并提供 CLI 工具用于构建自动化流程和编排器。对于 AI 开发者来说，这是一个值得关注的新平台。</p><ul><li>平台：X &#x2F; xAI</li><li>访问：<a href="https://x.ai/cli">x.ai&#x2F;cli</a></li></ul><hr><h2 id="🛠-实用工具"><a href="#🛠-实用工具" class="headerlink" title="🛠 实用工具"></a>🛠 实用工具</h2><h3 id="Qwen3-7-Max-隐式缓存"><a href="#Qwen3-7-Max-隐式缓存" class="headerlink" title="Qwen3.7-Max 隐式缓存"></a>Qwen3.7-Max 隐式缓存</h3><p>通义千问 Qwen3.7-Max 上线隐式缓存功能——自动启用，无需手动设置。开箱即用的加速缓存让推理更快、成本更低，适合需要高频调用的场景。如果你在用通义千问的 API，这个功能可以直接降低使用成本。</p><ul><li>平台：阿里云 Model Studio</li><li>链接：<a href="https://www.alibabacloud.com/help/en/model-studio/explicit-cache-best-practice">最佳实践</a></li></ul><hr><h2 id="📚-学习资源"><a href="#📚-学习资源" class="headerlink" title="📚 学习资源"></a>📚 学习资源</h2><h3 id="Harness、Scaffold-与-AI-智能体术语辨析"><a href="#Harness、Scaffold-与-AI-智能体术语辨析" class="headerlink" title="Harness、Scaffold 与 AI 智能体术语辨析"></a>Harness、Scaffold 与 AI 智能体术语辨析</h3><p>Hugging Face 发布了一篇实用的 AI 智能体术语解析文章，厘清了 Agent 生态中的关键概念：</p><ul><li><strong>模型</strong> — 无记忆、无循环的大语言模型</li><li><strong>Scaffolding</strong> — 行为定义层（系统提示、工具描述）</li><li><strong>Harness</strong> — 执行层，负责调用模型、处理工具调用与控制循环</li></ul><p>文章指出 <code>Agent = Model + Harness</code> 是目前最实用的理解框架，并以 Claude Code、Codex 为例说明了同一模型搭配不同 Harness 会产出迥异体验。</p><ul><li>链接：<a href="https://huggingface.co/blog/agent-glossary">Hugging Face Blog</a></li></ul><hr><h2 id="🔬-开源项目"><a href="#🔬-开源项目" class="headerlink" title="🔬 开源项目"></a>🔬 开源项目</h2><h3 id="OpenSenseNova-—-SenseNova-U1-全训练代码开源"><a href="#OpenSenseNova-—-SenseNova-U1-全训练代码开源" class="headerlink" title="OpenSenseNova — SenseNova-U1 全训练代码开源"></a>OpenSenseNova — SenseNova-U1 全训练代码开源</h3><p>商汤 SenseNova-U1 的完整训练代码库已开源，支持其 8B 密集模型与 A3B MoE 架构。使用一个统一的框架即可同时训练多种多模态任务，包括文本到图像生成、图像编辑、交错生成及文本与视觉理解。</p><p>对于希望深入研究多模态模型训练的研究者和开发者来说，这是一个非常有价值的参考实现。</p><hr><h2 id="💡-小技巧"><a href="#💡-小技巧" class="headerlink" title="💡 小技巧"></a>💡 小技巧</h2><h3 id="利用-AI-HOT-快速追踪行业动态"><a href="#利用-AI-HOT-快速追踪行业动态" class="headerlink" title="利用 AI HOT 快速追踪行业动态"></a>利用 AI HOT 快速追踪行业动态</h3><p>AI HOT（aihot.virxact.com）是一个免费的中文 AI 热点聚合平台，每天自动整理全球 AI 新闻并按版块分类（模型&#x2F;产品&#x2F;行业&#x2F;论文&#x2F;技巧）。你可以直接访问网站，也可以用 API 集成到自己的工作流中。</p><hr><p><em>编辑：AI 无涯 | 数据来源：AI HOT (aihot.virxact.com)</em></p>]]>
    </content>
    <id>https://aifki.com/2026/05/26/tools-recommend/</id>
    <link href="https://aifki.com/2026/05/26/tools-recommend/"/>
    <published>2026-05-26T09:00:00.000Z</published>
    <summary>
      <![CDATA[<h1 id="AI-工具推荐-·-2026-年-5-月"><a href="#AI-工具推荐-·-2026-年-5-月" class="headerlink" title="AI 工具推荐 · 2026 年 5 月"></a>AI 工具推荐 · 2026 年 5 月</h1><]]>
    </summary>
    <title>AI 工具推荐 · 2026 年 5 月</title>
    <updated>2026-05-26T09:00:00.000Z</updated>
  </entry>
  <entry>
    <author>
      <name>无涯</name>
    </author>
    <category term="论文速递" scheme="https://aifki.com/categories/%E8%AE%BA%E6%96%87%E9%80%9F%E9%80%92/"/>
    <category term="学术论文" scheme="https://aifki.com/tags/%E5%AD%A6%E6%9C%AF%E8%AE%BA%E6%96%87/"/>
    <category term="AI 研究" scheme="https://aifki.com/tags/AI-%E7%A0%94%E7%A9%B6/"/>
    <category term="图灵测试" scheme="https://aifki.com/tags/%E5%9B%BE%E7%81%B5%E6%B5%8B%E8%AF%95/"/>
    <category term="扩散模型" scheme="https://aifki.com/tags/%E6%89%A9%E6%95%A3%E6%A8%A1%E5%9E%8B/"/>
    <category term="2026-05" scheme="https://aifki.com/tags/2026-05/"/>
    <content>
      <![CDATA[<h1 id="AI-论文速递-·-2026-05-26"><a href="#AI-论文速递-·-2026-05-26" class="headerlink" title="AI 论文速递 · 2026-05-26"></a>AI 论文速递 · 2026-05-26</h1><blockquote><p>精选今日 AI 领域值得关注的学术论文与研究动态。</p></blockquote><hr><h2 id="头条"><a href="#头条" class="headerlink" title="头条"></a>头条</h2><p><strong>1. 图灵测试 76 年后首现 AI 通过实证：GPT-4.5 以 73% 判定率超越真人</strong></p><p>加州大学圣地亚哥分校研究首次实证现代 AI 可通过图灵测试。在获得特定提示后，GPT-4.5 在 5 至 15 分钟的对话中被误认为人类的概率高达 73%，显著超过真人参与者（被判定为人类的概率仅 67%）。这是图灵测试提出 76 年来，AI 首次在严格实证中跨越这一里程碑。</p><p><a href="https://www.ithome.com/0/953/705.htm">IT之家</a></p><hr><h2 id="模型与推理"><a href="#模型与推理" class="headerlink" title="模型与推理"></a>模型与推理</h2><p><strong>2. 奖励倾斜分布匹配：强化少步生成器的新框架</strong></p><p>本文提出 RTDMD（奖励倾斜分布匹配蒸馏），一个将分布匹配蒸馏与奖励引导强化学习统一应用于少步流生成器的两阶段框架。通过最小化到奖励倾斜教师分布的 KL 散度，在图像和视频生成任务上实现了更优的质量与效率平衡。</p><p><a href="https://arxiv.org/abs/2605.26108">arXiv</a></p><p><strong>3. Nemotron-Labs 扩散语言模型：光速级文本生成</strong></p><p>NVIDIA 发布 Nemotron-Labs 扩散语言模型研究，通过扩散语言模型架构大幅提升文本生成速度，可实现”光速级”的文本输出。该工作已在 Hugging Face 上公开技术细节。</p><p><a href="https://huggingface.co/blog/nvidia/nemotron-labs-diffusion">Hugging Face Blog</a></p><p><strong>4. 从推理链到可验证子问题：课程强化学习实现 LLM 推理的信用分配</strong></p><p>针对基于结果的强化学习在处理困难推理问题时因正确样本稀少而效率低下的问题，本文提出子问题课程强化学习框架。该框架从参考推理链中提取可验证子问题，逐步训练模型掌握复杂推理能力。</p><p><a href="https://arxiv.org/abs/2605.22074">arXiv</a></p><hr><h2 id="系统与架构"><a href="#系统与架构" class="headerlink" title="系统与架构"></a>系统与架构</h2><p><strong>5. ZCube：超大规模大模型推理的网络优化</strong></p><p>智谱 AI 发布 ZCube 网络架构研究，针对超大规模大模型推理场景，通过取消 Spine 层、将 Leaf 交换机分组并全互联等创新设计，有效解决推理网络的拥塞问题。实测实现了显著的性能提升。</p><p><a href="https://www.zhipuai.cn/zh/research/160">智谱 AI 研究</a></p><p><strong>6. RiT：在表示空间中使用原生扩散变换器已足够</strong></p><p>本研究探讨预训练表示空间在流匹配学习中的优势。比较像素、SD-VAE 与 DINOv2 特征后发现，使用 DINOv2 表示空间的扩散变换器在生成质量和计算效率上均表现优越。</p><p><a href="https://arxiv.org/abs/2605.21981">arXiv</a></p><hr><h2 id="安全与评估"><a href="#安全与评估" class="headerlink" title="安全与评估"></a>安全与评估</h2><p><strong>7. 微软 Copilot Cowork 存在文件泄露问题</strong></p><p>安全研究团队发现微软 Copilot Cowork 功能存在文件泄露风险，可导致敏感文件被提取。企业用户需关注相关安全配置并及时评估风险。</p><p><a href="https://www.promptarmor.com/resources/microsoft-copilot-cowork-exfiltrates-files">PromptArmor</a></p><p><strong>8. VSAS-Bench：视觉流式辅助模型的实时评估基准</strong></p><p>Apple 研究团队提出 VSAS-Bench，一个专为实时视觉助手设计的评估基准。现有框架主要在离线场景下评估，但流式模型还需考量响应时效性（主动性）和随时间推移的响应稳定性（一致性）等额外指标。</p><p><a href="https://machinelearning.apple.com/research/vsas-bench-streaming-assistant">Apple Research</a></p><hr><h2 id="硬件突破"><a href="#硬件突破" class="headerlink" title="硬件突破"></a>硬件突破</h2><p><strong>9. 华为何庭波”韬定律”：逻辑折叠技术提升芯片性能</strong></p><p>华为何庭波在 ISCAS 2026 上提出”韬定律”，介绍逻辑折叠技术。通过三维空间拓扑重组，不依赖新光刻工艺即可提升芯片性能。在麒麟 2026 测试中，晶体管密度提升至 238 MTr&#x2F;mm²，能效提高 41%，最大时钟频率提升近 13%。升腾 990 计划 2030 年左右引入该技术。</p><p><a href="https://www.ithome.com/0/954/778.htm">IT之家</a></p><hr><p><em>数据来源：AI HOT (aihot.virxact.com) | 编辑：AI 无涯</em></p>]]>
    </content>
    <id>https://aifki.com/2026/05/26/paper-digest/</id>
    <link href="https://aifki.com/2026/05/26/paper-digest/"/>
    <published>2026-05-26T08:00:00.000Z</published>
    <summary>
      <![CDATA[<h1 id="AI-论文速递-·-2026-05-26"><a href="#AI-论文速递-·-2026-05-26" class="headerlink" title="AI 论文速递 · 2026-05-26"></a>AI 论文速递 · 2026-05-26</h1><]]>
    </summary>
    <title>AI 论文速递 · 2026 年 5 月 26 日</title>
    <updated>2026-05-26T08:00:00.000Z</updated>
  </entry>
</feed>
