AI 无涯日报 · 2026 年 6 月 3 日
AI 无涯日报 · 2026 年 6 月 3 日
无涯AI 无涯日报 · 2026 年 6 月 3 日
每日精选全球 AI 热点,5 分钟掌握行业动态。
模型发布/更新
1. 微软发布首款高级推理 AI 模型 MAI-Thinking-1
来源:The Verge / Microsoft
微软在 Build 2026 上发布了其首款高级推理 AI 模型 MAI-Thinking-1。该模型被定位为”中等规模”,能在关键软件工程基准测试中达到领先水平。微软称其完全从头使用干净数据进行训练,未涉及从第三方模型进行知识蒸馏,标志着微软在自研 AI 模型上迈出重要一步,与此前主要依赖 OpenAI 的策略形成对比。
2. 微软三款多模态模型同步上线 OpenRouter
来源:Microsoft AI
MAI-Image-2.5、MAI-Transcribe-1.5 和 MAI-Voice-2 三款模型同时上架 OpenRouter,覆盖图像生成、语音转录和语音合成领域。开发者可直接调用 API 集成到应用中,降低多模态能力接入门槛。
3. NVIDIA DGX Station GB300 开始发货
来源:NVIDIA
搭载 GB300 的桌面级数据中心系统 DGX Station 正从华硕、戴尔、技嘉、惠普、微星和超微等合作伙伴处发货。将数据中心级算力塞进桌面,对需要本地大模型训练的研究员和独立开发者来说是硬核生产力工具。
4. Holo3.1:快速本地计算机使用智能体发布
来源:Hugging Face
基于 Qwen 模型家族的计算机使用智能体系列 Holo3.1 正式发布,提供 0.8B、4B、9B 和 35B-A3B 四种尺寸,并首次发布量化检查点(FP8、Q4 GGUF、NVFP4)。在 AndroidWorld 基准测试中 35B-A3B 得分从 67% 提升至 79.3%,覆盖桌面、网页和移动环境。
5. OpenRouter 上线 DigitalOcean 推理服务
来源:OpenRouter
DigitalOcean 推理服务上线 OpenRouter,提供高性能推理覆盖热门开源权重模型。在 DeepSeek V3.2 的输出速度和延迟方面排名第一,适合对实时性要求高的应用场景。
产品发布/更新
6. Runway Aleph 2.0 API 上线
来源:Runway
Runway 将 Aleph 2.0 的视频编辑能力开放为 API,支持在多镜头序列中编辑最长 30 秒、1080p 分辨率的视频,仅修改指定部分。做视频工具的开发者可直接集成,简化处理逻辑。
7. 微软开源 Adaptive Spec-driven Scoring 框架
来源:Microsoft Research
微软开源发布 Adaptive Spec-driven Scoring for Evaluation and Regression Testing 框架。开发者可通过文本描述快速生成 AI 行为测试,用于模型评估与回归测试,将 AI 行为测试从写代码降格到写文字描述。
8. Replit + Microsoft Fabric 集成
来源:Replit / Microsoft
企业现在可以在 Replit 中构建内部工具、工作流或数据仪表板,并直接发布到 Microsoft Fabric,内置安全、身份验证和治理功能。对同时使用 Replit 和 Fabric 的企业来说,将内部工具从开发到上线的链路显著缩短。
9. 商汤开源 SenseNova-Skills AI 办公技能套件
来源:商汤科技
商汤推出 SenseNova-Skills 套件,包含从做图到写报告的一整套开箱即用的 agent 技能包,代码全部开源在 GitHub 上。想做 agent 产品的开发团队可直接 fork 使用,比等待 API 发布快得多。
10. 阿里云 AgentScope Java 1.1 发布
来源:阿里云
AgentScope Java 1.1 支持 Builder 多租户零代码企业平台、工作区驱动的进化与分布式隔离,从笔记本到集群无缝扩展。对 Java 生态的 Agent 开发者是个顺手的新选项。
行业动态
11. Alphabet 拟融资 800 亿美元,Anthropic 提交 IPO 申请
来源:Bloomberg
Alphabet 宣布拟通过股权融资 800 亿美元,用于扩展 AI 基础设施。Anthropic 已秘密提交 IPO 申请,在上市竞赛中领先于竞争对手 OpenAI。HPE 因 AI 基础设施需求旺盛,年度销售预期超出市场估计。
12. SK 海力士计划五年内晶圆产能翻倍
来源:彭博社
SK 会长崔泰源表示 SK 海力士计划未来五年内晶圆产能翻倍,并预计存储芯片短缺将持续到 2030 年。这一判断对 AI 基础设施和端侧产品的供应链预期具有重要参考价值。
13. Gemini Spark:最令人印象深刻也最可怕的 AI 体验
来源:The Verge
The Verge 编辑 David Pierce 首次深度体验 Google DeepMind 的 Gemini Spark 模型,称其为”最令人印象深刻也最可怕的 AI 体验”。该模型展现了 AI 代理在复杂任务中的惊人能力,但也让人看清未来 AI 的潜在影响有多深远。
14. 开放模型 OpenRouter 市场份额达 69%
来源:OpenRouter / 邵猛
据 OpenRouter 平台数据,开放权重模型产生了 69.1% 的 token 使用量,闭源模型为 30.9%。每轮新模型发布都会将使用量推上一个新台阶,开放模型内部竞争激烈,领导地位频繁更迭。
15. Olmo/Tulu 核心推手离开 Ai2
来源:Nathan Lambert
Olmo 和 Tulu 的核心推手离开 Allen Institute for AI(Ai2),对开放模型生态圈是一次不小的人事地震。其下一步去向可能比离职声明本身更值得关注。
16. Anthropic 扩展 Project Glasswing 计划
来源:Anthropic
Anthropic 将 AI 漏洞扫描计划 Project Glasswing 从软件公司扩展到电力、医疗等命脉行业。这是一次攻防格局的重要倾斜,安全从业者应紧密关注后续发展。
17. Anthropic 对白宫 AI 行政令表态
来源:Anthropic
Anthropic 对白宫 AI 行政令表示支持,称这是加强美国 AI 领导地位的重要一步。头部 AI 公司主动拥抱政策制定的趋势值得留意。
18. OpenAI 呼吁建立青少年 AI 安全研究所
来源:OpenAI
OpenAI 呼吁通过设立专门的 AI 安全研究所,在全球范围内保障青少年使用 AI 时的安全并创造更多发展机遇。这对所有从事教育 AI 的公司而言,青少年保护将成为监管重点。
论文研究
19. AFUN:迈向功能理解的可供性基础模型
来源:Hugging Face Daily Papers
AFUN 是一个用于功能理解的可供性基础模型。从单个 RGB-D 观察和语言任务描述出发,能同时预测任务条件的功能掩码和 3D 接触后运动曲线。在 4 个基准的 8 个测试集中平均 gIoU/cIoU 指标分别领先基线模型 +23.9/+26.3,可直接部署到真实机器人。
20. Google DeepMind 开源科学 Agent 工具包 Science Skills
来源:Google DeepMind
Google DeepMind 在 GitHub 上开源 Science Skills 工具包,以科学基础和更高 token 效率加速智能体工作流,推动 AI for Science 的发展。构建用于科学发现的自主智能体不再只是蓝图。
21. Anthropic 可解释性研究:区分因果效应相似的特征
来源:Anthropic
Anthropic 发布可解释性研究新成果,通过下游连接区分看似相同的特征,比仅看激活例子更能预测因果作用。对对齐审计和模型安全研究有重要参考价值。
技巧与观点
22. Gary Marcus:AI 信任为何必然崩塌
来源:Gary Marcus
知名 AI 批评者 Gary Marcus 在其可信赖 AI 专栏中,用数学理论的局限性与人类心理的复杂性双重框架,解释 AI 信任为何必然面临根本性挑战。系统和全面地探讨了深度学习信任问题的底层原因,安全从业者值得一读。
编辑:AI 无涯 | 数据来源:AI HOT (aihot.virxact.com)
