晨信

AI 早报 · 2026-04-08

2026-04-0819 分钟
#早报
Dear 哞小哞,

Anthropic 同一天做了两件事:发布一个"太危险不能公开"的模型,以及让 Claude 全球宕机。一家公司同时是安全先锋和基础设施短板,这大概就是 2026 年 AI 行业的缩影。


今日焦点

1. Claude Mythos:一个"太危险不发布"的模型,自主发现所有主流 OS 和浏览器的零日漏洞

Anthropic 发布 Claude Mythos Preview——一个因攻防双用性而拒绝公开发布的通用模型。该模型非专门针对网络安全训练,但在自主漏洞挖掘上表现惊人:在 Firefox 147 JavaScript 引擎测试中,Opus 4.6 几百次尝试仅成功 2 次,Mythos 成功 181 次。它已自主发现数千个高危漏洞,包括一条链式利用四个漏洞的浏览器攻击链(含 JIT heap spray,同时逃逸渲染器和操作系统沙箱)。Anthropic 承认 99% 以上发现的漏洞尚未修补,只能公开约 1% 已修复案例。非安全专业人员也能一夜获得完整的远程代码执行漏洞利用。

Anthropic 联合 Apple、Google、AWS、Microsoft 等 45+ 家组织推出 Project Glasswing,通过受限合作伙伴计划向约 40 家机构(含 JPMorgan、Cisco、CrowdStrike)提供访问权限,承诺最高 1 亿美元使用额度。开源社区一线维护者的反馈印证了这一质变:curl 作者 Daniel Stenberg 称每天花数小时处理 AI 提交的真实漏洞报告,安全研究员 Thomas Ptacek 直言"漏洞研究已死"。

为什么值得关注:AI 网络安全能力的分水岭时刻——一个通用模型能自主发现并利用零日漏洞,且被开发者认为"太危险不能公开"。

🔗 Anthropic Teams Up With Its Rivals to Keep AI From Hacking Everything · Assessing Claude Mythos Preview's cybersecurity capabilities · Anthropic Claims Its New A.I. Model, Mythos, Is a Cybersecurity 'Reckoning' · A new Anthropic model found security problems 'in every major operating system and web browser' · Anthropic debuts preview of powerful new AI model Mythos · Anthropic's Project Glasswing sounds necessary to me

2. GLM-5.1 开源发布:单任务可持续工作 8 小时,SWE-Bench Pro 超越 Opus 4.6 和 GPT-5.4

智谱 AI 发布 GLM-5.1,7540 亿参数 MoE 模型,MIT 许可开源。核心突破不在参数规模,而在"可持续自主工作时间"——能在单任务上持续工作长达 8 小时、执行 1700+ 步骤、6000+ 次工具调用。Z.ai 提出了"楼梯式优化"模式:模型在固定策略内微调后发生结构性策略转变,从而突破性能天花板。在 VectorDBBench 测试中,GLM-5.1 通过 655 次迭代将向量数据库性能推到远超 Claude Opus 4.6(3547 QPS)的水平。Z.ai 创始人 Lou 在 X 上表示:"自主工作时间可能是缩放定律之后最重要的曲线。"Z.ai 今年初在港交所上市,市值 528.3 亿美元。

为什么值得关注:中国开源 AI 再次刷新标杆,"可持续工作时间"作为新维度可能重新定义 Agent 系统的竞争格局。

🔗 AI joins the 8-hour work day as GLM ships 5.1 open source LLM

3. "问题在于 Sam Altman":《纽约客》百人调查揭示 OpenAI 内部信任危机

《纽约客》发布重磅调查,采访 100 多位知情人士并审查内部备忘录,描绘了一幅 Sam Altman 不被内部信任的画像。一位董事会成员评价他兼具"极度讨好人的欲望"和"近乎反社会人格般对欺骗后果的漠不关心"。前首席科学家 Ilya Sutskever 和前研究主管 Dario Amodei 都曾留下书面记录,认为 Altman "未能为先进 AI 营造安全环境"。就在同一天,OpenAI 发布了关于"超级智能"的政策建议白皮书,呼吁透明和以人为本。两份文件并置令人极度违和。Altman 对报道中的说法逐一否认或声称遗忘。

为什么值得关注:AI 行业最有权势的人面临最深入的一次信誉调查,调查结果与 OpenAI 的公开叙事形成尖锐矛盾。

🔗 "The problem is Sam Altman": OpenAI insiders don't trust CEO

4. Nvidia 收购 SchedMD:当芯片巨头同时掌握硬件和底层调度软件

Nvidia 收购 SchedMD(Slurm 工作负载管理器背后的公司)引发 AI 行业和超算领域的广泛担忧。Slurm 是全球超级计算和 AI 集群最核心的作业调度系统,同时运行在 Nvidia、AMD、Intel 等多家硬件上。五位行业匿名消息人士向 Reuters 表示,控制调度软件的厂商拥有巨大杠杆,可以影响竞争对手硬件的运行效率——无论其是否实际行使这种权力。核心担忧是 Nvidia 可能通过代码优先级或路线图决策来偏袒自家硬件。

为什么值得关注:当一家芯片巨头同时掌握硬件和底层调度软件,整个 AI 基础设施的竞争格局可能被根本改变。

🔗 Nvidia's SchedMD acquisition puts open-source AI scheduling under scrutiny

5. Amazon S3 Files:云存储首次为 AI Agent 原生场景做根本性改造

AWS 推出 S3 Files,为 AI Agent 提供原生文件系统工作空间。长期以来,对象存储(S3)与文件系统的语义鸿沟是构建多 Agent 流水线的主要痛点——Agent 需要目录结构、追加写入、随机读写等操作,而 S3 的对象模型无法直接满足。S3 Files 本质上是在对象存储之上封装了一层 POSIX 兼容的文件系统接口,让多个 Agent 可以像操作本地文件一样协作处理数据,无需额外转换。这解决了 Agent 之间通过文件传递中间结果的工程瓶颈。

为什么值得关注:这是云存储基础设施首次为 AI Agent 原生场景做根本性改造,标志着"AI-First 基础设施"从算力层延伸到存储层。

🔗 Amazon S3 Files gives AI agents a native file system workspace

6. OpenAI 发布 AI 时代经济政策白皮书:机器人税 + 四天工作制 + 公共财富基金

OpenAI 发布政策白皮书,三大核心主张:一是"机器人税"——对自动化替代人力的企业征收特别税,税收用于公共福利基金;二是推动四天工作制——建议政府通过税收激励鼓励企业利用 AI 生产力提升将工作周缩短为 4 天且不降薪;三是建立"公共财富基金"——由政府和 AI 企业共同投资 AI 相关资产,收益直接分配给公民。OpenAI 还建议将税基从劳动收入转向企业利润和资本收益,并强调加强 AI 时代的工人再培训投资。这标志着 OpenAI 从纯技术公司正式转向政策倡导者角色。

为什么值得关注:全球最具影响力的 AI 公司首次系统性提出 AI 时代的经济政策框架,"机器人税"和"四天工作制"一旦进入政策议程将影响所有行业。

🔗 机器人交税养打工人!奥特曼AI新政曝光,上4休3要成真? · OpenAI calls for a four-day workweek — and a 'robot tax'

7. Claude Code 遭企业开发者质疑:复杂工程中"跳过难点"

AMD AI 团队高级总监 Stella Laurenzo 公开在 GitHub Issues 中指出,Claude Code 在 2 月更新后出现质量回退,对复杂工程任务(如硬件调试和内核级问题)倾向于"跳过难点",给出看似合理但经不起推敲的答案。她将其形容为"更快、更轻、太急于翻篇",导致团队已停止在复杂工程任务中使用该工具。这反映了当前 AI 编程助手在从"演示级"走向"生产级"过程中的关键瓶颈。

为什么值得关注:来自一线高管的真实反馈,揭示了 AI 编程工具在复杂工程场景下的可靠性天花板。

🔗 Enterprise developers question Claude Code's reliability for complex engineering


跨领域关联

AI 安全叙事的内在矛盾

同一天内,三个相互矛盾的信息同时出现:Anthropic 发布"太危险不公开"的 Mythos 模型并联合 45 家机构防御 AI 网络威胁;OpenAI 发布政策白皮书呼吁"以人为本"的 AI 治理;而《纽约客》的调查揭露 OpenAI CEO Sam Altman 被内部视为"未能营造安全环境"的人。安全叙事的生产者自身就是最被质疑的对象——这种矛盾不是偶然,而是 AI 行业"能力狂奔、治理追赶"结构性失衡的症状。

从"软件 AI"到"物理 AI"的资本大迁徙

三个信号指向同一趋势:Generalist 发布 GEN-1 机器人系统在通用物理任务上达到 99% 可靠性;VC Eclipse 完成 13 亿美元基金专项押注"物理 AI"赛道;Amazon S3 Files 为 AI Agent 提供原生文件系统工作空间。资本和基础设施正在从纯数字世界的 AI 应用,转向连接物理世界的 AI 系统。这意味着下一个竞争维度不再是"谁的模型更聪明",而是"谁的 AI 能在真实物理环境中可靠运行"。

多智能体架构的两面性

Google 开源 Scion 多智能体编排框架,提出"隔离优于约束"理念;学术圈同时涌现 Topaz(可解释模型路由)和 MultiPress(多智能体新闻分类)等框架;但另一篇文章警告多智能体竞态条件将成为生产事故主因。多智能体正从学术概念变成工程现实,但工程复杂度的增长速度远超可靠性保障能力的建设速度。


意外发现

用雨伞"钓"无人机:物理世界对抗攻击的新范式

研究者发现只需用一把普通雨伞做出特定动作,就能欺骗无人机的视觉跟踪系统,使其错误地将雨伞识别为跟踪目标并跟随移动,实现对无人机的物理"劫持"。攻击对象不是单个算法,而是整个"感知→决策→控制"的闭环系统。攻击者不需要懂代码,只需一把雨伞。

🔗 用雨伞「钓」无人机?首个针对自主目标跟踪闭环系统的物理攻击

"AI 提升 40% 生产力"的算术陷阱

用蒙特卡洛模拟表明,即使每个环节真实提升 10-20%,经过组织摩擦损耗后,整体净增益通常只有 3-8%。生产力提升的"算术"不是简单加法,而是一个受组织惯性严重衰减的乘法系统。戳破了 AI 生产力宣传的泡沫。

🔗 The Arithmetic of Productivity Boosts


全部采集一览

AI 技术

1. MultiPress: A Multi-Agent Framework for Interpretable Multimodal News Classification

2. Claude灾难级大宕机,全球开发者集体炸锅!Anthropic三连翻车被怒喷

3. Handling Race Conditions in Multi-Agent Orchestration

4. Explainable Model Routing for Agentic Workflows

5. Towards the AI Historian: Agentic Information Extraction from Primary Sources

6. 坏了,我成AI的乙方了!Anthropic论文爆火,谁还敢无脑Copy?

7. IC3-Evolve: Proof-/Witness-Gated Offline LLM-Driven Heuristic Evolution for IC3 Hardware Model Checking

8. Are Arabic Benchmarks Reliable? QIMMA's Quality-First Approach to LLM Evaluation

9. Vocabulary Dropout for Curriculum Diversity in LLM Co-Evolution

10. Automated Analysis of Global AI Safety Initiatives: A Taxonomy-Driven LLM Approach

11. When Adaptive Rewards Hurt: Causal Probing and the Switching-Stability Dilemma in LLM-Guided LEO Satellite Scheduling

12. SQUIRE: Interactive UI Authoring via Slot QUery Intermediate REpresentations

13. 10 LLM Engineering Concepts Explained in 10 Minutes

14. Democratizing Marketing Mix Models (MMM) with Open Source and Gen AI

15. AI joins the 8-hour work day as GLM ships 5.1 open source LLM

16. Amazon S3 Files gives AI agents a native file system workspace

17. 7 Steps to Mastering Retrieval-Augmented Generation

18. From 4 Weeks to 45 Minutes: Designing a Document Extraction System for 4,700+ PDFs

19. Supabase vs Firebase: Which Backend Is Right for Your Next App?

20. Context Engineering for AI Agents: A Deep Dive

21. The Arithmetic of Productivity Boosts

22. 「OpenClaw之父点赞」终结百虾大战?一场升级版的AI原生革命上演

23. 机器人交税养打工人!奥特曼AI新政曝光,上4休3要成真?

24. 用雨伞「钓」无人机?首个针对自主目标跟踪闭环系统的物理攻击

43. Google open-sources experimental agent orchestration testbed Scion

44. /dev for Claude Code

53. Transformers V4 最新发布!浏览器也能跑 AI 模型了

59. Identifying Necessary Transparency Moments In Agentic AI (Part 1)

产业与商业

25. Anthropic's New TPU Deal, Anthropic's Computing Crunch, The Anthropic-Google Alliance

33. Nvidia's SchedMD acquisition puts open-source AI scheduling under scrutiny

34. Enterprise developers question Claude Code's reliability for complex engineering

36. From folding boxes to fixing vacuums, GEN-1 robotics model hits 99% reliability

38. VC Eclipse has a new $1.3B to back — and build — 'physical AI' startups

41. Your Next Stock Report Could Be Written by AI Agents

42. Nvidia's SchedMD acquisition (Computerworld)

46. When Will Anthropic Surpass NVIDIA?

49. Anthropic says its latest AI model is too powerful for public release

50. Anthropic Lets Apple, Amazon Test More Powerful Mythos AI Model

51. Anthropic in Talks to Invest $200 Million in New Private-Equity Venture

52. Anthropic Poaches Microsoft Executive to Lead Infrastructure

55. OpenAI's Warning Shot to Chinese Video Rivals

56. Musk Wants OpenAI Nonprofit to Get Any Trial Winnings From Suit

57. OpenAI's newest fellowship includes up to $15,000 in AI compute a month

62. Building A Bulletproof Strategy For Data Recovery (Sponsored)

安全

26. Anthropic Teams Up With Its Rivals to Keep AI From Hacking Everything

29. Anthropic debuts preview of powerful new AI model Mythos

30. Anthropic Claims Its New A.I. Model, Mythos, Is a Cybersecurity 'Reckoning'

31. A new Anthropic model found security problems 'in every major OS and browser'

32. Assessing Claude Mythos Preview's cybersecurity capabilities

37. Anthropic says its most powerful AI cyber model is too dangerous to release

39. Anthropic's Project Glasswing sounds necessary to me

40. Iran-Linked Hackers Are Sabotaging US Energy and Water Infrastructure

45. ICE acknowledges it is using powerful spyware

政策与治理

27. OpenAI calls for a four-day workweek — and a 'robot tax'

35. "The problem is Sam Altman": OpenAI insiders don't trust CEO

10. Automated Analysis of Global AI Safety Initiatives

能源

58. Ranking Of G-20 Countries' Energy Security Before And During Iran War

69. 政府「原油 年を越えて供給確保にめど」

地缘政治

40. Iran-Linked Hackers Are Sabotaging US Energy and Water Infrastructure

54. Shots fired at home of Indiana politician, who found 'No data centers' note

60. Why Viktor Orban wants energy prices at the heart of Hungary's elections

64. Europe remains committed: Commissioner Síkela announces 'new approach'

65. Iran positively reviewing Pakistan's request for a two-week ceasefire

66. How Much Humiliation Can Vance Take?

67. Meet the four Democratic tribes

73. 国会 今年度予算が成立 「国家情報局」設置法案など論戦続く

科学与航天

68. Photos: NASA releases first images from moon flyby

70. Astronauts suggest naming a moon crater 'Carroll' after their commander's late wife

72. The crew of Artemis II is returning to a planet they have cheered up

硬件与机器人

36. From folding boxes to fixing vacuums, GEN-1 robotics model hits 99% reliability

38. VC Eclipse has a new $1.3B to back — and build — 'physical AI' startups

前端开发

47. 终端里也能用鼠标点位置了!Claude Code 推出 NO_FLICKER 全新渲染模式

48. 【早说】不用IDE,只用计划文件和语音:所知道的Claude Code全部技巧](http://mp.weixin.qq.com/s?__biz=MjM5MTA1MjAxMQ==&mid=2651278878&idx=1&sn=6c046dd000e27096fef7277b4f7ab421&chksm=bc764d3f8901646b987291836b932b1ed972a9edad2fbafa85ecf1c766053056dca59c63adf5&scene=0#rd)

53. Transformers V4 最新发布!浏览器也能跑 AI 模型了

63. What to know about JavaScript in 2026

其他

61. 《异度传说II&Ⅲ》和《.hack》系列原声带将于5月27日再发行

71. Plan 2 student loan interest rates capped at 6% in England

74. A visual guide to getting out of a creative slump

75. Between the User and the Used: Zadie Smith on Instrumentalism

28. Claude suffered a 'major outage.' Anthropic says it's fixed.

Lin
2026-04-08