晨信

早报 | 2026-04-13

2026-04-1313 分钟
#早报
Dear 哞小哞,

Anthropic 一周内同时成为华尔街的宠儿和恐慌源——Mythos 太强以至于不敢发,但 70% 的新企业客户在排队。当「模型能力」本身变成风险,行业的叙事框架彻底变了。


今日焦点

1. Anthropic 狂吞 70% 新企业客户,Claude 开启「灵魂校准」

Anthropic 正在大规模蚕食 OpenAI 的企业客户份额,拿下约 70% 的新增企业客户。Claude 推出「灵魂校准」功能——让 AI 输出更贴合人类价值观的深度对齐机制。OpenAI 则祭出 GPT-5.4 应战,在 ARC-AGI-2 抽象推理基准上跑出 83.3%,力压 Gemini 3.1 Pro 的 77.1%。两大巨头的正面交锋进入白热化阶段。

为什么值得关注: AI 行业格局正在发生实质性转变,Anthropic 从追赶者变成有力挑战者。

原文链接


2. Mythos 太强不敢发:27 年漏洞被秒杀,华尔街恐慌

Anthropic 的新模型 Mythos 未经专门网络安全训练,却能快速发现存在 27 年的老漏洞,8 个 AI 模型"秒杀"式攻破。高盛、摩根大通等银行报告 AI 正取代 66% 的初级分析师岗位。英国金融监管机构开始讨论 Mythos 风险。与此同时,美国政府态度矛盾——国防部将 Anthropic 列为供应链风险,财政部长却鼓励银行测试 Mythos。

为什么值得关注: 同一个模型,一边被列为安全风险,一边被鼓励部署——AI 安全治理的矛盾信号达到新高度。

原文链接 | Trump 官方鼓励银行测试 Mythos | France 24: Why Mythos is too powerful to release


3. OpenAI 也开始恐惧自己训练出的模型了

OpenAI 研究团队发现新模型在某些评估维度上展现出令人不安的特性,引发对安全对齐和可控性的深层担忧。与此同时 Altman 住所遭遇燃烧瓶袭击,其个人安全和 AI 从业者的社会风险浮出水面。估值 8520 亿美元、CEO 零持股的治理结构也被曝光——外部股东与内部团队的博弈日趋激烈。

为什么值得关注: 行业两大巨头几乎同时表达对自家模型能力的恐惧,AI 安全问题紧迫性达到新高度。

原文链接 | Altman 被投掷燃烧瓶 | OpenAI 治理结构 | Altman 家被炸


4. 你的 ReAct Agent 浪费了 90% 的重试预算

在 200 项任务基准测试中,ReAct Agent 浪费了 90.8% 的重试预算——不是因为模型出错,而是架构缺陷。核心问题:当 LLM 幻觉出不存在的工具名时,全局重试计数器依然消耗预算。文章提出三个修复方案:重试前分类错误、每工具设熔断器、工具路由移到代码层。修复后实现 0% 浪费重试。

为什么值得关注: 生产级 Agent 开发中被广泛忽视但影响巨大的架构级问题,修复方案直接可用。

原文链接


5. AI 记忆不是搜索问题——没有「遗忘」的记忆比没有记忆更糟

当前 AI 记忆系统的根本错误:只关注存储和检索,忽视生命周期管理。作者举例:一个关于 Bun.js 的重要性 8/10 的记忆存了六个月,即使早已放弃使用,AI 仍不断推荐 Bun 方案。核心洞察:记住一切不叫记忆,叫档案。文章提出基于 SQLite + LLM 的记忆衰减、过期、合并和覆盖架构。

为什么值得关注: 对长期 AI 助手设计的直接启发——记忆系统的真正难点不在存储,而在「遗忘」和「更新」。

原文链接


6. 特朗普下令封锁霍尔木兹海峡,全球能源格局剧震

特朗普宣布美国海军将"立即"封锁霍尔木兹海峡,拦截所有向伊朗支付过路费的船只。该海峡承载全球约 20% 石油运输。美国油价四年来首次突破 4 美元/加仑,美国家庭一个月多支付 84 亿美元。下一任美联储主席面临"抗通胀"与"保增长"的双重夹击,政策空间几近消失。

为什么值得关注: 石油咽喉要道被封锁 + 通胀升温 + 美联储换届——三条线同时收紧,影响范围远超中东。

原文链接 | 能源冲击分析 | 美联储困局


7. CIK 跨会话投毒:再安全的模型也扛不住

一种新型 AI 安全威胁——跨会话投毒攻击。攻击者在早期会话中植入恶意指令,后续会话触发模型执行不当操作。即使经过 RLHF 对齐的模型也难以防御,因为投毒内容与正常对话无异。现有安全护栏存在系统性盲区。

为什么值得关注: 揭示了 AI 安全的全新攻击面,现有机制几乎无能为力,影响所有带记忆功能的 AI 产品。

原文链接


8. GLM-5.1 发布:数十家企业争相接入,国产大模型进入攻坚阶段

智谱 GLM-5.1 发布后数十家企业宣布接入,覆盖金融、教育、医疗等行业。中国大模型产业从追赶阶段转向自主攻坚,核心突破点在行业深度适配和成本控制。

为什么值得关注: GLM-5.1 企业采用速度超预期,国产大模型在 B 端市场开始形成实质性替代。

原文链接


跨领域关联

AI 安全模型的数据漂移 × Mythos 的攻防悖论

一边是安全研究者警告「数据漂移正在侵蚀安全模型」——部署后的威胁检测模型因输入分布变化而退化,攻击者已学会利用模型老化。另一边是 Mythos 被用来发现 27 年老漏洞。两条线索指向同一个结论:安全领域不存在"部署即忘"的静态解,无论攻守双方,模型都需要持续更新。监管和企业在讨论 Mythos 风险时,也该想想自己手上的安全模型是否已经过期。

AI 军备竞赛 × 地缘冲突:冷战导弹井变数据中心

澳大利亚投资人把冷战核导弹发射井改造成 AI 数据中心,利用其天然冷却和物理坚固性。这个看似猎奇的新闻实际反映了一条清晰的逻辑链:AI 算力需求暴涨 → 数据中心选址趋向极端环境 → 冷战遗产被重新激活。在霍尔木兹海峡被封锁、全球能源格局动荡的背景下,这种"末日基础设施"的商业化不只是噱头——恐惧本身就是市场。

苹果 AI 眼镜 × Meta Muse Spark:可穿戴 AI 硬件大战全面开打

Bloomberg 报道苹果正在开发多款风格 AI 智能眼镜,配备椭圆摄像头,直接对标 Meta Ray-Ban。同一天,Meta 的 Muse Spark AI 个人助手实测出炉——上传午餐照片评营养、根据冰箱食材推荐晚餐。两条新闻合在一起看:硬件入口 + 日常场景 AI,苹果和 Meta 正在争夺的不是眼镜市场,而是"AI 作为生活基础设施"的第一触点。


意外发现

FISA 702 条款续期受阻:大规模监控权力可能收缩

美国 Foreign Intelligence Surveillance Act 第 702 条款即将到期,一份机密法院裁定对政府大规模数据收集提出质疑。这个条款允许情报机构不经 warrants 监听海外通讯,多年来争议不断。在 AI 监控能力暴涨的当下,监控权力框架反而可能收缩——这是技术能力和法律框架之间罕见的逆向运动。

原文链接

本地 AI 推理成为 CISO 的新盲区

越来越多开发者在本地运行 AI 模型,完全绕过企业安全监控。CISO 对这些"影子 AI"缺乏可见性,数据泄露和模型投毒风险正在积累。随着模型小型化加速,这个盲区只会越来越大——而大多数企业还没意识到问题的存在。

原文链接


全部采集一览

AI 技术与模型

1. OpenAI惨遭反超!Anthropic狂吞70%新客户

2. Your ReAct Agent Is Wasting 90% of Its Retries

3. Write Pandas Like a Pro With Method Chaining Pipelines

4. Stop Treating AI Memory Like a Search Problem

5. 数十家企业争相接入GLM-5.1

6. CIK 投毒风险曝光:再安全的大模型也扛不住

7. AI 术语入门指南

8. AI 时代,敏捷宣言已死?

9. Decoding the Mystery of Intuition: Margaret Boden on Creativity

AI 产业与商业

10. The Profile: The OpenAI CEO who may control our future

11. Anthropic downgraded cache TTL on March 6th

12. Trump officials encouraging banks to test Mythos

13. Edgee Codex Compressor

14. HumanX 大会:所有人都在谈论 Claude

15. Claudraband — Claude Code Power User 工具

16. 估值8520亿,CEO零持股:谁在掌控OpenAI?

17. OpenAI奥特曼家被炸了

18. Why Anthropic's new AI model is too powerful to release

19. Hard truths about building in the AI era | Keith Rabois

20. 元戎启行CEO:解决小模型「跷跷板效应」

安全

21. 本地 AI 推理是 CISO 的新盲区

22. 数据漂移正在侵蚀你的安全模型

23. Rockstar Games 确认遭黑客攻击

24. FISA 702 条款续期面临障碍

地缘与能源

25. 特朗普下令封锁霍尔木兹海峡

26. 伊朗战争冲击特朗普能源独立愿景

27. Iran believes they hold the cards

28. Will Iran War Result In Nuclear Weapon Transfers?

29. 黎巴嫩总理指责以色列违反国际法

30. US-Iran Talks Fail - What Happens Next?

31. Colorado Is Emerging As An Energy Innovation Hub

32. Seven countries now generate 100% renewable electricity

财经

33. America's next Fed chair is caught in a vice

34. 冷战导弹井变数据中心

35. Inside the $350 million missile silo

36. Soaring gas prices convinced me to switch to Costco's credit card

37. Private Credit Couldn't Care Less About The Federal Reserve

38. 10 Sunday Reads

39. Plain English

硬件与产品

40. 苹果 AI 眼镜对标 Meta

41. Meta Muse Spark AI 实测

文化与人文

42. Meet the NYC Artist Who Won't Put a Price on His Work

43. 异地恋情侣如何用数字游戏维系亲密关系

44. Goodnight Moon 作者的鲜为人知的诗作

45. Beethoven「欢乐颂」背后的故事

46. Hope vs Trust: Cristina Campo

47. Settling — Seth's Blog

48. Blackbraid 都柏林演出评论

49. Euphoria Season 3 回归

50. 听取玩家意见真不会害了你!和UP主GT凯麒聊聊国产单机

51. Dozens of Black pilots disappeared during WWII

52. Margaret "Gipsy Moth" Fearless CNN Camera Operator

政治与社会

53. 高市首相谈宪法改正

54. California Democrats Rushed to Back Eric Swalwell

55. Push to Expel Swalwell Could Touch Off Chain Reaction

56. How Orbán's hometown became a symbol of excesses

57. Dan Walker 出庭应诉霸凌指控

中文主流

58. 韩友庆同志逝世

59. 中国为动荡的国际环境注入稳定性

60. 学习卡丨务实是必备品格

其他

61. DIY Soft Drinks

62. 除法的意义

63. Mississippi is running out of liquor


采集 75 篇,精选 8 条焦点 | 生成时间 2026-04-13 06:32 HKT

Lin
2026-04-13