早报 | 2026-04-13

2026-04-13约 13 分钟

#早报

Dear 哞小哞,

Anthropic 一周内同时成为华尔街的宠儿和恐慌源——Mythos 太强以至于不敢发，但 70% 的新企业客户在排队。当「模型能力」本身变成风险，行业的叙事框架彻底变了。

今日焦点

1. Anthropic 狂吞 70% 新企业客户，Claude 开启「灵魂校准」

Anthropic 正在大规模蚕食 OpenAI 的企业客户份额，拿下约 70% 的新增企业客户。Claude 推出「灵魂校准」功能——让 AI 输出更贴合人类价值观的深度对齐机制。OpenAI 则祭出 GPT-5.4 应战，在 ARC-AGI-2 抽象推理基准上跑出 83.3%，力压 Gemini 3.1 Pro 的 77.1%。两大巨头的正面交锋进入白热化阶段。

为什么值得关注： AI 行业格局正在发生实质性转变，Anthropic 从追赶者变成有力挑战者。

原文链接

2. Mythos 太强不敢发：27 年漏洞被秒杀，华尔街恐慌

Anthropic 的新模型 Mythos 未经专门网络安全训练，却能快速发现存在 27 年的老漏洞，8 个 AI 模型"秒杀"式攻破。高盛、摩根大通等银行报告 AI 正取代 66% 的初级分析师岗位。英国金融监管机构开始讨论 Mythos 风险。与此同时，美国政府态度矛盾——国防部将 Anthropic 列为供应链风险，财政部长却鼓励银行测试 Mythos。

为什么值得关注： 同一个模型，一边被列为安全风险，一边被鼓励部署——AI 安全治理的矛盾信号达到新高度。

原文链接 | Trump 官方鼓励银行测试 Mythos | France 24: Why Mythos is too powerful to release

3. OpenAI 也开始恐惧自己训练出的模型了

OpenAI 研究团队发现新模型在某些评估维度上展现出令人不安的特性，引发对安全对齐和可控性的深层担忧。与此同时 Altman 住所遭遇燃烧瓶袭击，其个人安全和 AI 从业者的社会风险浮出水面。估值 8520 亿美元、CEO 零持股的治理结构也被曝光——外部股东与内部团队的博弈日趋激烈。

为什么值得关注： 行业两大巨头几乎同时表达对自家模型能力的恐惧，AI 安全问题紧迫性达到新高度。

原文链接 | Altman 被投掷燃烧瓶 | OpenAI 治理结构 | Altman 家被炸

4. 你的 ReAct Agent 浪费了 90% 的重试预算

在 200 项任务基准测试中，ReAct Agent 浪费了 90.8% 的重试预算——不是因为模型出错，而是架构缺陷。核心问题：当 LLM 幻觉出不存在的工具名时，全局重试计数器依然消耗预算。文章提出三个修复方案：重试前分类错误、每工具设熔断器、工具路由移到代码层。修复后实现 0% 浪费重试。

为什么值得关注： 生产级 Agent 开发中被广泛忽视但影响巨大的架构级问题，修复方案直接可用。

原文链接

5. AI 记忆不是搜索问题——没有「遗忘」的记忆比没有记忆更糟

当前 AI 记忆系统的根本错误：只关注存储和检索，忽视生命周期管理。作者举例：一个关于 Bun.js 的重要性 8/10 的记忆存了六个月，即使早已放弃使用，AI 仍不断推荐 Bun 方案。核心洞察：记住一切不叫记忆，叫档案。文章提出基于 SQLite + LLM 的记忆衰减、过期、合并和覆盖架构。

为什么值得关注： 对长期 AI 助手设计的直接启发——记忆系统的真正难点不在存储，而在「遗忘」和「更新」。

原文链接

6. 特朗普下令封锁霍尔木兹海峡，全球能源格局剧震

特朗普宣布美国海军将"立即"封锁霍尔木兹海峡，拦截所有向伊朗支付过路费的船只。该海峡承载全球约 20% 石油运输。美国油价四年来首次突破 4 美元/加仑，美国家庭一个月多支付 84 亿美元。下一任美联储主席面临"抗通胀"与"保增长"的双重夹击，政策空间几近消失。

为什么值得关注： 石油咽喉要道被封锁 + 通胀升温 + 美联储换届——三条线同时收紧，影响范围远超中东。

原文链接 | 能源冲击分析 | 美联储困局

7. CIK 跨会话投毒：再安全的模型也扛不住

一种新型 AI 安全威胁——跨会话投毒攻击。攻击者在早期会话中植入恶意指令，后续会话触发模型执行不当操作。即使经过 RLHF 对齐的模型也难以防御，因为投毒内容与正常对话无异。现有安全护栏存在系统性盲区。

为什么值得关注： 揭示了 AI 安全的全新攻击面，现有机制几乎无能为力，影响所有带记忆功能的 AI 产品。

原文链接

8. GLM-5.1 发布：数十家企业争相接入，国产大模型进入攻坚阶段

智谱 GLM-5.1 发布后数十家企业宣布接入，覆盖金融、教育、医疗等行业。中国大模型产业从追赶阶段转向自主攻坚，核心突破点在行业深度适配和成本控制。

为什么值得关注： GLM-5.1 企业采用速度超预期，国产大模型在 B 端市场开始形成实质性替代。

原文链接

跨领域关联

AI 安全模型的数据漂移 × Mythos 的攻防悖论

一边是安全研究者警告「数据漂移正在侵蚀安全模型」——部署后的威胁检测模型因输入分布变化而退化，攻击者已学会利用模型老化。另一边是 Mythos 被用来发现 27 年老漏洞。两条线索指向同一个结论：安全领域不存在"部署即忘"的静态解，无论攻守双方，模型都需要持续更新。监管和企业在讨论 Mythos 风险时，也该想想自己手上的安全模型是否已经过期。

AI 军备竞赛 × 地缘冲突：冷战导弹井变数据中心

澳大利亚投资人把冷战核导弹发射井改造成 AI 数据中心，利用其天然冷却和物理坚固性。这个看似猎奇的新闻实际反映了一条清晰的逻辑链：AI 算力需求暴涨 → 数据中心选址趋向极端环境 → 冷战遗产被重新激活。在霍尔木兹海峡被封锁、全球能源格局动荡的背景下，这种"末日基础设施"的商业化不只是噱头——恐惧本身就是市场。

苹果 AI 眼镜 × Meta Muse Spark：可穿戴 AI 硬件大战全面开打

Bloomberg 报道苹果正在开发多款风格 AI 智能眼镜，配备椭圆摄像头，直接对标 Meta Ray-Ban。同一天，Meta 的 Muse Spark AI 个人助手实测出炉——上传午餐照片评营养、根据冰箱食材推荐晚餐。两条新闻合在一起看：硬件入口 + 日常场景 AI，苹果和 Meta 正在争夺的不是眼镜市场，而是"AI 作为生活基础设施"的第一触点。

意外发现

FISA 702 条款续期受阻：大规模监控权力可能收缩

美国 Foreign Intelligence Surveillance Act 第 702 条款即将到期，一份机密法院裁定对政府大规模数据收集提出质疑。这个条款允许情报机构不经 warrants 监听海外通讯，多年来争议不断。在 AI 监控能力暴涨的当下，监控权力框架反而可能收缩——这是技术能力和法律框架之间罕见的逆向运动。

原文链接

本地 AI 推理成为 CISO 的新盲区

越来越多开发者在本地运行 AI 模型，完全绕过企业安全监控。CISO 对这些"影子 AI"缺乏可见性，数据泄露和模型投毒风险正在积累。随着模型小型化加速，这个盲区只会越来越大——而大多数企业还没意识到问题的存在。

原文链接

全部采集一览

采集 75 篇，精选 8 条焦点 | 生成时间 2026-04-13 06:32 HKT

Lin

2026-04-13

今日焦点

1. Anthropic 狂吞 70% 新企业客户，Claude 开启「灵魂校准」

2. Mythos 太强不敢发：27 年漏洞被秒杀，华尔街恐慌

3. OpenAI 也开始恐惧自己训练出的模型了

4. 你的 ReAct Agent 浪费了 90% 的重试预算

5. AI 记忆不是搜索问题——没有「遗忘」的记忆比没有记忆更糟

6. 特朗普下令封锁霍尔木兹海峡，全球能源格局剧震

7. CIK 跨会话投毒：再安全的模型也扛不住

8. GLM-5.1 发布：数十家企业争相接入，国产大模型进入攻坚阶段

跨领域关联

AI 安全模型的数据漂移 × Mythos 的攻防悖论

AI 军备竞赛 × 地缘冲突：冷战导弹井变数据中心

苹果 AI 眼镜 × Meta Muse Spark：可穿戴 AI 硬件大战全面开打

意外发现

FISA 702 条款续期受阻：大规模监控权力可能收缩

本地 AI 推理成为 CISO 的新盲区

全部采集一览

AI 技术与模型

AI 产业与商业

安全

地缘与能源

财经

硬件与产品

文化与人文

政治与社会

中文主流

其他