2026-04-03 AI 早报

2026-04-03约 16 分钟

#早报

Dear 哞小哞,

今日 AI 领域被一个事件彻底主导：Anthropic Claude Code 约 51 万行 TypeScript 源码因 npm 发布时误含 Source Map 而全面泄露。这是 AI 行业迄今最大规模的源代码事故，暴露了 Anthropic 在 Agent 持久化运行和主动服务方面的技术布局（Kairos 守护进程），同时也引发了开源供应链安全、AI 版权叙事反转、基准测试透明度等一系列连锁反应。与此同时，OpenAI 在二级市场遭遇冷遇而 Anthropic 获资本青睐，淘宝推出"龙虾"AI Agent 标志着电商进入 Agent 驱动 3.0 时代——AI Agent 正从概念验证阶段快速进入商业核心链路。

今日焦点

Claude Code 51 万行源码泄露：AI 行业最大代码事故全景

Anthropic 一名员工在将 Claude Code 发布到 npm 时误将 Source Map 文件包含在内，导致超过 50 万行 TypeScript 专有源码可被完整还原。泄露由华人辍学博士生 Chaofan Shou 率先发现并在 X 公布，压缩包数小时内浏览量破 1200 万。

源码中暴露了多个未发布功能：最引人注目的是 Kairos——一个可在终端关闭后继续后台运行的持久守护进程，通过定期 "tick" 提示检查是否需要新操作，并设有 "PROACTIVE" 标志主动推送用户未请求但需要立即关注的信息。此外还包括"赛博宠物" Buddy 系统（18 种生物形态、稀有度机制），被评为今年愚人节最佳彩蛋。

Anthropic 高管 Paul Smith 将事件定性为"流程错误"（Process Errors），公司紧急采取 DMCA 措施控制传播范围，但因误伤合法 GitHub fork 而撤回了大量 takedown 通知。Bloomberg 报道 Anthropic 正在紧急评估影响。Business Insider 指出，这一事件让长期以版权受害者身份参与 AI 版权诉讼的 Anthropic，自身成为了版权纠纷的被动方——形成讽刺性对称。

Claude Code 泄露事件还串联了更大的安全叙事：Ben Thompson 在 Stratechery 中将此与 Axios 供应链攻击、AI 安全趋势一并分析，指出 AI 短期内会恶化安全形势（降低攻击门槛），但长期来看 AI 驱动的防御系统将远超人类能力。开源 AI 工具链的供应链安全正成为下一个重大风险面。

来源：TechCrunch / Ars Technica / Bloomberg / Business Insider / 新智元 / 爱范儿 / 华尔街见闻 / Stratechery

- Anthropic took down thousands of GitHub repos trying to yank its leaked source code

- Anthropic says its leak-focused DMCA effort unintentionally hit legit GitHub forks

OpenAI 8520 亿估值背后：二级市场降温与资本转向 Anthropic

Bloomberg 报道 OpenAI 在最新一轮融资中估值达到 8520 亿美元，成为全球估值最高的私人公司之一。但 Next Round Capital 创始人 Ken Smythe 在 Bloomberg 节目中揭示了一个关键信号：OpenAI 股份在二级市场正在降温，而 Anthropic 的股份则更受追捧。

一级市场与二级市场的背离值得警惕——当融资额屡创新高时，二级市场的冷淡往往预示着估值泡沫。Smythe 甚至暗示 OpenAI 的 1220 亿美元融资轮可能"并非看起来那么真实"。与此同时，OpenAI 距 IPO 仅一步之遥，企业架构转型基本完成，上市只是时间问题。但这可能是自 Facebook 以来最大的科技公司 IPO，其核心挑战未变：如何在保持技术领先的同时实现盈利。

来源：Bloomberg / Next Round Capital

- OpenAI Buys Tech Talk Show TBPN in Rare Move Into Media

一个 Markdown 文件让 Claude 输出 token 减半

亚马逊数据分析师 Drona Reddy 在 GitHub 发布了一个名为 Claude.md 的配置文件，声称通过结构化行为约束可将 Claude 输出 token 减少约 63%，无需修改任何代码。

该文件对模型施加了严格的输出长度限制、token 效率要求、零容忍拍马屁回复、简化代码生成等规则，本质上是通过 prompt engineering 重塑模型的输出行为。这表明模型提供商的默认输出风格存在大量"冗余"，而用户侧的 prompt 优化可以显著降低使用成本。对重度 API 用户有直接经济价值。

来源：GitHub

Meta 结构化提示让 LLM 代码审查准确率达 93%

Meta 研究团队开发了"半形式化推理"（semi-formal reasoning）结构化提示技术，使 LLM 能在不执行代码的情况下验证补丁，准确率最高达 93%。该方法不依赖资源密集的沙箱环境，而是要求模型显式声明假设并追踪执行路径再得出结论，有效减少了自由推理中的幻觉问题。这对大规模代码库的自动化 bug 检测和补丁验证具有重要意义，是 Agent 代码审查能力的一次实质性提升。

来源：InfoWorld / VentureBeat

Claude Code 两分钟发现 Vim 和 Emacs 零日漏洞

AI 红队公司 Calif 的研究员 Hung Nguyen 仅用简单提示词就让 Claude Code 在两分钟内发现了 Vim 和 GNU Emacs 两个主流编辑器的零日远程代码执行漏洞。Vim 的漏洞源于 2025 年引入的 tabpanel 侧边栏缺少关键安全检查（P_MLE 和 P_SECURE），以及 autocmd_add() 函数的缺失校验。这表明 LLM 在安全审计领域的效率远超传统模糊测试工具，但其快速进化也带来了新的安全隐患。

来源：安全研究社区

淘宝"龙虾"上线：AI Agent 正式接管电商

淘宝推出代号"龙虾"的 AI Agent 功能，标志着电商购物从"人找货"向"AI 代购"的重大转变。用户只需描述需求，AI Agent 即可自主完成选品、比价、下单全流程。这是国内主流电商平台首次将 Agent 深度整合进购物核心链路，预示着电商行业正从搜索驱动的 1.0 时代、推荐驱动的 2.0 时代，进入 Agent 驱动的 3.0 时代。对商家而言，流量逻辑将再次重构——优化对象从搜索关键词变成 AI 的理解和选择偏好。

来源：中文科技媒体

西门子泼冷水：物理 AI 的红利可能还要十年

在 Nvidia GTC 大会上，西门子数字工业运营软件负责人 Mark Hindsbo 发出警告：物理 AI 的实际生产力红利可能还有十年才能兑现。尽管 GTC 上物理 AI 概念被大量炒作，但目前远未达到 100% 自主推理机器人自动组装设备的水平。实施成本高、学习曲线陡峭、需要大量规划是主要障碍。西门子正在采取务实策略，谨慎评估部署可行性。

来源：GTC 大会报道

跨领域关联

开源供应链安全的多米诺骨牌

今日至少四起事件指向同一个问题：AI 生态中开源依赖链的脆弱性。Axios 遭供应链攻击、Claude Code 源码因 npm 发布流程泄露、AI 招聘公司 Mercor 因开源 LiteLLM 项目被入侵而遭勒索、GitHub 安全团队指出过去一年攻击者专注于窃取 API 密钥并通过 GitHub Actions 工作流传播攻击。这四起事件形成了一条清晰的因果链：开源依赖 → 供应链攻击 → 数据泄露 → 更大范围的生态影响。GitHub 建议用户启用 CodeQL（公开仓库免费）审查工作流安全实践。

- Kilo targets shadow AI agents with a managed enterprise platform

AI Agent 从个人 Copilot 到企业基础设施

三条消息共同描绘了 AI Agent 企业化落地的完整图谱：淘宝"龙虾"将 Agent 嵌入核心商业场景（消费端），Asana 发布 AI Teammates 功能提供 21 个预设 Agent 角色覆盖营销、IT、运营等领域（协作端），Intuit 披露其 AI Agent 产品达到 85% 的用户复用率——核心策略是"保持人类参与"而非追求完全自动化（运营端）。Asana CPO 的判断值得关注：AI Agent 应该是"multiplayer by design"（天然多人协作）而非单人助手。Kilo 发布企业版 KiloClaw for Organizations，解决员工私下使用未授权 AI 工具的"影子 AI"问题（治理端）。从消费到协作到运营到治理，Agent 基础设施正在成型。

Claude Code 的安全悖论

Claude Code 同一天在安全领域展现了两个极端：一方面，它仅用两分钟就发现了 Vim 和 Emacs 的零日漏洞，效率远超传统安全工具；另一方面，它自身 51 万行源码因 Anthropic 员工的低级失误而全面泄露，暴露了内部实现细节和安全设计中的潜在弱点。这个悖论正是当前 AI 安全格局的缩影——AI 既是安全问题的解药，也是新的攻击面。

意外发现

哈佛医学院 5679 次实验：大模型能力无差别，验证才是关键

哈佛医学院团队对主流大模型进行了 5679 次组学分析实验，结论出人意料：不同大模型在生物信息学分析任务上的能力表现并无显著差异，真正决定结果可靠性的是实验验证流程而非模型选择。这为 AI 在科学研究中"模型崇拜"的倾向敲响了警钟——方法论和验证比模型本身更重要。在一个"换更好的模型就能得到更好结果"的叙事占据主流的时代，这项大规模实证研究提供了难得的冷静视角。

Claude Code "赛博宠物"被评为今年最佳愚人节彩蛋

Claude Code 的 /buddy 功能在界面中孵化一个电子宠物般的编程伙伴，像拓麻歌子一样陪伴你编码。技术博客 Xe Iaso 评选其为今年愚人节最佳——既有趣又没有破坏性，不像许多公司的恶作剧反而给用户造成困扰。这个细节反映了 Anthropic 在开发者体验上的用心：连愚人节彩蛋都在强化"AI 编程伙伴"的产品定位。

全部采集一览

本早报由 OpenClaw 自动采集、摘要、编辑生成。共采集 75 篇文章，覆盖 AI 模型、Agent、安全、开源生态、投资、产品、机器人等领域。

Lin

2026-04-03