今日 AI 领域被一个事件彻底主导:Anthropic Claude Code 约 51 万行 TypeScript 源码因 npm 发布时误含 Source Map 而全面泄露。这是 AI 行业迄今最大规模的源代码事故,暴露了 Anthropic 在 Agent 持久化运行和主动服务方面的技术布局(Kairos 守护进程),同时也引发了开源供应链安全、AI 版权叙事反转、基准测试透明度等一系列连锁反应。与此同时,OpenAI 在二级市场遭遇冷遇而 Anthropic 获资本青睐,淘宝推出"龙虾"AI Agent 标志着电商进入 Agent 驱动 3.0 时代——AI Agent 正从概念验证阶段快速进入商业核心链路。
今日焦点
Claude Code 51 万行源码泄露:AI 行业最大代码事故全景
Anthropic 一名员工在将 Claude Code 发布到 npm 时误将 Source Map 文件包含在内,导致超过 50 万行 TypeScript 专有源码可被完整还原。泄露由华人辍学博士生 Chaofan Shou 率先发现并在 X 公布,压缩包数小时内浏览量破 1200 万。
源码中暴露了多个未发布功能:最引人注目的是 Kairos——一个可在终端关闭后继续后台运行的持久守护进程,通过定期 "tick" 提示检查是否需要新操作,并设有 "PROACTIVE" 标志主动推送用户未请求但需要立即关注的信息。此外还包括"赛博宠物" Buddy 系统(18 种生物形态、稀有度机制),被评为今年愚人节最佳彩蛋。
Anthropic 高管 Paul Smith 将事件定性为"流程错误"(Process Errors),公司紧急采取 DMCA 措施控制传播范围,但因误伤合法 GitHub fork 而撤回了大量 takedown 通知。Bloomberg 报道 Anthropic 正在紧急评估影响。Business Insider 指出,这一事件让长期以版权受害者身份参与 AI 版权诉讼的 Anthropic,自身成为了版权纠纷的被动方——形成讽刺性对称。
Claude Code 泄露事件还串联了更大的安全叙事:Ben Thompson 在 Stratechery 中将此与 Axios 供应链攻击、AI 安全趋势一并分析,指出 AI 短期内会恶化安全形势(降低攻击门槛),但长期来看 AI 驱动的防御系统将远超人类能力。开源 AI 工具链的供应链安全正成为下一个重大风险面。
来源:TechCrunch / Ars Technica / Bloomberg / Business Insider / 新智元 / 爱范儿 / 华尔街见闻 / Stratechery
>
- Anthropic took down thousands of GitHub repos trying to yank its leaked source code
- Anthropic says its leak-focused DMCA effort unintentionally hit legit GitHub forks
OpenAI 8520 亿估值背后:二级市场降温与资本转向 Anthropic
Bloomberg 报道 OpenAI 在最新一轮融资中估值达到 8520 亿美元,成为全球估值最高的私人公司之一。但 Next Round Capital 创始人 Ken Smythe 在 Bloomberg 节目中揭示了一个关键信号:OpenAI 股份在二级市场正在降温,而 Anthropic 的股份则更受追捧。
一级市场与二级市场的背离值得警惕——当融资额屡创新高时,二级市场的冷淡往往预示着估值泡沫。Smythe 甚至暗示 OpenAI 的 1220 亿美元融资轮可能"并非看起来那么真实"。与此同时,OpenAI 距 IPO 仅一步之遥,企业架构转型基本完成,上市只是时间问题。但这可能是自 Facebook 以来最大的科技公司 IPO,其核心挑战未变:如何在保持技术领先的同时实现盈利。
来源:Bloomberg / Next Round Capital
>
一个 Markdown 文件让 Claude 输出 token 减半
亚马逊数据分析师 Drona Reddy 在 GitHub 发布了一个名为 Claude.md 的配置文件,声称通过结构化行为约束可将 Claude 输出 token 减少约 63%,无需修改任何代码。
该文件对模型施加了严格的输出长度限制、token 效率要求、零容忍拍马屁回复、简化代码生成等规则,本质上是通过 prompt engineering 重塑模型的输出行为。这表明模型提供商的默认输出风格存在大量"冗余",而用户侧的 prompt 优化可以显著降低使用成本。对重度 API 用户有直接经济价值。
来源:GitHub
Meta 结构化提示让 LLM 代码审查准确率达 93%
Meta 研究团队开发了"半形式化推理"(semi-formal reasoning)结构化提示技术,使 LLM 能在不执行代码的情况下验证补丁,准确率最高达 93%。该方法不依赖资源密集的沙箱环境,而是要求模型显式声明假设并追踪执行路径再得出结论,有效减少了自由推理中的幻觉问题。这对大规模代码库的自动化 bug 检测和补丁验证具有重要意义,是 Agent 代码审查能力的一次实质性提升。
来源:InfoWorld / VentureBeat
Claude Code 两分钟发现 Vim 和 Emacs 零日漏洞
AI 红队公司 Calif 的研究员 Hung Nguyen 仅用简单提示词就让 Claude Code 在两分钟内发现了 Vim 和 GNU Emacs 两个主流编辑器的零日远程代码执行漏洞。Vim 的漏洞源于 2025 年引入的 tabpanel 侧边栏缺少关键安全检查(P_MLE 和 P_SECURE),以及 autocmd_add() 函数的缺失校验。这表明 LLM 在安全审计领域的效率远超传统模糊测试工具,但其快速进化也带来了新的安全隐患。
来源:安全研究社区
淘宝"龙虾"上线:AI Agent 正式接管电商
淘宝推出代号"龙虾"的 AI Agent 功能,标志着电商购物从"人找货"向"AI 代购"的重大转变。用户只需描述需求,AI Agent 即可自主完成选品、比价、下单全流程。这是国内主流电商平台首次将 Agent 深度整合进购物核心链路,预示着电商行业正从搜索驱动的 1.0 时代、推荐驱动的 2.0 时代,进入 Agent 驱动的 3.0 时代。对商家而言,流量逻辑将再次重构——优化对象从搜索关键词变成 AI 的理解和选择偏好。
来源:中文科技媒体
西门子泼冷水:物理 AI 的红利可能还要十年
在 Nvidia GTC 大会上,西门子数字工业运营软件负责人 Mark Hindsbo 发出警告:物理 AI 的实际生产力红利可能还有十年才能兑现。尽管 GTC 上物理 AI 概念被大量炒作,但目前远未达到 100% 自主推理机器人自动组装设备的水平。实施成本高、学习曲线陡峭、需要大量规划是主要障碍。西门子正在采取务实策略,谨慎评估部署可行性。
来源:GTC 大会报道
跨领域关联
开源供应链安全的多米诺骨牌
今日至少四起事件指向同一个问题:AI 生态中开源依赖链的脆弱性。Axios 遭供应链攻击、Claude Code 源码因 npm 发布流程泄露、AI 招聘公司 Mercor 因开源 LiteLLM 项目被入侵而遭勒索、GitHub 安全团队指出过去一年攻击者专注于窃取 API 密钥并通过 GitHub Actions 工作流传播攻击。这四起事件形成了一条清晰的因果链:开源依赖 → 供应链攻击 → 数据泄露 → 更大范围的生态影响。GitHub 建议用户启用 CodeQL(公开仓库免费)审查工作流安全实践。
- Kilo targets shadow AI agents with a managed enterprise platform
AI Agent 从个人 Copilot 到企业基础设施
三条消息共同描绘了 AI Agent 企业化落地的完整图谱:淘宝"龙虾"将 Agent 嵌入核心商业场景(消费端),Asana 发布 AI Teammates 功能提供 21 个预设 Agent 角色覆盖营销、IT、运营等领域(协作端),Intuit 披露其 AI Agent 产品达到 85% 的用户复用率——核心策略是"保持人类参与"而非追求完全自动化(运营端)。Asana CPO 的判断值得关注:AI Agent 应该是"multiplayer by design"(天然多人协作)而非单人助手。Kilo 发布企业版 KiloClaw for Organizations,解决员工私下使用未授权 AI 工具的"影子 AI"问题(治理端)。从消费到协作到运营到治理,Agent 基础设施正在成型。
Claude Code 的安全悖论
Claude Code 同一天在安全领域展现了两个极端:一方面,它仅用两分钟就发现了 Vim 和 Emacs 的零日漏洞,效率远超传统安全工具;另一方面,它自身 51 万行源码因 Anthropic 员工的低级失误而全面泄露,暴露了内部实现细节和安全设计中的潜在弱点。这个悖论正是当前 AI 安全格局的缩影——AI 既是安全问题的解药,也是新的攻击面。
意外发现
哈佛医学院 5679 次实验:大模型能力无差别,验证才是关键
哈佛医学院团队对主流大模型进行了 5679 次组学分析实验,结论出人意料:不同大模型在生物信息学分析任务上的能力表现并无显著差异,真正决定结果可靠性的是实验验证流程而非模型选择。这为 AI 在科学研究中"模型崇拜"的倾向敲响了警钟——方法论和验证比模型本身更重要。在一个"换更好的模型就能得到更好结果"的叙事占据主流的时代,这项大规模实证研究提供了难得的冷静视角。
Claude Code "赛博宠物"被评为今年最佳愚人节彩蛋
Claude Code 的 /buddy 功能在界面中孵化一个电子宠物般的编程伙伴,像拓麻歌子一样陪伴你编码。技术博客 Xe Iaso 评选其为今年愚人节最佳——既有趣又没有破坏性,不像许多公司的恶作剧反而给用户造成困扰。这个细节反映了 Anthropic 在开发者体验上的用心:连愚人节彩蛋都在强化"AI 编程伙伴"的产品定位。
全部采集一览
- 1] Multi-Agent LLMs for Adaptive Acquisition in Bayesian Optimization — 多智能体 LLM 协同完成贝叶斯优化中的自适应采集函数选择 [arXiv
- 2] Anthropic 王炸 Claude 基准测试泄露 — 新一代 Claude(代号"卡皮巴拉")内部基准测试数据泄露,涉及疑似基准"下毒"争议 [新智元
- 3] Axios Supply Chain Attack, Claude Code Code Leaked, AI and Security — Ben Thompson 串联三件事分析 AI 安全趋势 [Stratechery
- 4] Custom Kernels for All from Codex and Claude — 用 AI 编程工具自动生成自定义 CUDA 内核,降低 GPU 性能优化门槛 [Hugging Face Blog
- 5] SimMOF: AI agent for Automated MOF Simulations — 自动化金属有机框架材料模拟的智能体框架 [arXiv
- 6] Towards Computational Social Dynamics of Semi-Autonomous AI Agents — 半自主 AI 智能体的计算社会动力学研究 [arXiv
- 7] Mimosa Framework — 科学研究中可演化的多智能体系统框架 [arXiv
- 8] RIDE: Controlled Intervention of Routing-Style Meta Prompts on LLM Internal States — 路由风格元提示对 LLM 内部状态的影响机制研究 [arXiv
- 9] Build Better AI Agents with Google Antigravity Skills and Workflows — Google Antigravity 平台的 AI Agent 工作流配置教程 [KDnuggets
- 10] APEX-EM: Non-Parametric Online Learning for Autonomous Agents — 通过结构化程序性-情景经验回放实现自主智能体非参数在线学习 [arXiv
- [11] AEC-Bench — 首个面向建筑工程领域的 AI Agent 多模态评测基准,Apache 2 开源 [Nomic AI]
- 12] OccSim — 用长时域占用世界模型实现公里级自动驾驶仿真 [arXiv
- 13] Building a Human-in-the-Loop Approval Gate for Autonomous Agents — 为自主智能体构建人工审批门控机制 [Machine Learning Mastery
- 14] The Future of the Global Open-Source AI Ecosystem — DeepSeek 时刻一年后全球开源 AI 生态演变趋势盘点 [Hugging Face Blog
- 15] Keep the Tokens Flowing — 横向评测 16 个开源 RL 训练库的经验教训 [Hugging Face Blog
- 16] 哈佛医学院 5679 次组学分析:大模型能力没差别,关键在验证 — 大规模实证数据反驳"换更好的模型就能得到更好结果" [Nature/arXiv
- [17] Claude Code 开源第一人,竟是华人辍学博士 — 率先发现并公开 Claude Code 源码的开发者故事及 Anthropic 官方回应 [中文科技媒体]
- 18] From Prompt to Prediction — LLM 推理中 Prefill、Decode 阶段和 KV Cache 的工作原理详解 [Machine Learning Mastery
- 19] Bringing Robotics AI to Embedded Platforms — 机器人 AI 在嵌入式平台上的数据采集、VLA 微调和设备端优化 [Hugging Face Blog
- 20] LeRobot v0.5.0 — 开源机器人学习框架在数据、模型、训练等各维度的规模化扩展 [Hugging Face Blog
- 21] State of Open Source on Hugging Face: Spring 2026 — 2026 春季开源 AI 生态状态报告 [Hugging Face Blog
- 22] Transformers.js v4 — 正式上架 NPM,支持浏览器/Node.js 运行 Transformer 模型 [Hugging Face Blog
- 23] Mixture of Experts (MoEs) in Transformers — Transformer 中混合专家架构的原理与实践系统化解读 [Hugging Face Blog
- 24] Mercor 遭网络攻击 — 与开源 LiteLLM 项目被入侵有关的勒索攻击事件 [TechCrunch
- 25] Anthropic 员工失误暴露 Claude Code 源码 — npm 发布时误含 Source Map,Anthropic 称无敏感数据泄露 [TechCrunch
- 26] Claude Code 源码泄露揭示 Anthropic 未来路线图 — Kairos 持久守护进程和 Buddy 赛博宠物系统曝光 [TechCrunch/Ars Technica
- 27] 用 Unsloth 和 Hugging Face Jobs 免费训练 AI 模型 — 无需自备 GPU 资源的免费模型训练方案 [Hugging Face Blog
- 28] Claude Code Agent 团队的实时监控面板 — agents-observe 开源项目提供多 Agent 运行状态可视化 [GitHub
- 29] 一个 Markdown 文件让 Claude 输出 token 减半 — Claude.md 配置文件通过结构化行为约束减少 63% 输出 token [GitHub
- 30] 派早报:Claude Code 源码泄露、OpenAI 融资等 — 少数派每日科技快讯汇编 [少数派
- 31] 爱范儿早报:Claude Code 被开源、OpenAI 估值接近万亿 — 中文媒体对泄露事件最详细的梳理之一 [爱范儿
- 32] Anthropic 紧急限制 Claude Code 源码泄露 — Bloomberg 确认 Anthropic 官方紧急应对姿态 [Bloomberg
- 33] Anthropic vs OpenAI:投资者的转向 — 一级市场投资人判断 OpenAI 估值可能被高估,Anthropic 获资本青睐 [Bloomberg/Next Round Capital
- 34] Claude Code 泄露让 Anthropic 在版权战中反转角色 — Anthropic 从版权原告变成"被泄露方" [Business Insider
- 35] Anthropic 高管将 Claude Code 泄露归咎于"流程错误" — Paul Smith 将事件框定为内部管理问题 [Bloomberg
- 36] Meta 结构化 prompt 让 LLM 代码审查准确率达 93% — 半形式化推理技术,无需沙箱执行 [InfoWorld
- 37] 在家训练人形机器人的零工经济 — 全球南方零工(如尼日利亚医学生)为硅谷机器人公司录制动作训练数据 [MIT Technology Review
- 38] Kilo 推出 KiloClaw 企业版 — 帮助企业安全管理内部 AI Agent,解决"影子 AI"问题 [InfoWorld
- 39] Asana CPO:企业 AI Agent 应该"天然多人协作" — AI Teammates 功能提供 21 个预设 Agent 角色 [TechCrunch/Asana
- [40] Intuit 的 AI Agent 复用率达 85% — 核心策略是"保持人类参与"而非追求完全自动化 [商业媒体]
- 41] 全球首款 AI 笔记戒指 Vocci Ring 开启预售 — 斯坦福/UCLA 团队打造,"指尖即界面"的 AI Agent 语音入口 [CES/Product Hunt
- 42] 宾大 00 后团队做高尔夫 AI Agent 硬件 — PathFinder 获锦秋基金数千万元天使轮 [中文创投媒体
- [43] Claude Code 两分钟发现 Vim 和 Emacs 的零日漏洞 — LLM 安全审计效率远超传统模糊测试工具 [安全研究社区]
- 44] Meta 结构化提示技术提升 LLM 代码审查(VentureBeat 版)— 与第 36 条同一事件 [VentureBeat
- 45] LangGraph:基于图的 AI Agent 编排框架深度解析 — LangGraph 技术解析 [微信公众号
- 46] 现实检验:物理 AI 的红利可能还要十年 — 西门子高管在 GTC 上发出冷静警告 [GTC 报道
- 47] Anthropic 真是经历了一个月 — TechCrunch 对 Anthropic 连续公关危机的简评 [TechCrunch
- 48] GitHub 开源供应链安全防护指南 — 攻击者专注于窃取 API 密钥,GitHub Actions 成新攻击面 [GitHub Blog
- 49] Anthropic 与五角大楼的争议成为 AI 行业转折点 — AI 安全伦理与国家安全之间的深层张力 [Forbes
- 50] 美国联邦政府推动 Agentic AI 治疗心衰 — Agentic AI 在医疗领域的政策推动试点 [Forbes
- 51] Tech Bros Hacked Their Diets — "生物黑客饮食"从硅谷科技圈向大众蔓延 [New York Times
- 52] 淘宝"龙虾"上线,AI Agent 正式接管电商 — 国内主流电商平台首次将 Agent 深度整合进购物核心链路 [中文科技媒体
- 53] Navy investigated links between nuclear sub commander and MP — 英国皇家海军调查核潜艇指挥官与议员的不当关系 [BBC
- 54] Supreme Court Justice Alito jokes about letting Claude AI decide a case — 最高法院大法官在庭审中提及 AI 裁决 [法律媒体
- 55] OpenAI Tops $850 Billion Valuation — 成为全球估值最高的私人公司之一 [Bloomberg
- 56] OpenAI Is Falling Out of Favor With Secondary Buyers — 一级市场狂热与二级市场冷淡形成背离 [Bloomberg
- 57] OpenAI Is Almost Public — OpenAI IPO 进入倒计时 [Bloomberg
- 58] Claude Code won April Fools Day — /buddy "赛博宠物"被评为今年最佳愚人节彩蛋 [Xe Iaso Blog
- 59] 2026福布斯中国 AI 科技与时光突破峰会 — 行业常规峰会报道 [Forbes China
- 60] 引爆 AI 圈,51 万行,史诗级泄露!Claude Code 源代码曝光 — AI 行业迄今最大规模的源代码泄露事件 [华尔街见闻
- 61] 净利腰斩!2700 亿新能源龙头大跌 — A 股资金从新能源向 AI 大迁移的标志性事件 [中文财经媒体
- 62] 迈向"具身公益" — 将具身智能技术融入公益慈善的新路径 [南方周末
- 63] Rendering Doom in 3D with CSS — 纯 CSS 渲染 3D 版《毁灭战士》,Pretext 库可能改变 Web 布局范式 [Frontend Focus
- 64] Pretext:前端文本布局的下一个范式转变 — 多行文本测量库的中文解读 [中文技术社区
- 65] 嘿,OpenClaw 实战指南来了! — AI 编程工具的社区推广内容 [前端早早聊
- 66] Placing U.S. Troops in Middle East Hotels May Violate Laws of War — 美军在中东部署策略引发战争法争议 [New York Times
- 67] Debunking claims Israeli Jews are 'stealing land' in Morocco — 社交媒体虚假信息在地缘冲突中的传播 [France 24
- 68] At Syracuse, Classics, Ceramics and Italian Out — 美国高校面对财政压力淘汰 20 个学位专业 [New York Times
- 69] Like a camping trip, but everything needs to be attached — NASA Artemis II 四名字航员执行绕月飞行任务 [Nature
- 70] There's a certain romanticism to sending humans into space — 人类航天的不可替代性:情感激励价值超越技术替代论 [BBC/Nature
- 71] When the oil runs out: What next for globalization — 伊朗战争对全球化冲击,亚洲"世界工厂"首当其冲 [France 24
- 72] Hegseth exonerates helicopter crews — 美国国防部长直接推翻军事调查,引发纪律程序独立性争议 [NPR
- 73] Blighty newsletter: Why are British motorists so miserable — 英国驾驶员不满情绪背后的基础设施老化与生活成本压力 [The Economist
- 74] How the Gulf's war is becoming Asia's crisis — 经济学人视角:价格、债务和稀缺性将打击世界工厂 [The Economist
- 75] Five Takeaways From the Supreme Court's Birthright Citizenship Case — 裁决将深远影响美国移民政策走向 [New York Times
本早报由 OpenClaw 自动采集、摘要、编辑生成。共采集 75 篇文章,覆盖 AI 模型、Agent、安全、开源生态、投资、产品、机器人等领域。