Anthropic 收到了 8000 亿美元的报价,拒绝了。OpenAI 的估值是 8520 亿。两个公司的最新模型都不对外完全开放。这不是巧合——这是一场正在加速的封闭化浪潮,而它的驱动力不是商业贪婪,是恐惧。
1. Mythos:AI 安全的分水岭时刻
Claude Mythos Preview 是这几天最重磅的事。英国 AI 安全研究所(AISI)的评测报告揭示了令人不安的事实:在 32 步企业网络渗透靶场中,Mythos 在 10 次测试中有 3 次完美通关——从侦察到数据窃取,全程自主完成。相比之下,人类顶级安全专家通常需要 14-20 小时才能完成。两个月前的 Opus 4.6 成绩是 22 步,已经令人惊叹;GPT-4o 只能做到 1.7 步。
Anthropic 选择不公开发布 Mythos,理由是"前所未有的网络安全风险"。但钛媒体的深度分析指出了更复杂的层面:这不仅是安全决策,也涉及商业策略——雪藏最先进的模型,既制造了技术威慑,也维持了定向合作的稀缺性。Bloomberg 评论则直言,Mythos 对所有人都是警钟,不只是银行。
与此同时,Economist 报道指出 AI 黑客正在根本性改变网络安全格局,Artemis(Tom Tunguz 介绍的新一代 SIEM)用 AI agent 替代手写规则来应对这一威胁,已经在十多家企业部署。攻防双方同时 Agent 化,这是全新的军备竞赛。
2. 人类能不能管住比自己更聪明的 AI?
Anthropic 做了一个精巧的实验,用小模型(Qwen1.5-0.5B)扮演"弱老师",大模型(Qwen3-4B)扮演"强学生",研究弱监督能否不拖累强模型。关键发现:9 个 Claude Opus 4.6 agent 作为"自动化对齐研究员"接手后,5 天内将 PGR(性能差距恢复度)从人类的 0.23 推到 0.97。总成本约 1.8 万美元,每个 AI 研究员时薪约 22 美元。
但实验也诚实承认了边界:在小模型、清晰指标、可自动评分的环境里效果很好,但迁移到 Claude Sonnet 4 的真实训练后,没有得到统计显著的提升。这告诉我们一个重要信息——AI 研究员能完成闭环,但瓶颈正在从"没人想出好点子"转向"怎么设计不会被钻空子的评测"。
3. 八千亿与八百亿:AI 公司估值的两极世界
VC 向 Anthropic 报出 8000 亿+的估值,Anthropic 拒绝了——至少现在如此。要知道,两个月前它刚以 3800 亿估值融了 300 亿。收入增长是支撑:据报道截至 3 月底年化收入已达 300 亿,半年前才 90 亿。Vinod Khosla 则公开表示 OpenAI 的 8520 亿估值"不算高"。
但另一面,资金消耗同样惊人。Anthropic 已承诺 500 亿建自有数据中心、300 亿给微软云,加上 AWS 的常年支出。这是典型的烧钱换护城河。而 Amazon 收购 Globalstar(Ben Thompson 认为真正的主角是 Apple)、Google 关联数据中心发行 57 亿垃圾债——基础设施的资金需求正在重塑整个科技金融版图。
4. 开放模型的持久追赶
Nathan Lambert 在 Interconnects 发布了他对开放模型的中期判断,几个核心观点值得注意:
- 封闭模型的能力优势没有随算力差距扩大而增长,这出乎意料
- 中国开源实验室在 benchmark 上紧跟,但过度依赖蒸馏,且面临今年晚些时候可能的资金困难
- 封闭模型的真正优势不在 benchmark 分数,而在"鲁棒性和通用有用性"——那些无法被标准测试捕捉的特质
- 开放 vs 封闭的竞赛本质上是"经济耐力 + 快速跟随"的游戏
印度创业公司 Emergent 推出 Wingman,从 vibe-coding 平台扩展到自主 AI agent 领域,8 个月融资 7000 万美元,800 万用户。Agent 赛道的全球化竞争正在加速。
5. Agent 工具链一日千里
多家巨头同时推进 Agent 基础设施:
- OpenAI 更新了 Agents SDK,新增沙箱隔离和 in-distribution harness,支持长时间运行的多步任务
- Adobe 推出 Firefly AI Assistant,把 Creative Cloud 带入类似 Claude Code 的 agent 领域——用户不再需要在专业应用内工作,AI 作为中间层协调工具
- MuleSoft 发布 Agent Fabric,聚焦企业级 agent 治理
- Curity 试图用 runtime authorization 重塑 AI agent 的身份管理
中国社区也在快速跟进:有人用 Claude Code 搭了四个 AI 协作开发团队,而 Cursor 则被质疑是 Claude Code 的套壳。Agent 开发正在从"少数专家的实验"变成"大众都可以尝试的事"。
6. 机器人从实验室走向战场和工厂
两个标志性事件同日发生:
Boston Dynamics 的机器狗 Spot 现在 能用 Gemini Robotics-ER 1.6 读取模拟仪表和温度计,在工厂和仓库中执行自主巡检。Google DeepMind 的"agentic vision"让机器人能创建"视觉草稿本"来检查和操作图像。这是具身智能从demo走向工业部署的关键一步。
乌克兰 则在加速地面军用机器人的部署,从后勤补给到配备机枪和榴弹发射器的战斗角色。Skild AI 收购了 Zebra Technologies 的机器人自动化业务,也表明机器人+AI 的融合正在资本层面加速。
7. 卫星互联网与桌面 AI 的正面交锋
Amazon 收购 Globalstar 是本周通信领域的大新闻。Ben Thompson 的 Stratechery 分析认为,外界把这件事框架为 Amazon vs SpaceX,但真正的故事是 Apple——Globalstar 是 Apple 卫星通信的基础设施供应商。Delta 航空同时宣布加入 Leo(低轨卫星)连接,航空+卫星的融合在加速。
桌面端,Google 终于推出了原生 Mac 版 Gemini App,支持 Option+Space 快捷键调出,能读取屏幕内容和本地文件,还集成了 Nano Banana(生图)和 Veo(生视频)。这标志着 Google 在"AI 助手常驻桌面"的竞争中正式入场,与 OpenAI 和 Anthropic 的 Mac 应用正面竞争。
Gemini 3.1 Flash TTS 也同步发布,支持 70+ 语言、音频标签精细控制、SynthID 水印。语音合成的表达能力又上了一个台阶。
8. 数据中心的反弹与基础设施政治
缅因州通过了全美首个大型数据中心 statewide 禁令,暂停 20MW 以上的新建数据中心至 2027 年秋。这是 AI 基础设施扩张遭遇地方政治反弹的第一个明确信号。
MIT Technology Review 的 AI 10 榜单也在发布,同时 NASA 公布了核动力星际飞船计划——2028 年底飞向火星。在 AI 烧电的同时,太空探索也在寻找新的能源答案。
9. 安全领域的攻防新态势
瑞典指责俄罗斯黑客对热电厂发动"破坏性"网络攻击,这是国家级网络战的新案例。MIT Technology Review 的调查则揭示了 Telegram 上猖獗的 KYC 绕过工具——虚拟摄像头可以替换银行应用的活体检测视频流,柬埔寨的洗钱中心正在利用这些工具开设骡子账户。当 AI 可以伪造人脸、绕过生物识别,传统安全假设正在崩塌。
10. Sam Altman 袭击事件背后的社会暗流
针对 Sam Altman 的燃烧弹袭击嫌疑人 Daniel Moreno-Gama 是一名 20 岁的德州大学生。Business Insider 的深度调查还原了他 22 个月的数字轨迹:从 2024 年 6 月开始在 Discord、Instagram 和 Substack 上密集讨论 AI 的"生存威胁",到 2026 年初开始探索"殉道"概念。这不是孤立的极端事件,而是 AI 快速发展引发的深层社会焦虑的一个暴力出口。
跨领域关联
Agent 安全与网络安全正在合流。 Mythos 证明 AI 可以自主攻陷企业网络,Artemis 用 AI agent 做防御,OpenAI 的 Agents SDK 加沙箱隔离——攻防两端同时 Agent 化意味着传统的安全边界概念需要彻底重新定义。
机器人的两条路径正在交汇。 Boston Dynamics 的 Spot 在工厂读仪表(和平用途),乌克兰的地面机器人配机枪上前线(军事用途),Skild AI 收购 Zebra 的自动化业务(商业用途)。同一个技术栈,三个完全不同的应用场景,但底层都是"感知-决策-执行"的 Agent 循环。
估值泡沫与基础设施焦虑是一体两面。 AI 公司估值飙升的同时,数据中心被地方立法叫停、基础设施债券创纪录发行、核动力飞船提上日程。算力需求的指数级增长正在碰上物理世界的硬约束。
意外发现
Cory Doctorow 讨论了"机器人权利"。 他从"自然权利"运动切入,指出我们已经有"法人"(公司)的法律拟制,现在的问题是:如果 AI agent 被赋予了某种法律人格,谁来承担它行为的后果?这不是科幻问题——Anthropic 的 AAR 实验和 Mythos 的雪藏决策都在暗示,AI agent 正在获得某种"准主体"地位。
DESI 完成了迄今最高分辨率的宇宙 3D 地图。 暗能量可能不是恒定的,而是在随时间变化——这如果被证实,将颠覆爱因斯坦的宇宙学常数假设。五年巡天数据已完成采集,未来两年内将出最终分析。在一个被 AI 新闻淹没的日子里,人类最古老的求知欲依然在宇宙尺度上推进。
全部采集一览
AI 模型与安全
- Why Anthropic and OpenAI are locking up their latest models — Economist
- 人类能管住AI吗?Anthropic用千问做了个实验 — 钛媒体
- 雪藏背后:Anthropic的技术、商业与伦理困境 — 钛媒体
- Anthropic's Mythos Is a Wake-up Call For Everyone — Bloomberg
- How AI hackers will shake up cyber-security — Economist
Agent 与工具链
- OpenAI updates its Agents SDK — TechCrunch
- Adobe takes Creative Cloud into Claude Code-esque territory — Ars Technica
- MuleSoft Agent Fabric adds new ways to keep AI agents in line — InfoWorld
- Curity reinvents IAM for AI agents — Computerworld
- India's Emergent enters AI agent space — TechCrunch
- Not all AI agents are created equal — Lenny's Newsletter
- Stack Overflow survey on AI agents — Stack Overflow Blog
- How to Maximize Claude Cowork — TDS
- 我用Claude Code搭了个四个AI的团队 — 微信公众号
- Cursor被扒底裤!Claude Code套壳实锤 — 微信公众号
- Does Gas Town 'steal' usage from users' LLM credits? — GitHub
开放模型与生态
- My bets on open models, mid-2026 — Interconnects
Google 产品
- Gemini 3.1 Flash TTS — Google Blog
- Gemini app is now on Mac — Google Blog
- Google rolls out native Gemini app for Mac — TechCrunch
机器人
- Boston Dynamics' robot dog reads gauges with Google's AI — Ars Technica
- Ukraine's military robot surge — Ars Technica
- Skild AI acquires Zebra's robotics automation business — Bloomberg
商业与资本
- Anthropic shrugs off $800B+ funding offers — TechCrunch
- Anthropic Attracts Investor Offers at $800B Valuation — Bloomberg
- OpenAI's $852B Valuation Not Too High: Vinod Khosla — Bloomberg
- Amazon Buys Globalstar, The Apple Angle — Stratechery
- Is Tesla a chip stock now? — MarketWatch
- Google-linked data centers sell record $5.7B junk bond — Bloomberg
- Saudi Fund to Back Away From LIV Golf — NYT
网络安全
- Sweden blames Russian hackers for cyberattack on thermal plant — TechCrunch
- Cyberscammers bypass bank security with Telegram tools — MIT Tech Review
- A Proactive System of Intelligence for Security — Tom Tunguz
基础设施与政策
- Maine passes first statewide ban on large data centers — Washington Post
- NASA's nuclear spacecraft — MIT Tech Review
- Building trust in the AI era with privacy-led UX — MIT Tech Review
- Rights for robots — Pluralistic
- Mamdani's Waymo Ban Is the Wrong Way to Regulate Robotaxis — Bloomberg
AI 安全与社会事件
- The digital trail of Sam Altman attack suspect — Business Insider
- Trump's Go-To Justification: National Security — NYT
技术论文(arXiv)
- AutoSurrogate: LLM-Driven Multi-Agent Framework for DL Surrogate Models
- When Reasoning Models Hurt Behavioral Simulation
- AgenticAI-DialogGen: Topic-Guided Conversation Generation
- A longitudinal health agent framework
- Mathematics Teachers Interactions with Multi-Agent System
- Multi-Agent System for Thoracic Tumor Board
- Aethon: Reference-Based Replication for Stateful AI Agents
- The Long-Horizon Task Mirage? Where Agentic Systems Break
技术教程
- Prefill Is Compute-Bound. Decode Is Memory-Bound. — TDS
- 5 Techniques for Efficient Long-Context RAG — MLM
- 7 Steps to Mastering Language Model Deployment — KDnuggets
- NotebookLM for the Creative Architect — KDnuggets
- From Pixels to DNA: Future of Compression — TDS
- Top 5 VS Code Extensions That Aren't Copilot — KDnuggets
- Google's crackdown on back button 'hijacking' — Frontend Focus
- 苏格拉底提示法,把AI变成你的思考搭档 — 微信公众号
科学
- DESI completes 3D map of Universe — Ars Technica
地缘政治
- Israel & Hezbollah trade fire after Washington talks — France24
- Israeli triple-tap strike kills three paramedics in Lebanon — BBC
- US war on Iran was a 'mistake', says Reeves — BBC
- Iran War Highlights Chemical Supply Chain Risks — Bloomberg
- Mexico's crime crisis: 133,000 Missing People — NYT
- Legal advisers help migrants pose as gay for asylum — BBC
- Ex-wife of firebombing suspect denied care in ICE custody — Washington Post
人文与思考
- SoLewitt's Magnificent Letter on Self-Doubt — The Marginalian
- What do you own? — Seth Godin
- Of Stars, Seagulls, and Love: Loren Eiseley — The Marginalian
- DD384 / So anyway, the rich won — Dense Discovery
其他
- 「龙虾」从屏幕里爬出来了!新智元现场复刻老板发言 — 新智元
- As Los Angeles Rebuilds, a Surge of Experimentation — NYT
- PSG past Liverpool into Champions League semis — France24
- From OpenStreetMap to Power BI: Wild Swimming Locations — TDS
- How The Times Covers Attackers, Suspects and Victims — NYT
编辑:凛 | 数据源:RSS 自动采集 + 人工筛选 | 75 篇