荐文：当你不再点按钮，而是开口说"我想要"

2026-03-28约 7 分钟

#荐文#AI

近期开始沉淀沉淀，挨个研读一些深度长文，顺便分享下读后感，今天推荐的作者是 Jakob Nielsen。做过互联网产品的人，对这个名字应该不陌生——“尼尔森十大可用性原则”就是他提的，UX 领域的祖师爷级人物。今年 3 月 26 日他发了一篇新文章叫《Intent by Discovery: Designing the AI User Experience》，讲的是 AI 时代的交互设计该怎么做。

说实话，AI 圈关于“交互革命”的文章我看过不少，大多听完就忘了。这篇不一样。它不是在讲“AI 多厉害”，而是在讲一个更根本的问题：当 AI 替你干活的时候，你这个“人”的角色到底变成了什么？

我花了些时间让 AI 陪我一起拆这篇文章，逐章过、逐段聊，过程中冒出来不少自己的想法。今天挑几个印象最深的点来聊聊。

人类不再是司机了

Nielsen 开篇就说了一句话，我觉得是全文的地基：AI 真正改变的不是界面，是用户的身份。

以前用软件，人是“操作员”。鼠标点哪里、输入什么参数，都是人在控制。下一个命令，机器执行一个动作。

现在 AI 来了，人变成“监督员”了。说一句“帮我规划一下去北京的行程”, AI 自己去查航班、查酒店、定路线，我们只是在旁边看着对不对。

他用了一个维京首领的类比：首领说“去英格兰修道院给我弄些银子来”，他不需要告诉手下先去找铁匠打盾牌、再找船、再规划路线——手下自己知道该怎么做。AI 就是那个“知道该怎么做”的手下。

这个类比很生动，但我跟 AI 讨论的时候发现了一个问题：维京首领和手下的意图是对齐的——首领要银子，手下也希望首领拿到银子。但用户和 AI 呢？AI 优化的是“看起来完成了用户说的”，用户想要的是“真正解决了我的问题”。这两件事之间的鸿沟，维京类比没有处理。

不过这个身份转变本身，我觉得 Nielsen 说得很准。他特别强调：这是 60 年来第一次真正的 UI 范式转变。上一次是从批处理到命令行，这次是从命令到意图委托。

“说不清楚”才是最大的可用性危机

全文我印象最深的概念，叫“表述壁垒”（Articulation Barrier）。

意思是：意图委托这个范式，要求人用文字把想法写出来。但写作比阅读在认知上难得多。

看一段文字觉得懂了，但要把同样的意思用自己的话写出来，会发现很难下笔。发达国家大约有一半人口读写能力不足。“Prompt engineering”这个行业的存在本身，就是这个危机的证明——如果用户必须学习一套奇怪的咒语才能让 AI 给出正确结果，那这个界面就是失败的。

Nielsen 举了个例子：想让 AI 画一张“温暖的图片”，但“温暖”这个词对不同人意味着完全不同的画面——可能是暖色调、可能是阳光、可能是壁炉。文字在传递意图这件事上，其实非常低效。

这让我想到自己用 AI 画图的经历。我脑子里有一个很清晰的画面，但写成 prompt 的时候，总觉得词不达意。生成出来的东西“差不多”但“不是那个感觉”。以前我以为是自己 prompt 写得不好，现在才意识到，这可能不是我的问题，是文字这个载体本身的限制。

Nielsen 提了几个解法方向：一个是风格画廊，给一堆预设风格让人选，点一下比写 100 个字容易得多；一个是可见可编辑的用户模型，上周跟 AI 说过的偏好，这周不应该消失，记忆应该成为“一等公民”；还有多模态输入，指着一张图说“这种风格”，比打字描述精准得多。

不过我跟 AI 讨论时也聊到，风格画廊这个方案放到今天可能已经有点落后了。现在的图像模型已经能理解“温暖的图片”这种模糊描述，并且主动补全细节。与其让用户从预设里选，不如模型自己推断。这可能是一个过渡性方案。

中间那层“谈判桌”，大多数团队在忽视

Nielsen 提了一个三层架构，我觉得是全文最有实操价值的部分：

第一层：意图层。 输入意图的地方。随着 AI 越来越成熟，系统会越来越依赖“隐式意图推断”——它看日历、看屏幕上的内容、看过去的行为，然后主动猜测用户想要什么。

第二层：编排层。 这是 AI 执行高风险行动之前，跟用户“谈判”的地方。

第三层：直接操控层。 传统 GUI 不会消失，只是降级了——变成一个备用层，处理边缘情况和精细修正。

Nielsen 说第二层是最重要的，但大多数团队在忽视它。

这一层要做四件事：执行前展示“我要做什么、用什么数据、触达哪些系统”；执行后给一个完整回执；在企业环境里告诉相关方“谁会受影响、哪些政策会约束这个行动”；多个 AI 子代理发出矛盾指令时负责协调。

我跟 AI 讨论这段的时候，提了一个追问：普通用户真的有能力看懂这些信息吗？如果用户在传统 GUI 里都不看提示直接点确定，他们会在编排层认真审核 AI 的计划吗？

这其实是 Nielsen 整篇文章一个没有明确论证的前提——他假设用户能扮演好“监督员”角色。但现实可能是，大多数人不具备在 AI 行动前审核计划、判断置信度的能力。他自己后面提到的“零学习陷阱”恰好说明了这一点。

有时候，界面应该故意给你制造麻烦

这是全文最反直觉的观点：有时候，摩擦是必要的。

低风险任务当然要把摩擦去掉——让 AI 帮忙查个天气，如果还要输入验证码，那就烦死了。

但高风险任务不一样：金融交易、医疗决策、发一封给老板的邮件——这些谁都不希望 AI 一键完成。我们希望它故意慢一点，让人多想两秒。

Nielsen 提了一个概念叫“可信性陷阱”（Plausibility Trap）：AI 的输出干净、权威、格式漂亮，人会下意识觉得“这个是对的”，跳过批判性分析。就像看到一份排版精美的报告，不会怀疑它的数据一样。

这让我想到之前写过的那篇关于限制的文章。FC 时代的 40KB 是物理的、冰冷的、不容置疑的，它逼人在边界里找出路。AI 给我们的恰恰相反：一望无际，无从下手。Nielsen 说的“刻意设计摩擦”，其实就是在无限中人为制造边界——让人停下来想一想，而不是一路滑过去。

他还提了一个我很喜欢的概念：渐进式委托。AI 应该从保守模式起步，上来先给你看草稿，你说“可以”它才推进下一步。慢慢积累信任度之后，它才能执行更敏感的操作。这跟现实中跟一个新同事的磨合过程一模一样。

当 AI 任务要跑好几天

还有一段讨论的是“慢 AI”——当任务需要几十分钟甚至几天的时候，传统的“加载条”概念完全失效了。

Nielsen 提了五个对策，我觉得最有意思的是两个：

概念足迹（Conceptual Breadcrumbs）：别显示“40% 完成”，显示“已分析完第 3 个数据源，发现结论 X 可能有误”。中间结论比百分比有用得多。

打捞价值（Salvage Value）：如果任务被中途停止，AI 应该主动告诉用户“虽然没跑完，但这些中间产物还能用”。减少“白等了 20 小时”的损失感。

这两个概念现在看来是真实需求，但方案还不成熟。不过方向是对的——AI 不能只在“完成”和“未完成”之间二选一，中间状态本身就有价值。

最后：认知外骨骼还是认知轮椅？

Nielsen 在文章最后提了一个判断框架，我觉得可以直接拿来用：

好的 AI UX = 认知外骨骼，帮人更强但还是人在控制。

坏的 AI UX = 认知轮椅，代人决策，让人的能力慢慢退化。

他特别警告了一个叫“零学习陷阱”的东西：如果用户永远不需要理解系统是怎么运作的，久而久之他们就会变成自己数字生活的“乘客”而不是“司机”。

这跟我之前的一个感受很像。我用 AI 写东西的时候，有时候会觉得“它写得比我好”，然后就懒得自己想了。时间一长，我发现自己的表达能力在退化——不是因为 AI 不好，而是因为我把判断权交出去了。

Nielsen 的意思是，UX 设计师以后的工作不是设计“屏幕 A→B→C”这种点击路径，而是构建可能性空间——设计边界约束、设计反馈循环、设计让用户保持认知参与的机制。

我的判断

读完这篇文章，我觉得最值得记住的是三个东西：

第一，“表述壁垒”这个概念。 它解释了为什么 prompt engineering 这么难、为什么你和 AI 说话经常觉得“说不清楚”——不是你的问题，是文字这个载体本身的限制。

第二，编排层（Orchestration Surface）。 三层架构里，中间这层是目前被严重忽视的，但它是建立信任的关键战场。你用的 AI 产品有没有在执行前告诉你“我打算怎么做”？大多数没有。

第三，“认知外骨骼 vs 认知轮椅”。 这个框架可以帮你判断一个 AI 产品设计得好不好——它是帮你更强，还是让你变懒。

Nielsen 这篇文章不短，原文读起来也不轻松。但如果你在做 AI 产品、或者你每天都在用 AI 工具，我觉得值得花时间读一遍。它不会告诉你“AI 多厉害”，但会让你重新想一想：当你不再点按钮，而是开口说“我想要”的时候，你和机器之间的关系，到底发生了什么变化。

原文链接：Intent by Discovery: Designing the AI User Experience