公众号

荐文:当你不再点按钮,而是开口说"我想要"

2026-03-287 分钟
#荐文#AI

近期开始沉淀沉淀,挨个研读一些深度长文,顺便分享下读后感,今天推荐的作者是 Jakob Nielsen。做过互联网产品的人,对这个名字应该不陌生——“尼尔森十大可用性原则”就是他提的,UX 领域的祖师爷级人物。今年 3 月 26 日他发了一篇新文章叫《Intent by Discovery: Designing the AI User Experience》,讲的是 AI 时代的交互设计该怎么做。

说实话,AI 圈关于“交互革命”的文章我看过不少,大多听完就忘了。这篇不一样。它不是在讲“AI 多厉害”,而是在讲一个更根本的问题:当 AI 替你干活的时候,你这个“人”的角色到底变成了什么?

我花了些时间让 AI 陪我一起拆这篇文章,逐章过、逐段聊,过程中冒出来不少自己的想法。今天挑几个印象最深的点来聊聊。

人类不再是司机了

Nielsen 开篇就说了一句话,我觉得是全文的地基:AI 真正改变的不是界面,是用户的身份。

以前用软件,人是“操作员”。鼠标点哪里、输入什么参数,都是人在控制。下一个命令,机器执行一个动作。

现在 AI 来了,人变成“监督员”了。说一句“帮我规划一下去北京的行程”, AI 自己去查航班、查酒店、定路线,我们只是在旁边看着对不对。

他用了一个维京首领的类比:首领说“去英格兰修道院给我弄些银子来”,他不需要告诉手下先去找铁匠打盾牌、再找船、再规划路线——手下自己知道该怎么做。AI 就是那个“知道该怎么做”的手下。

这个类比很生动,但我跟 AI 讨论的时候发现了一个问题:维京首领和手下的意图是对齐的——首领要银子,手下也希望首领拿到银子。但用户和 AI 呢?AI 优化的是“看起来完成了用户说的”,用户想要的是“真正解决了我的问题”。这两件事之间的鸿沟,维京类比没有处理。

不过这个身份转变本身,我觉得 Nielsen 说得很准。他特别强调:这是 60 年来第一次真正的 UI 范式转变。上一次是从批处理到命令行,这次是从命令到意图委托。

“说不清楚”才是最大的可用性危机

全文我印象最深的概念,叫“表述壁垒”(Articulation Barrier)

意思是:意图委托这个范式,要求人用文字把想法写出来。但写作比阅读在认知上难得多。

看一段文字觉得懂了,但要把同样的意思用自己的话写出来,会发现很难下笔。发达国家大约有一半人口读写能力不足。“Prompt engineering”这个行业的存在本身,就是这个危机的证明——如果用户必须学习一套奇怪的咒语才能让 AI 给出正确结果,那这个界面就是失败的。

Nielsen 举了个例子:想让 AI 画一张“温暖的图片”,但“温暖”这个词对不同人意味着完全不同的画面——可能是暖色调、可能是阳光、可能是壁炉。文字在传递意图这件事上,其实非常低效。

这让我想到自己用 AI 画图的经历。我脑子里有一个很清晰的画面,但写成 prompt 的时候,总觉得词不达意。生成出来的东西“差不多”但“不是那个感觉”。以前我以为是自己 prompt 写得不好,现在才意识到,这可能不是我的问题,是文字这个载体本身的限制。

Nielsen 提了几个解法方向:一个是风格画廊,给一堆预设风格让人选,点一下比写 100 个字容易得多;一个是可见可编辑的用户模型,上周跟 AI 说过的偏好,这周不应该消失,记忆应该成为“一等公民”;还有多模态输入,指着一张图说“这种风格”,比打字描述精准得多。

不过我跟 AI 讨论时也聊到,风格画廊这个方案放到今天可能已经有点落后了。现在的图像模型已经能理解“温暖的图片”这种模糊描述,并且主动补全细节。与其让用户从预设里选,不如模型自己推断。这可能是一个过渡性方案。

中间那层“谈判桌”,大多数团队在忽视

Nielsen 提了一个三层架构,我觉得是全文最有实操价值的部分:

第一层:意图层。 输入意图的地方。随着 AI 越来越成熟,系统会越来越依赖“隐式意图推断”——它看日历、看屏幕上的内容、看过去的行为,然后主动猜测用户想要什么。

第二层:编排层。 这是 AI 执行高风险行动之前,跟用户“谈判”的地方。

第三层:直接操控层。 传统 GUI 不会消失,只是降级了——变成一个备用层,处理边缘情况和精细修正。

Nielsen 说第二层是最重要的,但大多数团队在忽视它。

这一层要做四件事:执行前展示“我要做什么、用什么数据、触达哪些系统”;执行后给一个完整回执;在企业环境里告诉相关方“谁会受影响、哪些政策会约束这个行动”;多个 AI 子代理发出矛盾指令时负责协调。

我跟 AI 讨论这段的时候,提了一个追问:普通用户真的有能力看懂这些信息吗?如果用户在传统 GUI 里都不看提示直接点确定,他们会在编排层认真审核 AI 的计划吗?

这其实是 Nielsen 整篇文章一个没有明确论证的前提——他假设用户能扮演好“监督员”角色。但现实可能是,大多数人不具备在 AI 行动前审核计划、判断置信度的能力。他自己后面提到的“零学习陷阱”恰好说明了这一点。

有时候,界面应该故意给你制造麻烦

这是全文最反直觉的观点:有时候,摩擦是必要的。

低风险任务当然要把摩擦去掉——让 AI 帮忙查个天气,如果还要输入验证码,那就烦死了。

但高风险任务不一样:金融交易、医疗决策、发一封给老板的邮件——这些谁都不希望 AI 一键完成。我们希望它故意慢一点,让人多想两秒。

Nielsen 提了一个概念叫“可信性陷阱”(Plausibility Trap):AI 的输出干净、权威、格式漂亮,人会下意识觉得“这个是对的”,跳过批判性分析。就像看到一份排版精美的报告,不会怀疑它的数据一样。

这让我想到之前写过的那篇关于限制的文章。FC 时代的 40KB 是物理的、冰冷的、不容置疑的,它逼人在边界里找出路。AI 给我们的恰恰相反:一望无际,无从下手。Nielsen 说的“刻意设计摩擦”,其实就是在无限中人为制造边界——让人停下来想一想,而不是一路滑过去。

他还提了一个我很喜欢的概念:渐进式委托。AI 应该从保守模式起步,上来先给你看草稿,你说“可以”它才推进下一步。慢慢积累信任度之后,它才能执行更敏感的操作。这跟现实中跟一个新同事的磨合过程一模一样。

当 AI 任务要跑好几天

还有一段讨论的是“慢 AI”——当任务需要几十分钟甚至几天的时候,传统的“加载条”概念完全失效了。

Nielsen 提了五个对策,我觉得最有意思的是两个:

概念足迹(Conceptual Breadcrumbs):别显示“40% 完成”,显示“已分析完第 3 个数据源,发现结论 X 可能有误”。中间结论比百分比有用得多。

打捞价值(Salvage Value):如果任务被中途停止,AI 应该主动告诉用户“虽然没跑完,但这些中间产物还能用”。减少“白等了 20 小时”的损失感。

这两个概念现在看来是真实需求,但方案还不成熟。不过方向是对的——AI 不能只在“完成”和“未完成”之间二选一,中间状态本身就有价值。

最后:认知外骨骼还是认知轮椅?

Nielsen 在文章最后提了一个判断框架,我觉得可以直接拿来用:

好的 AI UX = 认知外骨骼,帮人更强但还是人在控制。

坏的 AI UX = 认知轮椅,代人决策,让人的能力慢慢退化。

他特别警告了一个叫“零学习陷阱”的东西:如果用户永远不需要理解系统是怎么运作的,久而久之他们就会变成自己数字生活的“乘客”而不是“司机”。

这跟我之前的一个感受很像。我用 AI 写东西的时候,有时候会觉得“它写得比我好”,然后就懒得自己想了。时间一长,我发现自己的表达能力在退化——不是因为 AI 不好,而是因为我把判断权交出去了。

Nielsen 的意思是,UX 设计师以后的工作不是设计“屏幕 A→B→C”这种点击路径,而是构建可能性空间——设计边界约束、设计反馈循环、设计让用户保持认知参与的机制。

我的判断

读完这篇文章,我觉得最值得记住的是三个东西:

第一,“表述壁垒”这个概念。 它解释了为什么 prompt engineering 这么难、为什么你和 AI 说话经常觉得“说不清楚”——不是你的问题,是文字这个载体本身的限制。

第二,编排层(Orchestration Surface)。 三层架构里,中间这层是目前被严重忽视的,但它是建立信任的关键战场。你用的 AI 产品有没有在执行前告诉你“我打算怎么做”?大多数没有。

第三,“认知外骨骼 vs 认知轮椅”。 这个框架可以帮你判断一个 AI 产品设计得好不好——它是帮你更强,还是让你变懒。

Nielsen 这篇文章不短,原文读起来也不轻松。但如果你在做 AI 产品、或者你每天都在用 AI 工具,我觉得值得花时间读一遍。它不会告诉你“AI 多厉害”,但会让你重新想一想:当你不再点按钮,而是开口说“我想要”的时候,你和机器之间的关系,到底发生了什么变化。

原文链接:Intent by Discovery: Designing the AI User Experience