公众号

AI学习全景图

2026-01-1210 分钟
#AI#反思

!图片

(2026 年第 3 周,第 2 篇)

盯着 终端 上那一串串报错的红字,我开始严重怀疑人生。

整个 2025 年,我对 “本地化部署” 有着一种近乎偏执的迷恋。看到任何有点意思的 AI 项目——什么信息图生成、思维导图工具、PPT 自动生成——我的第一反应就是:搞下来,自己跑!

但现实往往是残酷的……

不是需要 Docker,就是得折腾 Python 的虚拟环境,各种依赖包要装到抓狂,模型路径要反复调整,配置文件改了又改……

然后,满怀期待地敲下回车。

结果,终端里一串鲜红的报错。看得人头皮发麻。

讲真的,我当时真的懵了。系统越来越乱,效果越来越差。整个 2025 年,我都在问自己一个问题:不熟练掌握代码,是不是根本不适合学 AI?

还好,现在的我终于想明白了。

所以今天,我想把这一年的弯路和思考,彻底说清楚。


灵魂拷问:我到底想用 AI 干嘛?

直到有一天,我折腾累了,不得不停下来问自己一个最根本的问题:

我到底想用 AI 干什么?

  • A. 随便聊聊天,让它帮我解决点日常小问题?
  • B. 让它变成我的工作助手,帮我写文案、做分析,提高效率?
  • C. 设计一套工作流,让它自动化处理重复任务?
  • D. 开发一个 AI 应用,集成到公司的业务里?
  • E. 成为 AI 专家,从零构建整个系统?

我发现,我真正想要的可能只是 B 或者 C,最多到 D 有一丝期待,但却一直在用学 E 的方法折磨自己。

这就好像我只想学做个番茄炒蛋,结果跑去报了个生物化学和分子营养学的博士。

不是不对,是——完全没必要。


一张图带来的“卧槽”时刻

在梳理自己的学习路径时,我一直在琢磨用什么框架能把 AI 这个复杂系统讲清楚。我想起了之前接触过的一张图——Greg Coquillo 发布的 8 层智能体架构图。

这张图清晰地展示了 AI 的分层结构,但起初,它反而让我更困惑了:这 8 层我都要学吗?那我得学到猴年马月去?

直到我把这张图和我的根本问题(“我到底想用 AI 干嘛?”)放在一起时,才迎来了真正的“卧槽”时刻——我突然意识到:

这个架构,是给开发 AI 系统的人看的,不是给我们这些用 AI 的人看的。

就好像你开车,你需要知道发动机的每个零件怎么工作吗?

不需要。

你只需要知道油门、刹车、方向盘在哪,就能上路了。那些以为“必须从论文开始学”的人,就像想去买车,却先去读了四年机械工程。

想通这件事后,我整个人都轻松了。我把我的新思路称之为: 倒着学,以果为因。

先定目标:我要去哪。

再找路径:我需要学什么。

我意识到,我根本不需要从“发电厂”开始学,从“方向盘”开始就够了。


2026 年,我的路径与目标

在经历了一整年的混乱后,我的学习路径终于变得清晰:不再追求“什么都懂”,而是聚焦于“解决问题”。

举个例子,在耗费了大量精力后,我现在的工作流已经能做到,在需要了解新的政策法规时:

1. 先用 DeepSearch 这样的 AI 搜索工具,全网扫一遍,了解宏观情况。

2. 把找到的公开报告、规章制度文件一股脑喂给到自己的知识库。

3. 调用预设好的不同专家角色,让 AI 从各个角度、维度去分析这些资料。

4. 5 分钟内,一个全面、系统的分析框架就出来了。

这套流程,虽然告别了过去那种“马路边登录”式的报错体验,但搭建过程同样痛苦。回过头看,我才发现,如果一开始就想清楚,根本用不着这么折腾。

我的“够用”标准逐渐清晰: 基础→模型→编排→应用,这几层搞明白就够了。同理就可以整出更多的文稿审核、市场调研等等智能体。

至于其他的?那是别人的路。


我的五个阶段:我曾在哪,又到了哪

现在,我把过去一年的学习和使用路径重新梳理了一遍,把它画成了我在新一年的学习地图。它不是按职业分的,而是按“我想用 AI 干什么”分的。

![AI学习全景图:我的五个阶段信息图](data:image/svg+xml,%3C%3Fxml version='1.0' encoding='UTF-8'%3F%3E%3Csvg width='1px' height='1px' viewBox='0 0 1 1' version='1.1' xmlns='http://www.w3.org/2000/svg' xmlns:xlink='http://www.w3.org/1999/xlink'%3E%3Ctitle%3E%3C/title%3E%3Cg stroke='none' stroke-width='1' fill='none' fill-rule='evenodd' fill-opacity='0'%3E%3Cg transform='translate(-249.000000, -126.000000)' fill='%23FFFFFF'%3E%3Crect x='249' y='126' width='1' height='1'%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E)

D1 级:被动使用者——“会问问题就行”

这是我刚开始接触 AI 的阶段。

  • 状态: 偶尔让 AI 帮忙查资料、翻译句子,对技术完全没兴趣,只想解决眼前问题。
  • 我发现需要的能力: 知道怎么提一个好问题(基础 Prompt 技巧),了解 AI 能干嘛、不能干嘛就行。
  • 当时能做的事: “帮我写封邮件”、“把这段话润色一下”、“给我解释下什么是 RAG”。
  • 所需时间: 讲真,2 小时就够了。

D2 级:主动优化者——“让 AI 更懂我”

这是我开始频繁用 AI 工作后的阶段。

  • 状态: 发现 AI 有时候答非所问,想让它更精准,开始琢磨“怎么问,才能得到我想要的答案”。
  • 我发现需要的能力: 系统的 Prompt 工程技巧(角色扮演、分步思考、提供范例),理解不同模型的特点(GPT-4 强在哪,Claude 适合读什么)。
  • 当时能做的事: “你是一位资深的产品经理,请根据以下背景……”、“请一步一步分析这个问题,先列出关键因素……”。
  • 所需时间: 大概花了 1-2 周,在实践中不断碰壁和优化。

D3 级:工作流设计者——“让 AI 帮我做事”

这是我现在正痴迷的阶段。

  • 状态: 成了 AI 重度用户,看到重复性任务就手痒,总想着“能不能让 AI 自己把整个流程跑完”。
  • 我发现需要的能力: 工具集成(让 AI 读我的文档、发邮件)、多步骤编排(设计自动化流程)、记忆管理(让 AI 记住我的偏好)、RAG 技术(让 AI 基于我的私人笔记回答问题)。
  • 现在能做的事: “每天早上自动读我的 RSS 订阅,提取重点,生成摘要发给我”、“根据我的 Obsidian 笔记库,回答我的专业问题”。
  • 所需时间: 我估计要花 1-2 个月,需要大量动手实践。

D4 级:应用定制者——“做个专属 AI 助手”

这是我下一步想探索的阶段。

  • 状态: 想为自己或团队定制一个专属的 AI 应用,愿意学点代码,但不想从头造轮子。
  • 我发现需要的能力: API 调用、低代码平台(Dify、Coze、n8n)、向量数据库、简单的后端开发知识。
  • 未来想做的事: “做一个连接公司知识库的智能问答系统”、“搭一个自动化的内容审核工具”。
  • 预计所需时间: 3-6 个月,需要一些编程基础。

D5 级:系统构建者——“从零开发 AI 产品”

这是那些真正的 AI 大佬们走的路。

  • 状态: 专业开发者或 AI 研究者,想深入底层原理,构建可商用的 AI 产品。
  • 我发现需要的能力: 全部 8 层技术栈、模型训练与微调、多模态 AI、智能体架构设计……几乎是所有。
  • 所需时间: 1-2 年以上的持续深耕,我暂时不考虑。

梳理完我发现,绝大多数人,包括我自己,停留在 D1-D3 就完全够用了。只有真的想做 AI 产品、搞 AI 创业的人,才需要一头扎进 D4、D5 的深水区。


AI 的 8 层楼:2026 年,我选择住在这几层

想清楚自己的路径后,2026 年,我重新审视了那张曾让我“卧槽”的 8 层架构图。我不再把它看作是需要攀登的高楼,而是把它当成一张城市地图,用来判断每一片区域到底和“我”有多大关系。

![AI的8层架构:我该住在第几层信息图](data:image/svg+xml,%3C%3Fxml version='1.0' encoding='UTF-8'%3F%3E%3Csvg width='1px' height='1px' viewBox='0 0 1 1' version='1.1' xmlns='http://www.w3.org/2000/svg' xmlns:xlink='http://www.w3.org/1999/xlink'%3E%3Ctitle%3E%3C/title%3E%3Cg stroke='none' stroke-width='1' fill='none' fill-rule='evenodd' fill-opacity='0'%3E%3Cg transform='translate(-249.000000, -126.000000)' fill='%23FFFFFF'%3E%3Crect x='249' y='126' width='1' height='1'%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E)

L1:基础设施层——AI 的“发电厂”

  • 技术名词: GPU/TPU、云平台、推理服务。
  • 我的理解: 这是 AI 的“发电厂”和“高速公路”。我用电,需要自己建个发电厂吗?大部分时候不需要。但如果你像我之前那样,想自己搞个“发电机”玩玩,那就另说了。
  • 和我的关系: 我曾经深度折腾过的一层。 讲真,如果你只是用别人做好的成品,确实不用管它。但如果你也想本地部署、控制成本,那这一层就绕不过去。文章开头那些让我头皮发麻的报错,基本都发生在这里。

L2:智能体互联网层——AI 的“社交网络”

  • 技术名词: Skyfire、Fetch.ai、机器经济。
  • 我的理解: 让 AI 之间自己连接、协作、交易。听起来很科幻,像我的 AI 助手可以自己雇另一个 AI 帮我买机票。
  • 和我的关系: 现阶段可以跳过 。这是未来的方向,但现在离我还太远。

L3:协议层——不同工具的“通用语言”

  • 技术名词: MCP、A2A、ACP.
  • 我的理解: 就像 USB 接口,让不同的 AI 工具能互相“认识”和“配合”。
  • 和我的关系: 作为 D3 级别的用户,我需要 基础了解 。当我想让 AI 读取我的 Obsidian 笔记时,背后就有类似协议在工作。我不用懂技术细节,但要知道“兼容性”这回事。

L4:工具与增强层——AI 的“手脚”

  • 技术名词: RAG、Code Interpreter、LangChain.
  • 我的理解: 这是 AI 的“手脚”,让它能上网、读文档、写代码、发邮件。没这个,AI 就只是个“只会说话的大脑”。
  • 和我的关系: 核心重点 。我想自动化工作流,就必须学会组合这些工具。

L5:认知与推理层——AI 的“大脑”

  • 技术名词: GPT、Gemini、Qwen、豆包等大模型的推理能力。
  • 我的理解: 这是 AI 的“大脑”,决定它怎么思考、怎么回答我。
  • 和我的关系: 所有人都需要基础了解 。我至少得知道:AI 不是真在“思考”,而是在“预测下一个词”;AI 会“胡说八道”(幻觉);不同模型有不同特点。

L6:记忆与个性化层——AI 的“记忆”

  • 技术名词: 向量数据库、长期记忆、个性化。
  • 我的理解: 这是 AI 的“记忆”,让它记住我的偏好、之前的对话、我的私人知识。
  • 和我的关系: 需要深入理解 。我想让 AI 记住我的工作习惯和团队规范,这一层就至关重要。D4/D5 开发者则必须掌握。

L7:应用层——我能直接用到的 AI 产品

  • 技术名词: NoteBook、豆包、Monica、Copilot.
  • 我的理解: 这是我每天打开的那些 AI 产品——聊天助手、写作工具、代码助手。
  • 和我的关系: 所有人的核心重点 。不管在哪一层,最终都要落到使用这些产品上。

L8:运营与治理层——AI 的“安全带”

  • 技术名词: Guardrails、可观测性、安全审计。
  • 我的理解: AI 的“安全带”和“监控器”,防止它乱说话、乱做事。
  • 和我的关系: D1-D2 阶段,有 安全意识 就够了(不上传公司机密)。到了 D3,当我让 AI 处理敏感数据时,就得 了解 如何设置边界。

2026 年,我终于不再焦虑了

写这篇文章,目的梳理我整个 2025 年踩过的坑和走过的弯路。

AI 这个东西,真的,被搞得太复杂了。

技术圈的人喜欢炫技,喜欢堆砌术语,搞得好像不懂这些,就跟不上时代了。

但事实是,99% 的人,包括我,都不需要懂底层原理,也能用好 AI。就像我不需要懂 HTTP 协议也能上网,不需要懂编译原理也能写代码一样。

AI 时代最大的焦虑,可能不是来自技术本身,而是来自于不知道自己在哪,以及不知道自己要去哪。

这一年的折腾让我明白,重要的不是“学多少”,而是“学对的那一部分”。

不需要成为 AI 专家,才能用好 AI。

真正的专业,是知道什么时候该深入,什么时候该放手。

所以,现在的我不再为那些看不懂的论文和跑不起来的代码而焦虑了。因为我终于找到了自己的位置,知道了什么对我来说是重要的。

真的,没那么难。

希望我这点从 2025 年混乱中总结出的心路历程,能帮同样在 AI 学习路上探索的你,少走一点弯路。

2026 年,让我们一起,在 AI 时代,找到属于自己的节奏。

继续滑动看下一个

哞小哞的杂货铺

向上滑动看下一个

解释