AI学习全景图

2026-01-12约 10 分钟

#AI#反思

!图片

（2026 年第 3 周，第 2 篇）

盯着终端上那一串串报错的红字，我开始严重怀疑人生。

整个 2025 年，我对 “本地化部署” 有着一种近乎偏执的迷恋。看到任何有点意思的 AI 项目——什么信息图生成、思维导图工具、PPT 自动生成——我的第一反应就是：搞下来，自己跑！

但现实往往是残酷的……

不是需要 Docker，就是得折腾 Python 的虚拟环境，各种依赖包要装到抓狂，模型路径要反复调整，配置文件改了又改……

然后，满怀期待地敲下回车。

结果，终端里一串鲜红的报错。看得人头皮发麻。

讲真的，我当时真的懵了。系统越来越乱，效果越来越差。整个 2025 年，我都在问自己一个问题：不熟练掌握代码，是不是根本不适合学 AI？

还好，现在的我终于想明白了。

所以今天，我想把这一年的弯路和思考，彻底说清楚。

灵魂拷问：我到底想用 AI 干嘛？

直到有一天，我折腾累了，不得不停下来问自己一个最根本的问题：

我到底想用 AI 干什么？

A. 随便聊聊天，让它帮我解决点日常小问题？
B. 让它变成我的工作助手，帮我写文案、做分析，提高效率？
C. 设计一套工作流，让它自动化处理重复任务？
D. 开发一个 AI 应用，集成到公司的业务里？
E. 成为 AI 专家，从零构建整个系统？

我发现，我真正想要的可能只是 B 或者 C，最多到 D 有一丝期待，但却一直在用学 E 的方法折磨自己。

这就好像我只想学做个番茄炒蛋，结果跑去报了个生物化学和分子营养学的博士。

不是不对，是——完全没必要。

一张图带来的“卧槽”时刻

在梳理自己的学习路径时，我一直在琢磨用什么框架能把 AI 这个复杂系统讲清楚。我想起了之前接触过的一张图——Greg Coquillo 发布的 8 层智能体架构图。

这张图清晰地展示了 AI 的分层结构，但起初，它反而让我更困惑了：这 8 层我都要学吗？那我得学到猴年马月去？

直到我把这张图和我的根本问题（“我到底想用 AI 干嘛？”）放在一起时，才迎来了真正的“卧槽”时刻——我突然意识到：

这个架构，是给开发 AI 系统的人看的，不是给我们这些用 AI 的人看的。

就好像你开车，你需要知道发动机的每个零件怎么工作吗？

不需要。

你只需要知道油门、刹车、方向盘在哪，就能上路了。那些以为“必须从论文开始学”的人，就像想去买车，却先去读了四年机械工程。

想通这件事后，我整个人都轻松了。我把我的新思路称之为： 倒着学，以果为因。

先定目标：我要去哪。

再找路径：我需要学什么。

我意识到，我根本不需要从“发电厂”开始学，从“方向盘”开始就够了。

2026 年，我的路径与目标

在经历了一整年的混乱后，我的学习路径终于变得清晰：不再追求“什么都懂”，而是聚焦于“解决问题”。

举个例子，在耗费了大量精力后，我现在的工作流已经能做到，在需要了解新的政策法规时：

1. 先用 DeepSearch 这样的 AI 搜索工具，全网扫一遍，了解宏观情况。

2. 把找到的公开报告、规章制度文件一股脑喂给到自己的知识库。

3. 调用预设好的不同专家角色，让 AI 从各个角度、维度去分析这些资料。

4. 5 分钟内，一个全面、系统的分析框架就出来了。

这套流程，虽然告别了过去那种“马路边登录”式的报错体验，但搭建过程同样痛苦。回过头看，我才发现，如果一开始就想清楚，根本用不着这么折腾。

我的“够用”标准逐渐清晰： 基础→模型→编排→应用，这几层搞明白就够了。同理就可以整出更多的文稿审核、市场调研等等智能体。

至于其他的？那是别人的路。

我的五个阶段：我曾在哪，又到了哪

现在，我把过去一年的学习和使用路径重新梳理了一遍，把它画成了我在新一年的学习地图。它不是按职业分的，而是按“我想用 AI 干什么”分的。

![AI学习全景图:我的五个阶段信息图](data:image/svg+xml,%3C%3Fxml version='1.0' encoding='UTF-8'%3F%3E%3Csvg width='1px' height='1px' viewBox='0 0 1 1' version='1.1' xmlns='http://www.w3.org/2000/svg' xmlns:xlink='http://www.w3.org/1999/xlink'%3E%3Ctitle%3E%3C/title%3E%3Cg stroke='none' stroke-width='1' fill='none' fill-rule='evenodd' fill-opacity='0'%3E%3Cg transform='translate(-249.000000, -126.000000)' fill='%23FFFFFF'%3E%3Crect x='249' y='126' width='1' height='1'%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E)

D1 级：被动使用者——“会问问题就行”

这是我刚开始接触 AI 的阶段。

状态： 偶尔让 AI 帮忙查资料、翻译句子，对技术完全没兴趣，只想解决眼前问题。
我发现需要的能力： 知道怎么提一个好问题（基础 Prompt 技巧），了解 AI 能干嘛、不能干嘛就行。
当时能做的事： “帮我写封邮件”、“把这段话润色一下”、“给我解释下什么是 RAG”。
所需时间： 讲真，2 小时就够了。

D2 级：主动优化者——“让 AI 更懂我”

这是我开始频繁用 AI 工作后的阶段。

状态： 发现 AI 有时候答非所问，想让它更精准，开始琢磨“怎么问，才能得到我想要的答案”。
我发现需要的能力： 系统的 Prompt 工程技巧（角色扮演、分步思考、提供范例），理解不同模型的特点（GPT-4 强在哪，Claude 适合读什么）。
当时能做的事： “你是一位资深的产品经理，请根据以下背景……”、“请一步一步分析这个问题，先列出关键因素……”。
所需时间： 大概花了 1-2 周，在实践中不断碰壁和优化。

D3 级：工作流设计者——“让 AI 帮我做事”

这是我现在正痴迷的阶段。

状态： 成了 AI 重度用户，看到重复性任务就手痒，总想着“能不能让 AI 自己把整个流程跑完”。
我发现需要的能力： 工具集成（让 AI 读我的文档、发邮件）、多步骤编排（设计自动化流程）、记忆管理（让 AI 记住我的偏好）、RAG 技术（让 AI 基于我的私人笔记回答问题）。
现在能做的事： “每天早上自动读我的 RSS 订阅，提取重点，生成摘要发给我”、“根据我的 Obsidian 笔记库，回答我的专业问题”。
所需时间： 我估计要花 1-2 个月，需要大量动手实践。

D4 级：应用定制者——“做个专属 AI 助手”

这是我下一步想探索的阶段。

状态： 想为自己或团队定制一个专属的 AI 应用，愿意学点代码，但不想从头造轮子。
我发现需要的能力： API 调用、低代码平台（Dify、Coze、n8n）、向量数据库、简单的后端开发知识。
未来想做的事： “做一个连接公司知识库的智能问答系统”、“搭一个自动化的内容审核工具”。
预计所需时间： 3-6 个月，需要一些编程基础。

D5 级：系统构建者——“从零开发 AI 产品”

这是那些真正的 AI 大佬们走的路。

状态： 专业开发者或 AI 研究者，想深入底层原理，构建可商用的 AI 产品。
我发现需要的能力： 全部 8 层技术栈、模型训练与微调、多模态 AI、智能体架构设计……几乎是所有。
所需时间： 1-2 年以上的持续深耕，我暂时不考虑。

梳理完我发现，绝大多数人，包括我自己，停留在 D1-D3 就完全够用了。只有真的想做 AI 产品、搞 AI 创业的人，才需要一头扎进 D4、D5 的深水区。

AI 的 8 层楼：2026 年，我选择住在这几层

想清楚自己的路径后，2026 年，我重新审视了那张曾让我“卧槽”的 8 层架构图。我不再把它看作是需要攀登的高楼，而是把它当成一张城市地图，用来判断每一片区域到底和“我”有多大关系。

![AI的8层架构:我该住在第几层信息图](data:image/svg+xml,%3C%3Fxml version='1.0' encoding='UTF-8'%3F%3E%3Csvg width='1px' height='1px' viewBox='0 0 1 1' version='1.1' xmlns='http://www.w3.org/2000/svg' xmlns:xlink='http://www.w3.org/1999/xlink'%3E%3Ctitle%3E%3C/title%3E%3Cg stroke='none' stroke-width='1' fill='none' fill-rule='evenodd' fill-opacity='0'%3E%3Cg transform='translate(-249.000000, -126.000000)' fill='%23FFFFFF'%3E%3Crect x='249' y='126' width='1' height='1'%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E)

L1：基础设施层——AI 的“发电厂”

技术名词： GPU/TPU、云平台、推理服务。
我的理解： 这是 AI 的“发电厂”和“高速公路”。我用电，需要自己建个发电厂吗？大部分时候不需要。但如果你像我之前那样，想自己搞个“发电机”玩玩，那就另说了。
和我的关系： 我曾经深度折腾过的一层。 讲真，如果你只是用别人做好的成品，确实不用管它。但如果你也想本地部署、控制成本，那这一层就绕不过去。文章开头那些让我头皮发麻的报错，基本都发生在这里。

L2：智能体互联网层——AI 的“社交网络”

技术名词： Skyfire、Fetch.ai、机器经济。
我的理解： 让 AI 之间自己连接、协作、交易。听起来很科幻，像我的 AI 助手可以自己雇另一个 AI 帮我买机票。
和我的关系： 现阶段可以跳过 。这是未来的方向，但现在离我还太远。

L3：协议层——不同工具的“通用语言”

技术名词： MCP、A2A、ACP.
我的理解： 就像 USB 接口，让不同的 AI 工具能互相“认识”和“配合”。
和我的关系： 作为 D3 级别的用户，我需要 基础了解 。当我想让 AI 读取我的 Obsidian 笔记时，背后就有类似协议在工作。我不用懂技术细节，但要知道“兼容性”这回事。

L4：工具与增强层——AI 的“手脚”

技术名词： RAG、Code Interpreter、LangChain.
我的理解： 这是 AI 的“手脚”，让它能上网、读文档、写代码、发邮件。没这个，AI 就只是个“只会说话的大脑”。
和我的关系： 核心重点 。我想自动化工作流，就必须学会组合这些工具。

L5：认知与推理层——AI 的“大脑”

技术名词： GPT、Gemini、Qwen、豆包等大模型的推理能力。
我的理解： 这是 AI 的“大脑”，决定它怎么思考、怎么回答我。
和我的关系： 所有人都需要基础了解 。我至少得知道：AI 不是真在“思考”，而是在“预测下一个词”；AI 会“胡说八道”（幻觉）；不同模型有不同特点。

L6：记忆与个性化层——AI 的“记忆”

技术名词： 向量数据库、长期记忆、个性化。
我的理解： 这是 AI 的“记忆”，让它记住我的偏好、之前的对话、我的私人知识。
和我的关系： 需要深入理解 。我想让 AI 记住我的工作习惯和团队规范，这一层就至关重要。D4/D5 开发者则必须掌握。

L7：应用层——我能直接用到的 AI 产品

技术名词： NoteBook、豆包、Monica、Copilot.
我的理解： 这是我每天打开的那些 AI 产品——聊天助手、写作工具、代码助手。
和我的关系： 所有人的核心重点 。不管在哪一层，最终都要落到使用这些产品上。

L8：运营与治理层——AI 的“安全带”

技术名词： Guardrails、可观测性、安全审计。
我的理解： AI 的“安全带”和“监控器”，防止它乱说话、乱做事。
和我的关系： D1-D2 阶段，有 安全意识 就够了（不上传公司机密）。到了 D3，当我让 AI 处理敏感数据时，就得了解如何设置边界。

2026 年，我终于不再焦虑了

写这篇文章，目的梳理我整个 2025 年踩过的坑和走过的弯路。

AI 这个东西，真的，被搞得太复杂了。

技术圈的人喜欢炫技，喜欢堆砌术语，搞得好像不懂这些，就跟不上时代了。

但事实是，99% 的人，包括我，都不需要懂底层原理，也能用好 AI。就像我不需要懂 HTTP 协议也能上网，不需要懂编译原理也能写代码一样。

AI 时代最大的焦虑，可能不是来自技术本身，而是来自于不知道自己在哪，以及不知道自己要去哪。

这一年的折腾让我明白，重要的不是“学多少”，而是“学对的那一部分”。

不需要成为 AI 专家，才能用好 AI。

真正的专业，是知道什么时候该深入，什么时候该放手。

所以，现在的我不再为那些看不懂的论文和跑不起来的代码而焦虑了。因为我终于找到了自己的位置，知道了什么对我来说是重要的。

真的，没那么难。

希望我这点从 2025 年混乱中总结出的心路历程，能帮同样在 AI 学习路上探索的你，少走一点弯路。

2026 年，让我们一起，在 AI 时代，找到属于自己的节奏。

继续滑动看下一个

哞小哞的杂货铺

向上滑动看下一个

解释