这 15 个 AI 名词，我用一篇文章讲清楚

sowang · 发表于 2026-6-8 12:25:03

这 15 个 AI 名词，我用一篇文章讲清楚

2026-06-02 唐韧

我发现一个问题，虽然很多人天天看 AI 新闻用 AI 工具，但很多基础概念其实是模糊的。

比如，到底什么是 Token、什么是 Agent、什么是 MCP、什么是上下文窗口，背后的逻辑是怎样的，大多数人并不了解。

这些词单个拿出来都认识，但串在一起就说不清楚关系了。

今天这篇，我挑了15个最常见也最容易混淆的AI概念，用大白话讲一遍。

1、大模型

2、Token

3、上下文窗口

4、参数规模

5、开源模型/闭源模型

6、模型训练

7、模型微调

8、提示词

9、AI幻觉

10、多模态

11、Agent

12、Skill

13、MCP

14、模型API

15、OpenClaw/Codex/Claude Code

尽量不用技术黑话，能类比的就类比，目标是看完之后你能真正理解它们，而不只是记住名字。

1、大模型

简单理解，大模型就是 AI 的大脑。

你用的豆包、ChatGPT、千问、Kimi，背后都是一个大模型大脑在工作。

你问它问题，它给你回答，本质上是这个大脑在做文字接龙，根据你说的话预测下一句该回什么。

比如，大模型就像你公司里一个什么都学过的新人，他读过无数书、看过无数案例，理论知识很丰富。但他刚入职，不了解你们公司的业务、不知道你的偏好、也没有独立判断的经验。

你给他越清楚的指令，他干得越好。你什么都不说就让他干活，结果大概率不行。

这个大脑里有大量的神经网络和数据，靠算法在驱动运行，如果不深究的话，理解到这里就行了。

2、Token

Token 是 AI 处理信息的最小单位。

你可以理解为 AI 不是一个字一个字读你的话，而是把文字切成一小块一小块来处理。

一个中文字大概是 1-2 个 Token，一个英文单词大概是 1 个 Token。

为什么要知道这个？因为两件事跟你直接相关。

第一，AI 产品的收费基本都按 Token 计算。你用得越多，消耗的Token越多，花的钱越多。

而且，不同模型（脑子）消耗 Token 的多少和计费方式都不一样，所以这也是为什么好模型烧 Token 比较贵的原因。

第二，每个模型能处理的 Token 总量是有上限的。

你塞给它的内容加上它回复你的内容，加在一起不能超过这个上限。超了它就处理不了，或者开始丢掉前面的内容。

这就引出了下一个概念。

3、上下文窗口

上下文窗口就是 AI 的「工作记忆」容量。

你跟AI聊天的时候，它能同时记住多少内容，取决于上下文窗口的大小。

窗口越大，它能记住的对话越多，处理的文档越长。

打个比方，你跟一个同事开会，如果他只能记住最近 5 分钟说的话，你聊到后面他就忘了前面讨论的结论。上下文窗口小的模型就是这个状态。

现在主流模型的上下文窗口从几万到几百万 Token 不等，窗口越大，意味着你可以把更长的文档、更完整的需求一次性丢给它处理。

所以如果你发现AI聊着聊着突然「失忆」了，不是它变笨了，是窗口不够用了。

4、参数规模

你经常看到新闻里说某个模型有多少亿参数、多少万亿参数，这个「参数」到底是什么？

简单理解，参数就是大模型这个大脑里神经连接的数量。

参数越多，模型理论上能处理的信息越复杂，推理能力越强。

类比一下，参数规模就像一个人的脑容量。脑容量大不代表一定聪明，但脑容量太小确实干不了复杂的事。

实际体感上，参数更大的模型通常在逻辑推理、长文本理解、复杂任务上表现更好。但也更贵，响应更慢。

对普通用户来说，不需要追求最大参数。日常问答用个中等规模的模型就够了，复杂任务再上大模型。

5、开源模型和闭源模型

这个概念很好理解，类比软件就行。

闭源模型就像微信、飞书、iOS 这类商业软件。你只能用，看不到内部怎么做的，改不了它的逻辑。

GPT-4、Claude 就是闭源模型，OpenAI 和 Anthropic 不公开它们的技术细节。

开源模型就像 WordPress、Android 这类开源软件。代码公开，你可以拿来用，也可以自己改。

Meta 的 Llama、阿里的千问、DeepSeek 都是开源模型。

如果你公司想在产品里接入 AI 能力，闭源模型通常更强，但数据会经过别人的服务器。

开源模型可以部署在自己服务器上，数据不出门，但需要技术团队来搞。

6、模型训练

所有大模型在能干活之前，都需要经过训练。

训练是什么意思？

简单说就是让模型读海量的数据，从中学习语言规律、知识和推理方式。

比如，你培养一个新人，让他先花半年时间把全公司的历史文档、行业报告、竞品分析全部看一遍。看完之后他就有了基础知识，能开始干活了。

模型训练的成本极高，动辄几千万甚至上亿美元。

训练用的数据质量决定了模型的能力上限，这就是为什么大公司都在抢数据，数据是AI时代的石油。

7、模型微调

微调是在已经训练好的大模型基础上，用你自己的数据再训练一小轮，让它更适应你的特定场景。

还是类比新人，他入职后有了通用知识，但不懂你们公司的业务术语、写作风格和工作流程。

你让他看三个月你们内部的文档，做完之后他就更贴合你的需求了，这个过程就是微调。

很多人一上来就觉得自己需要微调，其实大部分场景下，写好提示词就够了。

微调更适合有大量私有数据、需要模型长期稳定输出特定风格或特定领域知识的场景。

8、提示词（Prompt）

说白了，提示词就是你给 AI 的执行指令。

你在对话框里打的每一句话，本质上都是提示词。但「会用AI」和「用好AI」之间的差距，基本就在提示词上。

举个例子，你让 AI 帮你写一份 PRD。

差的提示词：帮我写一份 PRD。

好的提示词：你是一个资深产品经理，现在要写一份PRD。产品是一个面向中小企业的CRM系统，核心功能是客户跟进管理。目标用户是销售团队负责人。请按照背景、目标、功能清单、优先级、验收标准的结构来写，语言简洁，每个功能点不超过两句话。

同一个模型，提示词不同，输出质量天差地别。

核心原则就一条，你给AI的信息越具体、越结构化，它回你的东西越靠谱。

9、AI幻觉

AI 幻觉就是 AI 一本正经地胡说八道。

你问它一个问题，它给你一个看起来很有道理、很自信的回答，但内容是编的，数据是假的，案例是捏造的，引用的论文根本不存在。

为什么会这样？

因为大模型的本质是「预测下一个最可能的词」，它不是在数据库里查证据再回答你。它只是根据语言规律，生成一段读起来最通顺的文字。

所以，AI 给你的任何涉及事实、数据、引用的内容，都需要人工核实。

你可以让它帮你写文案、理结构、做头脑风暴。但如果它给你一个「行业数据」，最好去验证一下。

10、多模态

过去的 AI 只能处理文字，你打字给它，它打字回你。

多模态的意思是，AI 现在不只能处理文字了，还能处理图片、语音、视频、文件。

你可以拍一张白板照片丢给它，让它帮你整理成文字。可以把竞品截图发给它，让它分析UI设计。可以把一段会议录音丢给它，让它帮你出纪要。

所以，多模态意味着 AI 的输入方式变多了。

你不再需要把所有信息都翻译成文字才能喂给它，直接丢原始素材就行。

比如，像很多人用的豆包这类 AI 产品都是支持多模态的，因为大家的需求各不相同，需要多模态处理能力。

11、Agent（智能体）

Agent 是今年 AI 领域最热的概念，但也是最容易被误解的。

很多人觉得 Agent 就是一个更聪明的聊天机器人，其实不是。

聊天机器人是你问一句，它答一句。Agent 是你布置一个任务，它自己拆解步骤、调用工具、连续执行，直到任务完成。

比如，聊天机器人像一个只会回答问题的前台，你问什么它答什么，但它不会主动干活。

Agent 更像一个能独立执行任务的助理，你说「帮我调研一下竞品最近三个月的功能更新」，它自己去搜信息、整理对比表、生成报告，中间不需要你一步步盯着。

关键区别在于，Agent 能使用工具，能分步执行，能自主决策下一步干什么。

12、Skill（技能）

Skill 是 Agent 的技能插件。

一个 Agent 本身只有大模型的通用能力，但通过给它安装不同的Skill，它就能做更多具体的事。

类比一下，Agent 是一个人，Skill 是他掌握的技能。同一个人，学了写作技能就能帮你写文章，学了数据分析技能就能帮你做报表，学了搜索技能就能帮你查资料。

你可以根据自己的需求，给 Agent 安装不同的 Skill 组合。这就像你招了一个助理，然后根据你的工作内容给他做了定向培训。

还有，如果你有自己做某一件事的方法，也可以把这套方法制作成 Skill。

比如，我把自己做产品和做内容的方法结合 Skill 做成了一套 AI Agent 工作流，我的效率就高了很多。

13、MCP（模型上下文协议）

MCP 也是今年非常火的一个概念，全称 Model Context Protocol。

它解决的问题很简单，AI 怎么跟外部工具连接。

过去，你想让AI帮你查日历、读邮件、操作表格，每个工具都需要单独开发对接方式，非常碎片化。

MCP相当于定了一个统一标准，所有工具按这个标准做接口，AI就能直接调用。

所以，MCP 就像 USB 接口。没有 USB 之前，每个设备都有自己的接口线，互不兼容。

有了 USB 之后，一根线什么都能接。MCP 就是 AI 世界的 USB，让模型能用统一的方式连接各种外部工具和数据源。

14、模型API

简单理解，API 就是模型厂商把自己的AI能力「打包出租」的一种方式。

你的产品想接入 AI 能力，不需要自己搞机房去训练模型，直接调用别人的API，按用量付费就行。

这就好比你开一家餐厅，不需要自己养鸡养鱼种菜，直接从供应商采购食材就行。

API 就是 AI 能力的供应商接口，你把需求发过去，它把结果返回来。

15、OpenClaw、Codex、Claude Code

最后讲一个很多人在问的问题，以上这三个东西到底有什么区别？

先说共同点。

它们都是 AI Agent 工具，都能帮你执行复杂任务。

核心区别，在于定位和使用方式。

OpenClaw 是一个可以在本地和云端运行的 AI Agent 框架。你可以理解为它是 Agent的「身体」，你可以给它装不同的大模型作为「大脑」，再配上各种Skill让它干活。

它不绑定某一个模型，你可以用 Claude、用 GPT、用千问，都行。

Codex 是 OpenAI 做的AI编程助手，主要面向开发者，擅长写代码、改代码、做技术任务。

它跑在云端，用的是 OpenAI 自己的模型，也就是 GPT 模型。

Claude Code 是 Anthropic 做的 AI Agent 工具，同样面向开发者，默认用的是 Claude 模型，也可以接其他模型，擅长理解复杂代码和长文档。

至于哪个更好，其实没有更好，只有哪个更适合你。

所以，我的建议就是都去用一下，只有深度使用才能知道它们之间的区别，才能找到最适合自己的那一个。

好了，这就是 15 个最常用的 AI 概念。

这些概念之间其实是有关系的，大模型是基础能力，Token和上下文窗口决定了使用边界，提示词决定了你的使用质量，Agent是大模型的进化形态，Skill和MCP让Agent能干更多事，API是这一切商业化的方式。

搞懂这些，你对AI的理解就不再是碎片化的了。

以上，希望对你们有所帮助。

················· 唐韧出品 ·················

关注唐韧，用产品思维洞察现象背后的逻辑

安可时刻

时间来到 6 月份了，2026 也马上将进入下半程，回顾过去几个月 AI 的进展。

我就一个感觉，太快了。

关键是，这个速度还会越来越快，直到进入一个平衡态。

所以，当下依旧是充满机会的窗口期，普通人不要错过。

		自动登录	找回密码
密码			禁止注册