AI术语笔记 - Peanut的博客

AI 术语笔记

本文记录 AI 领域常见的英文术语和缩写，用简洁的语言解释概念。

核心概念

LLM (Large Language Model)

大型语言模型。一种基于深度学习的神经网络，通过海量文本训练来预测下一个 token（词元）。“大"指的是参数数量（数十亿到万亿级别）和训练数据规模。

常见 LLM：GPT、Claude、Llama、DeepSeek 等。

Token

词元。LLM 处理文本的最小单位。英文中 1 token ≈ 1 个单词或标点；中文中 1 token ≈ 1-2 个汉字。一个句子可能被切成几个 token，如 “Hello world” = 3 tokens。

Context Window

上下文窗口。LLM 一次能处理的 token 总数上限，包括输入和输出。超过这个限制的内容会被截断或丢失。

例如：上下文窗口 128k 的模型表示最多能处理约 10 万汉字。

Temperature

温度参数。控制输出随机性的参数：

temperature = 0：输出几乎确定，适合精确问答
temperature = 0.7~1.0：输出更多样，适合创意写作

Hallucination

幻觉。LLM 生成看似合理但实际错误或不存在的信息。这是 LLM 的固有问题，而非 bug。

RAG 相关

RAG (Retrieval Augmented Generation)

检索增强生成。一种让 LLM 回答基于私有知识的技术：

用户问题 → 检索相关文档 → 拼入提示词 → LLM 生成答案

解决的问题：LLM 不知道私有数据（如你的笔记、企业文档）的问题。

Vector Database

向量数据库。存储文本嵌入向量的数据库，通过语义相似度搜索内容。例如 Milvus、Pinecone、Chroma。

Embedding

嵌入/向量化。把文本转换成数字向量的过程，相似文本有相似的向量，便于语义搜索。

Chunking

分块。把长文档切成小的文本块（通常 500-1000 tokens），便于检索和高效处理。

Agent 相关

AI Agent

AI 代理/智能体。能够自主规划、使用工具、完成复杂任务的 AI 系统。

核心能力：

感知 — 接收信息
思考 — 推理和规划
行动 — 调用工具执行

MCP (Model Context Protocol)

模型上下文协议。Anthropic 提出的标准协议，让 AI 能安全地连接外部数据源和工具（如文件、数据库、API）。

类似 USB 接口 — 有了 MCP，AI 就像有了标准化的"接口"来访问各种外部资源。

Tool Use

工具调用。LLM 通过生成特殊指令来调用外部工具（搜索、计算、API等），扩展其能力边界。

Multi-Agent

多智能体。多个 AI 代理协同工作，各司其职（规划、执行、检查），完成复杂任务。

Fine-tuning 相关

Fine-tuning

微调。在预训练模型的基础上，用特定领域数据进一步训练，使模型适应特定任务或风格。

LoRA (Low-Rank Adaptation)

低秩适配。一种高效微调技术，通过训练少量参数而不是整个模型，大幅降低微调成本。

RLHF (Reinforcement Learning from Human Feedback)

基于人类反馈的强化学习。用人类偏好数据训练奖励模型，再通过强化学习优化 LLM 输出质量。

Quantization

量化。把模型参数从高精度（FP32）转换为低精度（INT8/INT4），大幅减少内存占用，同时保持大部分性能。

Prompt Engineering

提示词工程。设计和优化输入给 LLM 的提示词，以获得更好输出的实践。

Few-shot / Zero-shot

少样本/零样本学习：

Zero-shot：直接提问，不给示例
Few-shot：给 1-3 个示例，帮助模型理解任务

System Prompt

系统提示词。设置 AI 角色、行为规则和约束的顶层指令，通常在对话开始时输入。

模型相关

Base Model vs Instruct Model

Base Model：基础模型，能续写文本但不擅长对话
Instruct Model：指令模型，经过微调能理解并执行指令

Multimodal

多模态。能处理多种类型数据（文本、图片、音频、视频）的模型。

Reasoning Model

推理模型。专门优化过推理能力（数学、代码、逻辑）的模型，如 GPT-o1、Claude 3.5 Sonnet。

MoE (Mixture of Experts)

混合专家模型。一种模型架构，只有部分"专家"网络被激活处理每个输入，提高效率。

Claude Code 相关

Skill

在 Claude Code 中，Skill 是经过经验优化好的提示词文档，用于特定任务的执行代理。

一个 Skill 通常包含：

角色定义 — 这个 Skill 扮演什么角色（代码审查员、测试专家等）
执行流程 — 明确的步骤和检查点
输出格式 — 报告的结构、commit 格式等
触发条件 — 什么情况该用、什么情况不该用

通常存放于 ~/.claude/agents/ 或插件目录下，本质是一个优化好的 Markdown 提示词文件。

Slash Commands (/xxx) 是调用 Skill 的快捷入口，输入 /skill-name 即可触发对应的 Skill 代理执行任务。

MCP (Model Context Protocol)

模型上下文协议。Anthropic 提出的标准协议，让 AI 能安全地连接外部数据源和工具（如文件、数据库、API）。

类似 USB 接口 — 有了 MCP，AI 就像有了标准化的"接口"来访问各种外部资源。

Hooks (钩子)

Hooks 是 Claude Code 中的自动化机制，在特定生命周期事件触发时自动执行脚本或命令。

12 个生命周期事件

Hook 事件	触发时机	可阻止？	最佳用途
`SessionStart`	会话开始/恢复	否	加载上下文、设置环境变量
`UserPromptSubmit`	提交提示词时	是	上下文注入、验证
`PreToolUse`	工具执行前	是	安全拦截、自动批准
`PermissionRequest`	权限请求时	是	自动批准/拒绝
`PostToolUse`	工具执行后	否	自动格式化、lint、日志
`PostToolUseFailure`	工具失败后	否	错误处理
`SubagentStart`	子代理启动时	否	子代理初始化
`SubagentStop`	子代理停止时	是	子代理验证
`Stop`	Claude 停止响应时	是	任务强制完成
`PreCompact`	压缩前	否	记录备份
`Setup`	`--init/--maintenance` 时	否	一次性设置
`SessionEnd`	会话终止时	否	清理、日志
`Notification`	发送通知时	否	桌面提醒、TTS

Hook 类型

类型	说明
Command	运行 Shell 脚本
HTTP	POST 到端点接收 JSON
Prompt	使用 LLM 评估决策
Agent	启动带工具的子代理进行验证

配置位置（优先级从高到低）

范围	位置	共享？
Managed	系统目录	IT 部署
Local	`.claude/settings.local.json`	否
Project	`.claude/settings.json`	是
User	`~/.claude/settings.json`	否

Rules (规则)

Rules 是 Claude Code 中的提示词规则文件，定义工作流程和最佳实践。

Rules 文件位置

类型	位置
用户级	`~/.claude/rules/*.md`
项目级	项目根目录或 `.claude/`

内置 Rules 示例

你的 ~/.claude/rules/ 下可能已有：

agents.md — Agent 编排规则，定义何时使用什么代理（planner、code-reviewer 等）
code-review.md — 代码审查标准，什么时候必须审查、审查清单
coding-style.md — 编码风格规范（不可变性、错误处理等）
git-workflow.md — Git 工作流和 commit 格式
security.md — 安全检查清单
testing.md — 测试要求（80% 覆盖率等）

Rules 的本质

和 Skill 一样，Rules 也是经过经验优化的 Markdown 提示词文件，只是用途不同：

	Skill	Rules
用途	执行特定任务	定义工作流程和标准
触发	Slash 命令	自动融入每次交互
内容	角色+流程+输出格式	规范+清单+检查点

Rules 工作方式

Claude Code 会在执行任务前自动读取相关 Rules 文件，把规则融入到系统提示词中。例如：

写代码前 → 读取 coding-style.md
提交前 → 读取 git-workflow.md
安全相关 → 读取 security.md

Hooks 与 Rules 协同工作

Rules = 工作标准和规范（告诉 Claude “应该怎么做”） Hooks = 自动化执行机制（在特定时刻自动触发动作）

配合实例

场景：用户让 Claude 写一个新功能并提交

阶段	Rules（规范）	Hooks（自动化）
写代码前	读取 `coding-style.md`（命名规范、不可变性）	—
写代码时	读取 `testing.md`（要求 80% 覆盖率）	—
写完代码	读取 `security.md`（检查敏感信息）	—
代码完成后	—	`PostToolUse`：自动运行 Prettier 格式化
提交前	读取 `git-workflow.md`（commit 格式）	—
提交时	—	`Stop`：检查测试覆盖率是否达标
发现问题	—	Hook 阻止提交，要求修复

工作流程示意

用户: "帮我写一个登录功能并提交"
         │
         ▼
┌─────────────────────────────────────────┐
│  阶段1: Rules 融入系统提示词             │
│  • coding-style.md → 代码规范          │
│  • testing.md → 必须有测试              │
│  • security.md → 不能暴露密码           │
└─────────────────┬───────────────────────┘
                  │
                  ▼
┌─────────────────────────────────────────┐
│  阶段2: Claude 执行任务                 │
│  • 按 Rules 写代码                      │
│  • 遵循命名规范、不可变模式            │
│  • 添加测试用例                        │
│  • 检查敏感信息                        │
└─────────────────┬───────────────────────┘
                  │
                  ▼
┌─────────────────────────────────────────┐
│  阶段3: Hooks 拦截检查                 │
│  • PostToolUse: 格式化代码            │
│  • PostToolUse: 运行 lint              │
│  • PostToolUse: 运行测试               │
│  • Stop: 验证覆盖率 ≥ 80%             │
└─────────────────┬───────────────────────┘
                  │
         ┌────────┴────────┐
         ▼                 ▼
    通过检查            未通过检查
    (Rules 遵守)       (有问题)
         │                 │
         ▼                 ▼
    提交成功         Hook 阻止提交
                   提示修复问题

本质区别

组件	职责	性质
Rules	定义"目标是什么”	指导原则，Claude 尽量遵循
Hooks	执行"如何确保达到目标"	强制检查，可拦截操作

CLAUDE.md

CLAUDE.md 是项目级的说明文件，供 AI 在该项目中快速了解上下文。

与 Rules 的区别：

CLAUDE.md — 项目专属信息（项目结构、功能、使用方式）
Rules — 通用的工作流程规范（适用于所有项目）

其他常见术语

术语	全称	解释
API	Application Programming Interface	程序接口
Tokens per Minute (TPM)	—	API 调用速率限制单位
Guardrails	—	内容过滤，防止输出不当信息
Streaming	—	流式输出，边生成边显示
Benchmark	—	基准测试，评估模型性能的标准
Red Teaming	—	红队测试，故意找漏洞来改进安全

AI 术语笔记

核心概念

LLM (Large Language Model)

Token

Context Window

Temperature

Hallucination

RAG 相关

RAG (Retrieval Augmented Generation)

Vector Database

Embedding

Chunking

Agent 相关

AI Agent

MCP (Model Context Protocol)

Tool Use

Multi-Agent

Fine-tuning 相关

Fine-tuning

LoRA (Low-Rank Adaptation)

RLHF (Reinforcement Learning from Human Feedback)

Quantization

Prompt Engineering

Prompt Engineering

Few-shot / Zero-shot

System Prompt

模型相关

Base Model vs Instruct Model

Multimodal

Reasoning Model

MoE (Mixture of Experts)

Claude Code 相关

Skill

MCP (Model Context Protocol)

Hooks (钩子)

12 个生命周期事件

Hook 类型

配置位置（优先级从高到低）

Rules (规则)

Rules 文件位置

内置 Rules 示例

Rules 的本质

Rules 工作方式

Hooks 与 Rules 协同工作

配合实例

工作流程示意

本质区别

CLAUDE.md

其他常见术语

参考资料