大模型原理与Context、RAG、Function Calling等核心概念解析

基本信息

作者: 孟祥_成都
链接: https://juejin.cn/post/7613680097548189711

导语

面对层出不穷的 AI 新名词，许多人往往止步于背诵概念，却忽略了其背后的技术逻辑与演进脉络。本文将摒弃生硬的术语堆砌，从大模型底层的运行机制出发，深入剖析 Context、RAG、Function Calling 等核心技术的内在关联。通过梳理这些高频考点的前因后果，我们旨在帮助你构建起系统的认知框架，从而真正吃透原理，从容应对技术选型或面试中的深度提问。

描述

本文不堆砌概念，只讲前因后果：从大模型底层逻辑，到 Context、RAG、Function Calling、MCP、Skills 的核心关联，拆解所有面试高频考点，让你告别“名词解释”，吃透原理。

深度评价

1. 内容深度：从概念堆砌到架构逻辑的重构

文章的深度在于其并未停留于技术名词的表层科普，而是尝试构建一个AI Native（AI原生）的应用架构视图。将RAG（检索增强生成）、Function Calling（函数调用）和MCP（模型上下文协议）置于同一维度探讨，本质上是在解析AI智能体的“感知-决策-行动”闭环。

批判性视角：虽然架构框架清晰，但文章在技术细节上进行了必要的抽象。例如，将RAG概括为“外挂知识库”虽然便于理解，但也掩盖了工程落地的核心难点——检索粒度的匹配与语义对齐。如果文章未深入探讨“向量截断”或“重排序算法”，则其定位更偏向于“架构师概览”而非“工程师实操手册”。

2. 实用价值：连接理论认知与工程实践

对于技术从业者而言，文章的价值在于揭示了**“行话”背后的业务逻辑与工程考量**。例如，将Function Calling解析为模型将非结构化意图转化为结构化指令的能力，有助于开发者更精确地设计AI Agent的交互边界。

实际应用参考：在工程实践中，开发者往往容易陷入盲目追求大参数模型的误区，而忽视了Context Window（上下文窗口）的管理。如果文章能进一步阐述如何通过Prompt压缩或KV Cache优化来平衡性能与成本，其实用指导意义将得到显著增强。

3. 技术前瞻：概念整合与MCP的引入

引入**MCP（Model Context Protocol）**是文章的一个重要技术锚点。相较于目前主流的LangChain或Semantic Kernel等框架，MCP代表了去中心化的数据连接标准，提供了一个具有行业参考价值的较新视角。

概念辨析：文章提出的“Skills”概念较为宽泛。在业界语境下，Skills通常指代特定领域的微调模型或精细化的Prompt模板。若文章未将其与“Function Calling”或“Tool Use”做严格区分，可能会在概念界定上造成一定的模糊性。

4. 逻辑构建：因果链条的梳理与闭环

文章采用“底层逻辑-上层应用”的叙述方式，符合技术认知的递进规律。从底层的概率预测机制，到中层的上下文管理，再到上层的工具调用，构建了一条清晰的数据流向与控制链路。

工程复杂性：为了保持逻辑链条的顺畅，文章往往需要对工程现实进行简化。例如，RAG在实际应用中面临的“检索噪音”干扰模型逻辑的问题，属于非确定性工程难题，这并非简单的线性逻辑可以完全覆盖，更多是工程上的权衡与取舍。

5. 行业视角：推动“AI工程化”认知升级

此类内容有助于推动行业从单纯的“模型关注”转向“系统关注”。它揭示了一个明显的趋势：未来的技术壁垒将不再仅仅取决于模型参数的规模，而更多取决于如何通过工程化手段（如RAG、Agent编排）有效地引导和约束模型行为。 这种从“大力出奇迹”到“精准控制”的思维转变，对于当前AI应用的落地至关重要。

学习要点

根据文章标题及核心观点，为您总结的 5 个关键要点如下：
大多数人停留在“名词”层面，缺乏对 AI 背后原理和底层逻辑的深刻理解。
学习 AI 的核心在于不仅要懂“是什么”，更要弄懂“为什么”和“怎么做”。
警惕术语堆砌的虚假繁荣，真正的能力体现在能否利用 AI 解决具体问题。
拒绝盲目跟风，建立系统化的知识框架比追逐碎片化的新名词更重要。
消除认知偏差，从“懂名词”向“懂逻辑”转变是掌握 AI 技术的关键门槛。

常见问题

1: 机器学习、深度学习和人工智能之间有什么区别？

A: 这三个概念代表了不同的范畴，存在明确的层级关系。

人工智能是计算机科学的一个广泛分支，指任何让机器模拟人类智能的技术。机器学习是人工智能的子集，指利用数据通过算法训练模型，使机器能够从经验中学习，而非仅依赖显式编程。深度学习则是机器学习的一个专门分支，它利用多层人工神经网络来学习数据中的复杂模式。

从包含关系来看：人工智能 > 机器学习 > 深度学习。深度学习是目前处理复杂问题（如视觉和语言任务）的主流技术，但并非所有 AI 应用都必须使用深度学习。

2: LLM 和“生成式 AI”是一回事吗？

A: 两者相关，但定义的范畴不同。

生成式 AI 指的是一类能够基于训练数据生成新内容（如文本、图像、音频等）的人工智能技术。这与主要用于分类或预测的“判别式 AI”形成对比。

LLM (Large Language Model，大语言模型) 特指在海量文本数据上训练的、具有大规模参数的深度学习模型（如 GPT 系列）。LLM 是实现文本生成的主要技术手段，属于生成式 AI 在自然语言处理领域的具体应用，而生成式 AI 也包含图像生成等其他类型的模型。

3: 什么是 RAG？为什么大模型需要它？

A: RAG (Retrieval-Augmented Generation，检索增强生成) 是一种用于提升大模型回答准确性和时效性的技术方案。

由于大语言模型的知识仅限于训练数据截止前的信息，且可能产生事实性错误，RAG 通过以下流程工作：当用户提问时，系统先从外部知识库中检索相关信息，再将这些信息作为上下文提供给大模型，最后由模型生成答案。

简单理解，这相当于在模型生成答案前，先通过检索工具获取最新的参考材料，从而减少模型因记忆局限或信息过时而产生的错误。

4: 什么是“微调”？它和提示词有什么区别？

A: 这两者都是为了让模型适应特定任务，但作用机制和成本不同。

提示词 是在不修改模型参数的情况下，通过输入指令来引导模型的输出。这是一种通过自然语言进行的即时交互方式。

微调则是使用特定数据集对模型的内部参数进行重新训练。这需要消耗算力和数据，主要用于让模型掌握特定的领域知识、语言风格或输出格式。相比之下，微调改变了模型本身，而提示词只是改变了模型的输入。

5: 什么是 Transformer？为什么它被称为 AI 的基石？

A: Transformer 是一种深度学习的模型架构，由 Google 在 2017 年提出。

在 Transformer 出现之前，处理语言主要依赖循环神经网络（RNN），处理长文本的效率较低。Transformer 引入了“自注意力机制”，允许模型并行处理数据，并更有效地捕捉长文本中词与词之间的关联。

目前，大多数先进的大语言模型（如 GPT、BERT、Llama）均基于 Transformer 架构。它是现代自然语言处理技术的基础设施。

6: 什么是“Token”？为什么 AI 计费按 Token 算？

A: Token 是大语言模型处理文本的最小逻辑单位。

Token 不完全等同于人类的“字”或“词”。在英文中，一个单词可能被拆分为多个 Token；在中文里，一个汉字通常对应 1-2 个 Token。模型将文本转化为数字编码序列进行处理。

按 Token 计费是因为它直接对应模型的计算量和内存占用。一般来说，1000 个 Token 大约相当于 750 个英文单词，或 500-600 个汉字。理解 Token 有助于评估使用成本和模型的上下文窗口限制（即模型一次性能处理的最大文本量）。

7: 什么是“零样本”和“少样本”学习？

A: 这两个概念描述了模型在执行任务时所需示例数量的不同方式。

零样本 指模型在没有看到任何具体示例的情况下，仅凭任务描述就能完成工作（例如直接要求它“把这句话翻译成英文”）。

少样本 则是指在提问时给模型提供几个参考示例，让它模仿示例的模式来完成工作。这相当于通过“举一反三”的方式，帮助模型更快地理解任务意图和输出格式。

引用

掘金原文: https://juejin.cn/post/7613680097548189711

注：文中事实性信息以以上引用为准；观点与推断为 AI Stack 的分析。

站内链接

分类：大模型 / AI 工程
标签： LLM / RAG / Function Calling / Context / MCP / 大模型原理 / AI 术语 / 面试考点
场景：大语言模型 / RAG应用 / AI/ML项目

深度解析Skill/MCP/RAG等五大AI技术的底层逻辑
Agent Skills：智能体技能框架
AI智能体自主性评估的实践方法
LangChain 实现图片 OCR 与多模态 RAG 数据读取
Kirara-AI：支持多平台接入的多模态聊天机器人框架 本文由 AI Stack 自动生成，提供深度内容分析。

AI Stack

大模型原理与Context、RAG、Function Calling等核心概念解析