关于提示工程、RAGs 与微调对比

提示工程、RAGs 与微调的对比：这是每位搭建基于大语言模型（LLM）应用的 AI 工程师都面临的关键选择。要理解这个决策的指导原则，我们首先得明白这些术语的含义。

提示工程：所谓提示，指的是你输入的文本，大语言模型就根据这个输入来生成回应。这实际上是一种精确的输入方法，旨在引导模型产生相应的输出。模型的输出将基于其已有的知识。

RAGs（检索增强生成）：当你将提示工程与数据库查询结合，以获得含丰富上下文的答案时，这就是所谓的 RAG。生成的输出将基于数据库中现有的知识。

微调：微调是指使用特定任务的数据调整大语言模型的参数，使其在某一领域内专业化。比如，一个语言模型可以在医学文献上进行微调，从而更擅长回答健康护理相关的问题。这就好比对一位已经技艺娴熟的工人进行额外培训，让他们在特定领域成为专家。那么，我们如何决定采取哪种方法呢？（阅读下文时请参考下面的图片）

有两个关键的指导参数，一个是对外部知识的需求，另一个是模型适应性的需求。

尽管前者的含义较为明确，模型适应性则意味着改变模型的行为、词汇、写作风格等。例如，一个预训练的大语言模型可能在总结公司会议记录时遇到挑战，因为会议中可能穿插了一些特定的内部术语。

因此，微调更多的是关于改变结构（行为）而非知识，而对于 RAGs 则正好相反。

当你需要生成基于定制知识库的输出，同时保持大语言模型的词汇和写作风格不变时，你可以选择使用 RAGs。

如果你不需要上述任一功能，那么提示工程就是你的选择。

如果你的应用既需要定制知识又需要改变模型的行为，那么采用混合方案（RAGs + 微调）将是更佳选择。

One thought on “关于提示工程、RAGs 与微调对比”