# Foundation Model Sherpas: Guiding Foundation Models through Knowledge and Reasoning

<figure><img src="https://1203660092-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FVIbHxVNUonwDG5X6HrVv%2Fuploads%2FIZHwAnkUB8IZpZ6Kl2KD%2Fimage.png?alt=media&#x26;token=355d1302-4e76-4f2b-9a1f-ec18856855d2" alt=""><figcaption></figcaption></figure>

## 研究背景

本研究探讨了基础模型（Foundation Models，FMs），尤其是大型语言模型（Large Language Models，LLMs），在人工智能（AI）领域的重要性。尽管LLMs在多种任务中展现出卓越的性能，但它们存在许多限制，这些限制阻碍了它们在现实世界系统中的广泛应用。这些限制包括缺乏可追溯性、可解释性、形式化推理能力、轻松整合领域知识的能力以及对新环境的泛化能力。为了解决这些问题，研究者提出了一种概念性框架，通过知识增强和推理来指导FMs完成特定任务。

## 过去方案和缺点

以往的研究尝试通过各种方法来确保FMs与用户偏好的一致性，例如通过人类反馈的强化学习（RLHF）来学习奖励模型。然而，这些方法面临着多重挑战，如用户多样化的目标和偏好、预训练数据集可能过时或存在偏见和隐私问题、以及系统对数据分布变化和外部因素（如法规变化）的鲁棒性需求。此外，LLMs本质上是令牌生成器，仅通过提示工程或简单的人类反馈更新FMs，不太可能实现长期的性能和建立信任。

<figure><img src="https://1203660092-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FVIbHxVNUonwDG5X6HrVv%2Fuploads%2Ftz9MoOUXsBonFYj9cdsw%2Fimage.png?alt=media&#x26;token=8785cdd0-307a-40c6-97e0-0199c483811c" alt=""><figcaption></figcaption></figure>

## 本文方案和步骤

本文提出了一个概念性框架，称为“Sherpas框架”，它定义了与FMs交互的代理（agents）的角色。这些代理的角色包括更新FM、协助提示FM以及评估FM输出。框架详细阐述了代理角色类别，并根据代理与FMs交互的性质和程度对多种最新方法进行了分类。

<figure><img src="https://1203660092-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FVIbHxVNUonwDG5X6HrVv%2Fuploads%2F0ONKqIHeGFXKgE7CcfY0%2Fimage.png?alt=media&#x26;token=d41e66d3-6d5a-4231-9883-d4c0fd090e35" alt=""><figcaption></figcaption></figure>

## 本文创新点与贡献

本文的主要创新点在于强调了代理在与FMs交互以追求用户指定任务时所扮演的角色。通过定义代理的动机目标，框架有助于指导未来的研究方向，以进一步实现FMs在实际AI系统中的潜力。此外，本文还提出了一个愿景，即未来的指导代理将真正成为自主代理，展现出主动性、反应性、互动性和协作性等关键行为。

## 本文实验

本文没有提供具体的实验细节，因为它是一个综述性论文，主要关注于概念性框架的提出和现有方法的分类。

## 实验结论

由于本文是一篇综述，它没有直接的实验结论。然而，它提供了对现有方法的深入分析，并指出了未来研究的方向。

## 全文结论

本文通过提出Sherpas框架，为如何指导FMs以实现更广泛的应用提供了新的视角。框架强调了代理的角色和行为，以及它们在与FMs交互时的重要性。这为未来在实际AI系统中实现FMs的潜力提供了指导。

## 阅读总结报告

本研究通过综述现有文献，提出了一个概念性框架来指导基础模型，特别是大型语言模型。研究指出了LLMs在实际应用中的局限性，并提出了通过知识增强和推理来解决这些问题的方法。Sherpas框架定义了代理的不同角色，包括更新模型、协助提示和评估输出，这些角色对于实现用户指定任务至关重要。本文还提出了未来研究的方向，包括多目标优化、自动化评估器的更广泛角色、不确定性量化评估器、形式化推理编排、知识赋能的新模式以及人类在循环中的作用。尽管本文没有提供具体的实验结果，但它为理解和改进LLMs在现实世界中的应用提供了宝贵的见解。
