摘要

基于检索增强生成知识密集型自然语言处理任务

本文提出了检索增强生成（RAG）模型，该模型结合了预训练的参数记忆和非参数记忆用于语言生成，并在多个知识密集型NLP任务上取得了最先进的结果。
你能获得：更factual、更specific、更多样化的语言生成能力，以及在开放域问答、抽象问答、问答生成和事实核查等任务上的卓越性能。

核心内容：

1. RAG模型结合了参数记忆和非参数记忆

详细解释：RAG模型利用预训练的seq2seq模型作为参数记忆，以及维基百科的密集向量索引作为非参数记忆，通过神经检索器进行访问。
举例：在开放域问答任务中，RAG模型能够检索维基百科中的相关文档，并结合预训练的BART模型生成答案。

2. RAG-Sequence和RAG-Token两种变体

详细解释：RAG-Sequence在生成整个序列时使用相同的检索段落，而RAG-Token允许每个token使用不同的段落。
详细解释：RAG-Sequence模型在生成答案时，会先检索出最相关的文档，然后基于该文档生成整个答案序列。这种方法适用于需要全局信息的任务。RAG-Token模型则更加灵活，它允许在生成答案的每个token时，都检索出最相关的文档。
举例：在Jeopardy问题生成任务中，RAG-Token能够更好地结合来自不同文档的信息生成问题。

3. RAG模型在多个知识密集型任务上表现出色

详细解释：RAG模型在开放域问答、抽象问答、Jeopardy问题生成和事实核查等任务上取得了最先进的结果。
举例：在开放域问答任务中，RAG模型在Natural Questions、WebQuestions和CuratedTrec数据集上都取得了state-of-the-art的结果，超过了之前的参数seq2seq模型和特定任务的检索-提取架构。
行动建议：可以尝试将RAG模型应用到其他知识密集型任务中，例如知识图谱补全、文本摘要等。

4. RAG模型生成更factual、更specific和更多样化的语言

详细解释：与传统的参数模型相比，RAG模型能够生成更符合事实、更具体和更多样化的文本。
举例：在MS-MARCO问答生成任务中，RAG模型生成的答案比BART模型更factual。
行动建议：在需要高质量生成文本的任务中，可以优先考虑使用RAG模型。

5. 非参数记忆可以被替换以更新模型知识

详细解释：RAG模型的一个重要优势是可以通过替换非参数记忆来更新模型的知识，而无需重新训练整个模型。
举例：通过将RAG模型使用的维基百科索引从2016年版本更新到2018年版本，模型能够正确回答关于世界领导人的问题。
行动建议：定期更新RAG模型的非参数记忆，以确保模型能够获取最新的知识。

问答

Q: RAG模型与传统的参数模型相比，有哪些优势？

A: RAG模型结合了参数记忆和非参数记忆，能够生成更符合事实、更具体和更多样化的文本，并且可以通过替换非参数记忆来更新模型的知识。

Q: RAG-Sequence和RAG-Token有什么区别？

A: RAG-Sequence在生成整个序列时使用相同的检索段落，而RAG-Token允许每个token使用不同的段落，RAG-Token更加灵活。

Q: 如何更新RAG模型的知识？

A: 可以通过替换RAG模型的非参数记忆来更新模型的知识，而无需重新训练整个模型。

思维导图

目标读者

本研究的目标读者是对自然语言处理、机器学习和知识图谱感兴趣的研究人员和工程师。此外，对开放域问答、语言生成和知识密集型任务感兴趣的读者也会从中受益。具备一定的深度学习和Transformer模型基础的读者可以更好地理解本文的内容。

作者背景

本研究由Facebook AI Research和University College London以及New York University的研究人员合作完成。作者们来自人工智能研究领域，专注于自然语言处理和机器学习。他们在各自的机构中从事研究工作，致力于推动语言模型和知识密集型任务的发展。

历史背景

在自然语言处理领域，大型预训练语言模型已经展示了其在参数中存储事实知识的能力，并在下游NLP任务上取得了最先进的结果。然而，它们访问和精确操作知识的能力仍然有限，因此在知识密集型任务上，它们的性能落后于特定于任务的架构。此外，为其决策提供来源和更新其世界知识仍然是开放的研究问题。因此，本研究探索了混合参数化和非参数化记忆的模型，以解决这些问题，并为知识密集型任务提供更有效的方法。

Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks

摘要