Paper: Toolformer: Language Models Can Teach Themselves to Use Tools

Apr 22, 2026

一句话概括

Toolformer让语言模型通过自监督方式学会在文本中插入API调用，自主决定何时以及如何使用计算器、搜索引擎等外部工具。

核心思想

通过自监督学习让LLM学会在生成文本中适当位置插入工具调用。首先让模型对大量文本标注潜在的工具调用位置，然后执行这些调用获取结果，只保留那些确实降低了后续文本损失的工具调用作为训练样本，最终微调模型学会自主使用工具。

关键创新

自监督数据生成方法无需人工标注工具调用；以损失降低为标准筛选有效的工具调用；模型自主学会何时调用工具以及如何解析结果；支持多种工具类型（搜索、计算、翻译等）。

深远影响

Toolformer开创了LLM自主使用工具的研究方向，证明语言模型可以学会将自身能力与外部工具结合。这一思想深刻影响了后续的Agent系统和函数调用（Function Calling）功能的设计。

启发与思考

Toolformer揭示了LLM的一个重要潜力：它们不仅是知识的载体，还可以成为工具的调度者。在RAG语境下，检索本身就是一种工具，让模型学会何时检索比始终检索更加智能。