OpenAI API 模型蒸馏功能要点总结

什么是模型蒸馏?

利用大型先进模型(如 o1-preview 和 GPT-4o)的输出结果,对更经济高效的模型(如 GPT-4o mini)进行微调,使其在特定任务上达到与高级模型相近的性能。

o1-preview
GPT-4o mini

OpenAI 提供的模型蒸馏套件

如何使用模型蒸馏

  1. 创建评估,衡量目标模型(如 GPT-4o mini)的性能。
  2. 使用存储完成功能,利用 GPT-4o 等高级模型的输出创建蒸馏数据集。
  3. 使用创建的数据集微调 GPT-4o mini 等目标模型。
  4. 使用评估功能测试微调后的模型性能,并根据结果迭代调整数据集、训练参数等。

可用性和定价

  • 模型蒸馏功能现已向所有开发者开放,可以用于蒸馏任何 OpenAI 模型。
  • GPT-4o mini 和 GPT-4o 提供每日免费训练代币。
  • 超过免费额度后,训练和运行蒸馏模型的费用与标准微调价格相同。
  • 存储完成功能免费使用。
  • 评估功能处于 Beta 阶段,根据使用的代币收取标准模型价格,并提供每周免费评估次数。

了解更多信息

请查阅 OpenAI 的模型蒸馏文档获取更多信息。

官方文档