OpenAI 的一种自动缓存机制,用于存储 API 请求中重复的提示内容(例如系统提示和通用指令),从而加速后续请求并降低成本。
缓存的前缀通常在 5 到 10 分钟的空闲时间后失效,但在非高峰时段可能会持续长达一小时。
缓存不会在不同组织之间共享,仅同一组织成员可以访问相同的缓存。
缓存不会影响输出 token 生成或 API 的最终响应。