Gemini API上下文缓存功能旨在降低包含重复内容且输入token数较高的请求的成本。该功能适用于聊天机器人、大型文件分析、代码库分析等场景,通过缓存大量初始上下文并重复引用,提高效率并降低成本。计费基于缓存token数、存储时长等因素。