Gemini API上下文缓存功能旨在降低包含重复内容且输入token数较高的请求的成本。该功能适用于聊天机器人、大型文件分析、代码库分析等场景,通过缓存大量初始上下文并重复引用,提高效率并降低成本。计费基于缓存token数、存储时长等因素。
PaliGemma 是一款轻量级开源视觉语言模型,它可以理解图像和文本,并回答有关图像的详细问题。PaliGemma 可以用于图像字幕、物体检测和阅读图像中的嵌入文本等任务。文章介绍了 PaliGemma 的两种模型:通用预训练模型和面向研究的微调模型。此外,文章还强调了 PaliGemma 的主要优势,包括多模态理解、多功能基础模型和开箱即用的探索能力。
模型浏览器是一款可视化工具,允许用户分析机器学习模型和图表,加速模型部署到设备上。该工具提供了多种功能,包括:分层导航、节点搜索、数据叠加、模型对比、书签功能等。用户可以在本地或Colab笔记本中运行模型浏览器。