Webtagr - 科技资讯摘要

Gemini API上下文缓存指南

2024-05-16

Gemini API上下文缓存功能旨在降低包含重复内容且输入token数较高的请求的成本。该功能适用于聊天机器人、大型文件分析、代码库分析等场景，通过缓存大量初始上下文并重复引用，提高效率并降低成本。计费基于缓存token数、存储时长等因素。

(ai.google.dev)

141

未分类 Gemini API 上下文缓存成本优化

PaliGemma：谷歌开发者平台上的轻量级视觉语言模型

2024-05-14

PaliGemma 是一款轻量级开源视觉语言模型，它可以理解图像和文本，并回答有关图像的详细问题。PaliGemma 可以用于图像字幕、物体检测和阅读图像中的嵌入文本等任务。文章介绍了 PaliGemma 的两种模型：通用预训练模型和面向研究的微调模型。此外，文章还强调了 PaliGemma 的主要优势，包括多模态理解、多功能基础模型和开箱即用的探索能力。

(ai.google.dev)

71

未分类视觉语言模型图像理解 PaliGemma

模型浏览器

2024-05-14

模型浏览器是一款可视化工具，允许用户分析机器学习模型和图表，加速模型部署到设备上。该工具提供了多种功能，包括：分层导航、节点搜索、数据叠加、模型对比、书签功能等。用户可以在本地或Colab笔记本中运行模型浏览器。

(ai.google.dev)

45

未分类