PaliGemma 2:强大的视觉语言模型,简单的微调

2024-12-06

谷歌推出了PaliGemma 2,这是Gemma系列中新一代可调视觉语言模型。它在Gemma 2模型的基础上增加了视觉能力,并简化了微调过程以获得最佳性能。PaliGemma 2具有可扩展的性能,提供多种模型尺寸和分辨率,可生成详细的图像描述,并扩展到化学公式识别、乐谱识别、空间推理和胸部X光报告生成等新领域。现有PaliGemma用户可以轻松升级,因为它设计为直接替代品。Hugging Face、Kaggle和官方文档提供了预训练模型、代码和示例笔记本。

阅读更多
未分类 Gemma

Keras 创建者 Francois Chollet 告别谷歌,开启职业生涯新篇章

2024-11-14

Keras 创建者 Francois Chollet 即将离开谷歌,开启新的职业旅程。Chollet 的离开令谷歌感到惋惜,但谷歌也为他在公司期间的贡献感到自豪,并对他的未来充满期待。Keras 已成为人工智能开发的基石,拥有超过 200 万用户,广泛应用于谷歌内部及全球各种应用。Chollet 将继续致力于 Keras 的未来发展,并监督其发展路线图,谷歌 Keras 团队也将继续与他合作。谷歌将继续投资 Keras 3,并通过 Keras Hub 等工具致力于推动 AI 工具的普及化。

阅读更多
未分类 Keras

Project Gameface登陆安卓系统

2024-05-15

在2023年谷歌I/O大会上,谷歌推出了开源的免手动游戏“鼠标”Project Gameface,允许用户通过头部运动和面部表情控制电脑光标。现在,谷歌将更多Project Gameface代码开源,帮助开发者构建安卓应用,使每个安卓设备更易于访问。用户可以通过设备摄像头无缝跟踪面部表情和头部运动,将其转化为直观、个性化的控制方式。

阅读更多
未分类