Gemini Flash是谷歌DeepMind最新推出的轻量级AI模型,主打速度和效率。它拥有高达一百万个token的上下文窗口,能够处理一小时的视频、11小时的音频以及超过3万行代码。Flash在大多数常见任务上,能以更低的成本实现与大型模型相当的质量,并且平均首个token延迟低于一秒。