Gemini 2.5 Flash已于4月17号发布。openkey已支持该模型调用。

Google 于 2025 年 4 月 17 日推出了 Gemini 2.5 Flash 模型,这是其最新的 AI 模型之一,旨在提供更高效的推理能力,同时保持出色的性能和成本效益。
Gemini 2.5 Flash 是 Google 的首个完全混合推理模型,允许开发者根据需要开启或关闭推理过程,并设置“思维预算”以优化质量、成本和响应延迟之间的平衡。即使在关闭推理的情况下,模型仍能保持与 Gemini 2.0 Flash 相当的速度,并在性能上有所提升。该模型支持音频、图像、视频和文本输入,输出为文本,适用于需要快速响应和推理能力的高负载任务。
其核心特点表现为:
1)输入类型:音频、图像、视频和文本
2)输出类型:文本
3)推理功能:支持“思维预算”设置,允许开发者控制推理过程的深度,以平衡质量、成本和延迟
4)性能优势:在处理复杂任务时,提供高效的推理能力,同时保持低延迟和高吞吐量
5)可用性:目前在 Google AI Studio 和 Vertex AI 中以预览版形式提供
Gemini 2.5 Flash 模型特别适用于以下场景:
高负载任务:如实时数据处理、大规模文本分析等
需要推理能力的应用:如代码生成、数学推理、数据分析等
多模态输入处理:如同时处理文本、图像和音频输入的应用
开发者和企业级应用:需要高效、可定制的 AI 模型