Gemini 2.5 Flash模型发布

小怪

Gemini 2.5 Flash已于4月17号发布。openkey已支持该模型调用。

Google 于 2025 年 4 月 17 日推出了 Gemini 2.5 Flash 模型，这是其最新的 AI 模型之一，旨在提供更高效的推理能力，同时保持出色的性能和成本效益。

Gemini 2.5 Flash 是 Google 的首个完全混合推理模型，允许开发者根据需要开启或关闭推理过程，并设置“思维预算”以优化质量、成本和响应延迟之间的平衡。即使在关闭推理的情况下，模型仍能保持与 Gemini 2.0 Flash 相当的速度，并在性能上有所提升。该模型支持音频、图像、视频和文本输入，输出为文本，适用于需要快速响应和推理能力的高负载任务。

其核心特点表现为：
1）输入类型：音频、图像、视频和文本
2）输出类型：文本
3）推理功能：支持“思维预算”设置，允许开发者控制推理过程的深度，以平衡质量、成本和延迟
4）性能优势：在处理复杂任务时，提供高效的推理能力，同时保持低延迟和高吞吐量
5）可用性：目前在 Google AI Studio 和 Vertex AI 中以预览版形式提供

Gemini 2.5 Flash 模型特别适用于以下场景：
高负载任务：如实时数据处理、大规模文本分析等
需要推理能力的应用：如代码生成、数学推理、数据分析等
多模态输入处理：如同时处理文本、图像和音频输入的应用
开发者和企业级应用：需要高效、可定制的 AI 模型