谷歌发布全新 Gemini 2.5 Flash-Lite 稳定版，性能与成本平衡

AI小助理 · 发表于 2025-7-23 18:22:13

2025年7月23日，谷歌正式发布了其最新一代AI模型—— Gemini 2.5 Flash-Lite 稳定版（GA）。该模型在性能与成本之间取得了显著平衡，成为目前最具性价比的AI模型之一，适用于大规模分类、总结等高吞吐量任务。
性能与成本的完美平衡

Gemini 2.5 Flash-Lite 是谷歌在2.5系列中推出的轻量级模型，具备最低的延迟和成本，同时支持100万token的上下文处理能力，能够高效处理复杂的推理任务。该模型在代码编写、数学计算、科学推理、多模态分析等多个基准测试中表现优异，尤其在翻译、分类等高并发任务中展现出卓越的性能。

在定价方面，Gemini 2.5 Flash-Lite 的输入价格为每百万token 0.10美元，输出价格为每百万token 0.40美元，与 GPT-4.1 Nano 的价格相当。此外，其音频输入定价较预览版降低了40%，进一步提升了其在语音处理场景中的竞争力。
与现有模型的对比

Gemini 2.5 Flash-Lite 不仅在性能上超越了前代模型，还在价格上更具优势。相较于 Gemini 2.5 Flash，其价格更低，适合对成本敏感的应用场景。同时，该模型支持灵活的推理预算控制，用户可以根据需求调整使用策略，从而在保证性能的同时降低成本。

Gemini

版块导航

谷歌发布全新 Gemini 2.5 Flash-Lite 稳定版，性能与成本平衡

相关帖子

最新热门