谷歌发布全新 Gemini 2.5 Flash-Lite 稳定版,性能与成本平衡
2025年7月23日,谷歌正式发布了其最新一代AI模型—— Gemini 2.5 Flash-Lite 稳定版(GA)。该模型在性能与成本之间取得了显著平衡,成为目前最具性价比的AI模型之一,适用于大规模分类、总结等高吞吐量任务。
性能与成本的完美平衡
Gemini 2.5 Flash-Lite 是谷歌在2.5系列中推出的轻量级模型,具备最低的延迟和成本,同时支持100万token的上下文处理能力,能够高效处理复杂的推理任务。该模型在代码编写、数学计算、科学推理、多模态分析等多个基准测试中表现优异,尤其在翻译、分类等高并发任务中展现出卓越的性能。
在定价方面,Gemini 2.5 Flash-Lite 的输入价格为每百万token 0.10美元,输出价格为每百万token 0.40美元,与 GPT-4.1 Nano 的价格相当。此外,其音频输入定价较预览版降低了40%,进一步提升了其在语音处理场景中的竞争力。
与现有模型的对比
Gemini 2.5 Flash-Lite 不仅在性能上超越了前代模型,还在价格上更具优势。相较于 Gemini 2.5 Flash,其价格更低,适合对成本敏感的应用场景。同时,该模型支持灵活的推理预算控制,用户可以根据需求调整使用策略,从而在保证性能的同时降低成本。