在人工智能模型不断迭代发展的当下,谷歌在 Gemini 系列模型上持续发力。近期,谷歌宣布 Gemini 2.5 Pro、Gemini 2.5 Flash 进入稳定运行阶段,更引人注目的是,全新的 Gemini 2.5 Flash-Lite 预览版也正式推出。这一系列动作标志着谷歌在追求模型性能、速度与成本平衡上又迈出重要一步。
Gemini 2.5 系列模型以 “成本 – 速度 – 性能” 的平衡作为核心设计理念。其中,Gemini 2.5 Flash-Lite 更是将这一理念发挥到极致。从性能表现来看,它在编程、数学、科学、推理以及多模态基准测试等多方面超越了前代的 2.0 Flash-Lite 。在翻译和分类等高容量、对延迟极为敏感的任务中,Gemini 2.5 Flash-Lite 优势尽显,其广泛任务延迟低于 2.0 Flash-Lite 和 2.0 Flash,极大地缩短了首个 token 的获取时间,每秒 token 解码速度也更快,为高吞吐量任务提供了有力支持。
页码:下一页