Google发布 Gemini 3.1 Flash-Lite：极速响应、超低成本，开启高性价比 AI 新时代

Google 近日正式推出 Gemini 3 系列的新成员 —— Gemini 3.1 Flash-Lite。作为该系列中主打“极速 + 低成本”的轻量化模型，它的发布被视为谷歌在高性价比 AI 赛道上的一次关键加速，目标直指实时交互与规模化部署场景。

更快：为实时应用而生

在性能层面，Gemini 3.1 Flash-Lite 的提升可谓跨越式升级。根据权威评测数据，相较于前代 2.5 Flash：

这种显著的低延迟优化，使其在对话机器人、在线客服、实时数据分析等需要“秒级反馈”的场景中表现尤为突出。对于追求流畅交互体验的开发者而言，这意味着更自然的对话节奏与更高的系统吞吐能力。

除了速度优势，Gemini 3.1 Flash-Lite 在成本控制上同样亮眼。其输入定价低至：

💰 0.25 美元 / 百万 Token

这一价格策略大幅降低了大规模 AI 部署门槛，尤其适合高并发应用、长对话场景以及企业级数据处理需求。

值得注意的是，在多模态理解与逻辑推理等核心能力测试中，该模型不仅领先同级别轻量模型，部分指标甚至超过体量更大的前代版本，实现了“以小搏大”的性能突破。

在功能层面，谷歌为该模型引入了“思考层级”调节能力，并已在 Google AI Studio 与 Vertex AI 平台同步上线。

开发者可根据具体业务需求灵活选择推理深度：

这种“可控思考”的机制，使模型在效率与推理能力之间实现动态平衡，进一步拓宽了应用边界。

目前，Gemini 3.1 Flash-Lite 已通过 API 向预览版用户及企业客户开放。随着低延迟与高性价比能力的结合，这款模型有望成为构建下一代实时 AI 应用的重要基础设施。