易游app 谷歌推出最快最高性价比Gemini 3模子，反适时候提高2.5倍、输出速率扶植45%

热点资讯

推荐资讯

易游app 谷歌推出最快最高性价比Gemini 3模子，反适时候提高2.5倍、输出速率扶植45%

发布日期：2026-03-09 11:01 点击次数：80

易游app 谷歌推出最快最高性价比Gemini 3模子，反适时候提高2.5倍、输出速率扶植45%

好意思东时候 3 月 3 日周二，谷歌推出 Gemini 3 系列中速率最快、性价比最高的模子—— Gemini 3.1 Flash-Lite。它专为树立者大范畴高频责任负载贪图，以更廉价钱竣事欠协调的智能推崇。

Gemini 3.1 Flash-Lite 于 3 日本日起以预览版神色向树立者绽开，可通过谷歌 AI Studio 的 Gemini API 接入，企业用户则可经由谷歌云 Vertex AI 平台使用。使用该模子无需特定硬件或软件配置，用户只需通过 API 调用即可接入。

谷歌高慢，凭证 Artificial Analysis 基准测试，3.1 Flash-Lite 在首个谜底反适时候上较 Gemini 2.5 Flash 提高 2.5 倍，输出速率扶植 45%，同期督察左近或更优的质地水准。

谷歌示意，该模子在 Arena.ai 排名榜上赢得 1432 的 Elo 评分，并在多项推理与多模态流露基准测试中高出同级别其他模子，致使优于上一代体量更大的 Gemini 模子。当今已有 Latitude、Cartwheel、Whering 等企业在早期测试中使用该模子，并反馈出显耀的后果与资本上风。

定位与价钱：高频场景下的性价比首选

谷歌 DeepMind 在模子讲明文献中将 3.1 Flash-Lite 定位为"具备资本效益、速率快，针对高频、对蔓延明锐的任务（如翻译和施行分类）进行优化"的模子，是 Gemini 3 系列原生多模态推理模子家眷的新成员。

在价钱方面，3.1 Flash-Lite 订价为每百万输入 token 0.25 好意思元、每百万输出 token 1.50 好意思元。谷歌在官方博客中指出，该订价仅为大型模子的一小部分，相宜需要大范畴部署、同期对资本高度明锐的树立者和企业用户。

该模子援救文本、图像、音频与视频等多模态输入，坎坷文窗口最长达 100 万 token，输出上限为 6.4 万 token，可中意从文献概要到复杂多模态任务的鄙俚需求。

性能基准：高出同级并挑战上一代旗舰

在中枢地能处所上，谷歌征引 Artificial Analysis 基准测试数据称，3.1 Flash-Lite 的首个谜底反适时候（Time to First Answer Token）比 Gemini 2.5 Flash 快 2.5 倍，输出速率扶植 45%。

{jz:field.toptypename/}

在智能才气评估方面，该模子在 Arena.ai 排名榜上赢得 1432 的 Elo 评分，在 GPQA Diamond 测试中得分 86.9%，易游娱乐在 MMMU Pro 测试中得分 76.8%，谷歌示意这两项收货均高出同级别竞争模子。

值得隆重的是，谷歌突出强调 3.1 Flash-Lite 在部分基准测试中致使高出了上一代体量更大的 Gemini 2.5 Flash，这意味着在特定责任负载下，用户无需支付旗舰模子的价钱即可赢得更优性能。

中枢特点：可疗养的"想考层级"

除速率与资本外，3.1 Flash-Lite 的一项互异化功能是在 AI Studio 和 Vertex AI 中内置"想考层级"（thinking levels）截止，允许树立者凭证任务复杂进程纯真调整模子的推理深度。

谷歌在官方博客中写说念，这一功能"关于责罚高频责任负载至关进攻"。关于翻译、施行审核等以资本为优先的批量任务，树立者可采选较低想考层级以压缩资本；关于生成用户界面、创建模拟场景或投诚复杂提示等需要深度推理的任务，则可调高想考层级以扶植输出质地。

在架构层面，谷歌 DeepMind 败露，3.1 Flash-Lite 基于 Gemini 3 Pro 构建，熟练使用谷歌自研的张量处理单位（TPU）及 JAX 与 ML Pathways 软件框架完成。

企业反馈：后果与提示投诚才气获高度认同

多家早期测试企业对 3.1 Flash-Lite 给出了正面评价，尤其聚首于速率、提示投诚才气和范畴化处理才气三个维度。

AI 叙事平台 Latitude 的 AI 肃肃东说念主 Kolby Nottingham 示意："谷歌的模子在同类产物中展现出无与伦比的提示投诚才气和速率，告捷率比咱们之前使用的模子逾越 20%，推理速率快 60%，使 Latitude 大概为更鄙俚的受众提供复杂的叙事体验。"

AI 动画器具 Cartwheel 首席科学家 Andrew Carr 则称该模子为"智能与速率比无可匹敌"，并指出：" 它在器具调用方面推崇出色，大概在更大模子所需时候的一小部老实快速探索代码库。咱们领有宽敞多模态标注使用场景，在大范畴哄骗中，Flash-Lite 成为咱们处理更多数据、获取更多洞悉的要害解锁器具。"

前锋哄骗 Whering 的 CEO Bianca Rangecroft 示意，通过将 3.1 Flash-Lite 整合进分类经过，Whering 在商品标签标注上竣事了 "100% 的一致性 "，即使靠近复杂的前锋品类，也能提供 " 细则、可肖似的收尾 "。

企业 AI 平台 HubX 援助创举东说念主 Kaan Ortabas 则提供了具体数据："看成根编排与施行引擎，Gemini 3.1 Flash-Lite 捏续竣事 10 秒以内的完成时候、接近及时的流式输出、约 97% 的结构化输出合规率以及 94% 的意图路由准确率，在速率、提示精确度和资本效益之间取得了超卓均衡。"