|
好意思东时候 3 月 3 日周二,谷歌推出 Gemini 3 系列中速率最快、性价比最高的模子—— Gemini 3.1 Flash-Lite。它专为树立者大范畴高频责任负载贪图,以更廉价钱竣事欠协调的智能推崇。 Gemini 3.1 Flash-Lite 于 3 日本日起以预览版神色向树立者绽开,可通过谷歌 AI Studio 的 Gemini API 接入,企业用户则可经由谷歌云 Vertex AI 平台使用。使用该模子无需特定硬件或软件配置,用户只需通过 API 调用即可接入。 谷歌高慢,凭证 Artificial Analysis 基准测试,3.1 Flash-Lite 在首个谜底反适时候上较 Gemini 2.5 Flash 提高 2.5 倍,输出速率扶植 45%,同期督察左近或更优的质地水准。 谷歌示意,该模子在 Arena.ai 排名榜上赢得 1432 的 Elo 评分,并在多项推理与多模态流露基准测试中高出同级别其他模子,致使优于上一代体量更大的 Gemini 模子。当今已有 Latitude、Cartwheel、Whering 等企业在早期测试中使用该模子,并反馈出显耀的后果与资本上风。 定位与价钱:高频场景下的性价比首选 谷歌 DeepMind 在模子讲明文献中将 3.1 Flash-Lite 定位为"具备资本效益、速率快,针对高频、对蔓延明锐的任务(如翻译和施行分类)进行优化"的模子,是 Gemini 3 系列原生多模态推理模子家眷的新成员。 在价钱方面,3.1 Flash-Lite 订价为每百万输入 token 0.25 好意思元、每百万输出 token 1.50 好意思元。谷歌在官方博客中指出,该订价仅为大型模子的一小部分,相宜需要大范畴部署、同期对资本高度明锐的树立者和企业用户。
该模子援救文本、图像、音频与视频等多模态输入,坎坷文窗口最长达 100 万 token,输出上限为 6.4 万 token,可中意从文献概要到复杂多模态任务的鄙俚需求。 性能基准:高出同级并挑战上一代旗舰 在中枢地能处所上,谷歌征引 Artificial Analysis 基准测试数据称,3.1 Flash-Lite 的首个谜底反适时候(Time to First Answer Token)比 Gemini 2.5 Flash 快 2.5 倍,输出速率扶植 45%。 {jz:field.toptypename/}在智能才气评估方面,该模子在 Arena.ai 排名榜上赢得 1432 的 Elo 评分,在 GPQA Diamond 测试中得分 86.9%,易游娱乐在 MMMU Pro 测试中得分 76.8%,谷歌示意这两项收货均高出同级别竞争模子。 值得隆重的是,谷歌突出强调 3.1 Flash-Lite 在部分基准测试中致使高出了上一代体量更大的 Gemini 2.5 Flash,这意味着在特定责任负载下,用户无需支付旗舰模子的价钱即可赢得更优性能。
中枢特点:可疗养的"想考层级" 除速率与资本外,3.1 Flash-Lite 的一项互异化功能是在 AI Studio 和 Vertex AI 中内置"想考层级"(thinking levels)截止,允许树立者凭证任务复杂进程纯真调整模子的推理深度。 谷歌在官方博客中写说念,这一功能"关于责罚高频责任负载至关进攻"。关于翻译、施行审核等以资本为优先的批量任务,树立者可采选较低想考层级以压缩资本;关于生成用户界面、创建模拟场景或投诚复杂提示等需要深度推理的任务,则可调高想考层级以扶植输出质地。 在架构层面,谷歌 DeepMind 败露,3.1 Flash-Lite 基于 Gemini 3 Pro 构建,熟练使用谷歌自研的张量处理单位(TPU)及 JAX 与 ML Pathways 软件框架完成。 企业反馈:后果与提示投诚才气获高度认同 多家早期测试企业对 3.1 Flash-Lite 给出了正面评价,尤其聚首于速率、提示投诚才气和范畴化处理才气三个维度。 AI 叙事平台 Latitude 的 AI 肃肃东说念主 Kolby Nottingham 示意:"谷歌的模子在同类产物中展现出无与伦比的提示投诚才气和速率,告捷率比咱们之前使用的模子逾越 20%,推理速率快 60%,使 Latitude 大概为更鄙俚的受众提供复杂的叙事体验。" AI 动画器具 Cartwheel 首席科学家 Andrew Carr 则称该模子为"智能与速率比无可匹敌",并指出:" 它在器具调用方面推崇出色,大概在更大模子所需时候的一小部老实快速探索代码库。咱们领有宽敞多模态标注使用场景,在大范畴哄骗中,Flash-Lite 成为咱们处理更多数据、获取更多洞悉的要害解锁器具。" 前锋哄骗 Whering 的 CEO Bianca Rangecroft 示意,通过将 3.1 Flash-Lite 整合进分类经过,Whering 在商品标签标注上竣事了 "100% 的一致性 ",即使靠近复杂的前锋品类,也能提供 " 细则、可肖似的收尾 "。 企业 AI 平台 HubX 援助创举东说念主 Kaan Ortabas 则提供了具体数据:"看成根编排与施行引擎,Gemini 3.1 Flash-Lite 捏续竣事 10 秒以内的完成时候、接近及时的流式输出、约 97% 的结构化输出合规率以及 94% 的意图路由准确率,在速率、提示精确度和资本效益之间取得了超卓均衡。" |
热点资讯
- 易游app 谷歌推出最快最高性价比Gemini 3模子,反适时候提高2.
- EasyGame Manus肖弘:生机主义的填缝东说念主
- 易游娱乐 唐朝行为我国封建期间的新生技能,其时的一线城市是哪几座?
- 易游官网 百度贴吧游圣听说:假造王朝的十年江湖
- EasyGame 电网拓荒、核聚变与量子科技, 这4家公司翌日或将翻倍!
你的位置: 易游官方网站APP下载 > 番摊 >
易游app 谷歌推出最快最高性价比Gemini 3模子,反适时候提高2.5倍、输出速率扶植45%
发布日期:2026-03-09 11:01 点击次数:77




备案号: