Google 发布新一代生产级 Gemini 模型:Gemini-1.5-Pro-002 与 Gemini-1.5-Flash-002

号优优网uiuihao
预计阅读时长 8 分钟
位置: 首页 AI文本模型 正文

geminiiginal.png

北京时间凌晨12点,谷歌发布了两个更新后的、可投入生产使用的Gemini模型:Gemini-1.5-Pro-002和Gemini-1.5-Flash-002,同时带来了以下改进:

  • 1.5 Pro的价格降低了50%(对于提示<128K的输入和输出)。

  • 1.5 Flash的速率限制提高了2倍,1.5 Pro提高了约3倍。

  • 输出速度提高了2倍,延迟降低了3倍。

  • 更新了默认过滤器设置。

这些新模型是在我们最新的实验模型基础上改进的,并包括了对在5月Google I/O大会上发布的Gemini 1.5模型的重大改进。开发者可以通过Google AI Studio和Gemini API免费访问我们的最新模型。对于大型组织和Google Cloud客户,这些模型也可以在Vertex AI上使用。

整体质量提升,尤其在数学、长上下文和视觉方面

Gemini 1.5系列模型旨在提供广泛文本、代码和多模态任务的通用性能。例如,Gemini模型可以用于从1000页的PDF中合成信息,回答包含超过1万行代码的仓库中的问题,处理长达一小时的视频并从中创建有用的内容等等。

通过最新的更新,1.5 Pro和Flash现在在生产中更好、更快且更具成本效益。我们在更具挑战性的MMLU-Pro基准测试中看到约7%的提升。在MATH和HiddenMath(一个内部保留的竞赛数学问题集)基准测试中,这两个模型都取得了约20%的显著改进。在视觉和代码应用场景中,这两个模型在评估视觉理解和Python代码生成方面也表现更好(提升约在2-7%之间)。

GYQTO6jakAI904m.jpg

我们还改进了模型响应的整体有用性,同时继续坚持我们的内容安全政策和标准。这意味着在许多主题上拒绝的次数减少,响应更有帮助。

更简洁的响应风格和成本降低

根据开发者的反馈,这两个模型现在的响应风格更加简洁,旨在使这些模型更易于使用并降低成本。对于摘要、问答和提取等用例,更新后模型的默认输出长度比以前的模型短约5-20%。对于用户可能更喜欢默认情况下响应较长的基于聊天的产品,可以阅读我们的提示策略指南,了解如何使模型响应更详细和对话性更强。

迁移到最新版本的详细信息

有关迁移到最新版本的Gemini 1.5 Pro和1.5 Flash的更多详细信息,请查看Gemini API模型页面。

Gemini 1.5 Pro

我们继续对Gemini 1.5 Pro的200万令牌长上下文窗口和多模态能力的创造性和有用的应用感到惊叹。从视频理解到处理1000页的PDF,还有许多新的用例等待开发。今天我们宣布对我们最强的1.5系列模型Gemini 1.5 Pro的输入令牌价格降低64%,输出令牌价格降低52%,增量缓存令牌价格降低64%,这些价格调整将于2024年10月1日生效,适用于提示少于128K令牌的情况。结合上下文缓存,这继续推动使用Gemini的成本下降。

GYQS-3TakAQpfrW.jpg

提高速率限制

为了使开发者更容易使用Gemini构建应用程序,我们将1.5 Flash的付费层速率限制提高到2000 RPM,将1.5 Pro提高到1000 RPM,分别从之前的1000和360提升。在接下来的几周内,我们预计将继续提高Gemini API的速率限制,以便开发者可以使用Gemini构建更多应用。

输出速度提高和延迟降低

随着我们最新模型的核心改进,过去几周我们降低了1.5 Flash的延迟,并显著提高了每秒输出令牌数,使我们的最强模型能够支持新的用例。

更新过滤器设置

自2023年12月首次推出Gemini以来,构建一个安全可靠的模型一直是我们的重点。通过最新版本的Gemini(-002模型),我们改进了模型遵循用户指令的能力,同时保持安全性。我们将继续提供一套安全过滤器,供开发者应用于Google的模型。对于今天发布的模型,过滤器将不会默认应用,以便开发者可以确定最适合其用例的配置。

Gemini 1.5 Flash-8B实验更新

我们发布了一个改进版的Gemini 1.5模型,名为“Gemini-1.5-Flash-8B-Exp-0924”。这个改进版在文本和多模态用例方面都有显著性能提升。现在可以通过Google AI Studio和Gemini API使用。

开发者对1.5 Flash-8B的积极反馈令人难以置信,我们将继续根据开发者反馈来调整我们的实验到生产发布流程。

我们对这些更新感到非常兴奋,迫不及待地想看到你们用新的Gemini模型构建什么!对于Gemini Advanced用户,你们很快就能访问一个优化聊天的Gemini 1.5 Pro-002版本。

原文翻译地址:https://developers.googleblog.com/en/updated-production-ready-gemini-models-reduced-15-pro-pricing-increased-rate-limits-and-more/?_gl=1*pizr54*_up*MQ..*_ga*ODM0MzEyMDE0LjE3MjcxOTU1MDY.*_ga_H733Y2BZES*MTcyNzE5NTUwNi4xLjEuMTcyNzE5NTUxMy4wLjAuMA..

声明:本文内容及配图来自互利网收集整理撰写或者入驻合作网站授权转载。文章及其配图仅供学习之用,如有内容图片侵权或者其他问题,请联系本站侵删。
-- 展开阅读全文 --
头像
全面教程:如何获取 OpenAI o1-preview/o1-Mini API 密钥并调用 API
« 上一篇 09-24
热讯:Google Gemini 模型更新后,OpenAI o1 API 迅速跟进可用性更新
下一篇 » 09-25

相关文章

取消
微信二维码
微信二维码
支付宝二维码

发表评论

暂无评论,221人围观

作者信息

似水流年

今日已经过去小时
这周已经过去
本月已经过去
今年已经过去个月

热门文章

系统获取,无需修改

标签列表

目录[+]