Google 发布新一代生产级 Gemini 模型:Gemini-1.5-Pro-002 与 Gemini-1.5-Flash-002
北京时间凌晨12点,谷歌发布了两个更新后的、可投入生产使用的Gemini模型:Gemini-1.5-Pro-002和Gemini-1.5-Flash-002,同时带来了以下改进:
1.5 Pro的价格降低了50%(对于提示<128K的输入和输出)。
1.5 Flash的速率限制提高了2倍,1.5 Pro提高了约3倍。
输出速度提高了2倍,延迟降低了3倍。
更新了默认过滤器设置。
这些新模型是在我们最新的实验模型基础上改进的,并包括了对在5月Google I/O大会上发布的Gemini 1.5模型的重大改进。开发者可以通过Google AI Studio和Gemini API免费访问我们的最新模型。对于大型组织和Google Cloud客户,这些模型也可以在Vertex AI上使用。
整体质量提升,尤其在数学、长上下文和视觉方面
Gemini 1.5系列模型旨在提供广泛文本、代码和多模态任务的通用性能。例如,Gemini模型可以用于从1000页的PDF中合成信息,回答包含超过1万行代码的仓库中的问题,处理长达一小时的视频并从中创建有用的内容等等。
通过最新的更新,1.5 Pro和Flash现在在生产中更好、更快且更具成本效益。我们在更具挑战性的MMLU-Pro基准测试中看到约7%的提升。在MATH和HiddenMath(一个内部保留的竞赛数学问题集)基准测试中,这两个模型都取得了约20%的显著改进。在视觉和代码应用场景中,这两个模型在评估视觉理解和Python代码生成方面也表现更好(提升约在2-7%之间)。
我们还改进了模型响应的整体有用性,同时继续坚持我们的内容安全政策和标准。这意味着在许多主题上拒绝的次数减少,响应更有帮助。
更简洁的响应风格和成本降低
根据开发者的反馈,这两个模型现在的响应风格更加简洁,旨在使这些模型更易于使用并降低成本。对于摘要、问答和提取等用例,更新后模型的默认输出长度比以前的模型短约5-20%。对于用户可能更喜欢默认情况下响应较长的基于聊天的产品,可以阅读我们的提示策略指南,了解如何使模型响应更详细和对话性更强。
迁移到最新版本的详细信息
有关迁移到最新版本的Gemini 1.5 Pro和1.5 Flash的更多详细信息,请查看Gemini API模型页面。
Gemini 1.5 Pro
我们继续对Gemini 1.5 Pro的200万令牌长上下文窗口和多模态能力的创造性和有用的应用感到惊叹。从视频理解到处理1000页的PDF,还有许多新的用例等待开发。今天我们宣布对我们最强的1.5系列模型Gemini 1.5 Pro的输入令牌价格降低64%,输出令牌价格降低52%,增量缓存令牌价格降低64%,这些价格调整将于2024年10月1日生效,适用于提示少于128K令牌的情况。结合上下文缓存,这继续推动使用Gemini的成本下降。
提高速率限制
为了使开发者更容易使用Gemini构建应用程序,我们将1.5 Flash的付费层速率限制提高到2000 RPM,将1.5 Pro提高到1000 RPM,分别从之前的1000和360提升。在接下来的几周内,我们预计将继续提高Gemini API的速率限制,以便开发者可以使用Gemini构建更多应用。
输出速度提高和延迟降低
随着我们最新模型的核心改进,过去几周我们降低了1.5 Flash的延迟,并显著提高了每秒输出令牌数,使我们的最强模型能够支持新的用例。
更新过滤器设置
自2023年12月首次推出Gemini以来,构建一个安全可靠的模型一直是我们的重点。通过最新版本的Gemini(-002模型),我们改进了模型遵循用户指令的能力,同时保持安全性。我们将继续提供一套安全过滤器,供开发者应用于Google的模型。对于今天发布的模型,过滤器将不会默认应用,以便开发者可以确定最适合其用例的配置。
Gemini 1.5 Flash-8B实验更新
我们发布了一个改进版的Gemini 1.5模型,名为“Gemini-1.5-Flash-8B-Exp-0924”。这个改进版在文本和多模态用例方面都有显著性能提升。现在可以通过Google AI Studio和Gemini API使用。
开发者对1.5 Flash-8B的积极反馈令人难以置信,我们将继续根据开发者反馈来调整我们的实验到生产发布流程。
我们对这些更新感到非常兴奋,迫不及待地想看到你们用新的Gemini模型构建什么!对于Gemini Advanced用户,你们很快就能访问一个优化聊天的Gemini 1.5 Pro-002版本。
原文翻译地址:https://developers.googleblog.com/en/updated-production-ready-gemini-models-reduced-15-pro-pricing-increased-rate-limits-and-more/?_gl=1*pizr54*_up*MQ..*_ga*ODM0MzEyMDE0LjE3MjcxOTU1MDY.*_ga_H733Y2BZES*MTcyNzE5NTUwNi4xLjEuMTcyNzE5NTUxMy4wLjAuMA..
暂无评论,633人围观