Claude又发新货:3.5 Sonnet和3.5 Haiku重磅登场 附Claude 3.5 API Key价格

号优优网uiuihao
预计阅读时长 13 分钟
位置: 首页 AI文本模型 正文

uiuiapi319x1512.gif

Anthropic公司近日宣布推出两款全新AI模型:升级版Claude 3.5 Sonnet和全新Claude 3.5 Haiku。这次更新不仅带来了性能的全面提升,更引入了突破性的计算机使用功能。

介绍升级版的 Claude 3.5 Sonnet,以及新型号 Claude 3.5 Haiku。我们还推出了一项新的测试功能:计算机使用。 开发人员现在可以指示 Claude 像人类一样使用计算机——通过查看屏幕、移动光标、点击和输入文本。

uiuiapicAAkHHL.png

上图UIUIHAO总结就是:

Sonnet 3.5 在 ChatLLM 上线,编码能力超越 O1-mini 和 O1-Preview。它在 Livebench AI 上得分最高,达 67.13 分。

O1-preview 仍是最佳整体模型,O1-mini 在某些复杂编码任务上表现更佳。

Claude 3.5 Sonnet:革命性突破

升级后的Claude 3.5 Sonnet在各方面都超越了前代版本,尤其是在编码领域取得了显著进展。在SWE-bench Verified测试中,其得分从33.4%跃升至49.0%,超越所有公开模型。在TAU-bench代理工具使用任务中也表现出色,零售和航空领域得分均大幅提升。

最引人注目的是Claude 3.5 Sonnet引入的计算机使用功能。通过Sonnet API,AI现在可以像人类一样操作计算机:查看屏幕、移动光标、点击按钮和输入文本。这一功能的工作原理包括四个主要步骤:

1. 明确工具和任务
2. Claude选择使用工具
3. 提取工具信息,运行工具并返回结果
4. 继续使用工具直到完成任务

在OSWorld基准测试中,Claude 3.5 Sonnet的表现远超其他AI系统,展示了其强大的计算机操作能力。

超越计算机使用,新版 Claude 3.5 Sonnet 在编码方面带来了显著的提升——这是它已经领先的领域。 Sonnet 在 SWE-bench Verified 上的得分高于所有可用模型,包括像 OpenAI o1-preview 这样的推理模型和专门的代理系统。

uiuiapi011moL.png

Claude 3.5 Sonnet的定价如下:
- 正常使用:输入$3/100万token,输出$15/100万token
- 命中缓存:输入$3.75/100万token,输出$0.30/100万token

Claude 3.5 Sonnet已正式上线于网页和App,并支持通过Anthropic API、Amazon Bedrock和Google Cloud进行调用。

Haiku 现在在编码任务上超越了许多最先进的模型——包括原始的 Claude 3.5 Sonnet 和 GPT-4o——而成本与之前相同。 新的 Claude 3.5 Haiku 将于本月晚些时候发布。

uiuiapi10A7NeW.png

Claude 3.5 Haiku:性能与效率的完美平衡

Claude 3.5 Haiku是Anthropic最快模型的下一代版本。在保持与前代相同成本和速度的同时,其性能达到了前代最强模型Claude 3 Opus的水平,甚至在多项测试中超越了GPT-4o-mini。

Claude 3.5 Haiku的定价如下:
- 正常使用:输入$0.25/100万token,输出$1.25/100万token
- 命中缓存:输入$0.3/100万token,输出$0.03/100万token

Claude 3.5 Haiku将于本月晚些时候推出,初期将以纯文本模型形式提供,后续将支持图像输入。


下面这是一段Claude 3.5 Sonnet API示例调用:

Python 流式

from openai import OpenAI
# 设置API密钥
api_key = "sk-HTdmSI6B2cNt***********************************
# 设置 BASE_URL接口地址/开发者快速获取Claude3.5 APIKey参考 uiuiapi.com
api_base = "https://sg.uiuiapi.com/v1"
client = OpenAI(api_key=api_key, base_url=api_base)

completion = client.chat.completions.create(
  model="claude-3.5-sonne",
  stream: True,
  messages=[
    {"role": "system", "content": "You are a helpful assistant."},
    {"role": "user", "content": "Hello!"}
  ]
)

for chunk in completion:
  print(chunk.choices[0].delta)

Python 非流

from openai import OpenAI

api_key = "sk-HTdmSI6B2cNt************************************"
# 设置 BASE_URL接口地址/开发者快速获取Claude3.5 APIKey参考 uiuiapi.com
api_base = "https://sg.uiuiapi.com/v1"
client = OpenAI(api_key=api_key, base_url=api_base)

completion = client.chat.completions.create(
  model="claude-3.5-sonne",
  stream: False,
  messages=[
    {"role": "system", "content": "You are a helpful assistant."},
    {"role": "user", "content": "Hello!"}
  ]
)

print(completion.choices[0].message)


Anthropic强调,虽然计算机使用功能仍处于实验阶段,但公司正积极采取措施确保其安全部署。他们鼓励开发者从低风险任务开始探索,并开发了新的分类器来识别潜在的危害行为。

多家知名公司如Asana、Canva、Cognition、DoorDash、Replit和The Browser Company已开始探索这些新功能的潜力,将其应用于复杂的多步骤任务中。

总的来说,这次更新标志着AI技术的重大进步,尤其是在编码和计算机操作方面。随着这些新功能的不断完善,我们可以期待AI在更多领域发挥越来越重要的作用,为人类工作和生活带来革命性的变革。


声明:本文内容及配图来自互利网收集整理撰写或者入驻合作网站授权转载。文章及其配图仅供学习之用,如有内容图片侵权或者其他问题,请联系本站侵删。
-- 展开阅读全文 --
头像
UIUIAPI聚合平台API通用代码教程
« 上一篇 09-26
2024 年 ChatGPT Plus:升级是否值得以及GPT Plus国内如何支付
下一篇 » 10-29

相关文章

取消
微信二维码
微信二维码
支付宝二维码

发表评论

暂无评论,745人围观

作者信息

似水流年

今日已经过去小时
这周已经过去
本月已经过去
今年已经过去个月

热门文章

系统获取,无需修改

标签列表

目录[+]