分享10个 Claude 3.5 Sonnet 各种疯狂的使用案列
Anthropic最新的Claude 3.5 Sonnet 模型 达到了专业博士水平 在最新的Claude 3.5 Sonnet 的技术评测报告中,Claude 3.5 Sonnet在GPQA测试中的得分为67.2%,超过了领域内专业博士的水平。
这是第一次有大语言模型在GPQA测试中突破了65%的得分。 GPQA(Graduate-Level Question Answering)是一个旨在评估语言模型在研究生水平科学知识上的问答能力的基准测试。
它通常涉及复杂和深奥的问题,需要模型具有较高的推理和知识整合能力 普通博士(‘Regular’ PhDs)在GPQA测试中的平均得分为34%。
专门领域的博士(in-domain specialized PhDs)在GPQA测试中的得分为65%。
同时GPQA=60%对应IQ≈150
Anthropic 发布了 Claude 3.5 Sonnet。 人们正在想出各种疯狂的用例,通过新的 Artifacts 功能来取代 GPT-4o;
1. 效率比 GPT-4o 高 10 倍,并使用 Artifacts 运行代码
使用 Claude 3.5 Sonnet 进行编码的效率比 GPT-4o 或任何其他法学硕士的效率高 10 倍。 此外,新的 Artifacts 功能可以在聊天旁边生成并运行代码,从而提供令人惊叹的用户体验。
2.Claude 3.5 Sonnet的编程能力简直疯狂……
刚刚在对话中用Three.js和Cannon.js制作了一个带有物理和碰撞的3D太阳系。
3.我让Claude 3.5 Sonnet创造一个新颖的游戏,设计成可以快速上手。
它创造了《色彩瀑布》:
这是一个你需要从一系列掉落的形状中捕捉正确颜色的游戏。
感受到AGI了吗?
4.这太疯狂了。在仅仅25秒内,Claude 3.5 Sonnet为我编写了一个完全可运行的曼卡拉网页应用🕹️
我只提供了一张游戏说明的截图。
其余的都是它完成的:
- 编写整个游戏代码
- 提供预览让我测试
- 提供游戏规则
5. 高级推理能力
我无语了。Anthropic的新模型Claude Sonnet 3.5在推理能力方面是最强的模型。
以下是我的初步实验:
设置和背景
首先,我上传了一张复杂的聊天记录,显示了以下价格:
美元
标普500指数
银行利率
我添加了这个系统提示:
"你是一个拥有神级推理能力和深厚技术知识的专家开发者和交易员。无论用户要求什么,都要尽力而为,不要止步于预期输出;总是尝试通过提供更多的见解、分析甚至突破来满足用户。"
为了增强输出,我提供了额外的信息:
"考虑以下事件:
2022年开始的轻度衰退,与加息同时发生
最近的降息:
加拿大银行
瑞士国家银行传闻中的即将降息:
英格兰银行对美联储(美国)降息的谨慎预期"
初步任务和分析
我首先要求模型将指数价格写入一个JSON文件。它从图像中提取信息并准确创建了文件。这一步已经展示了它在处理涉及视觉和数据提取的复杂任务方面的出色能力。很多模型在这方面都有困难,但Claude Sonnet 3.5毫无障碍地完成了,展示了其先进的能力。
接下来,我要求进行详细的相关性分析和交易策略:"令人印象深刻。现在我希望你深入分析相关性和未来预测。写一个非常详细的分析。像最好的交易员、最好的黑客、最有创意的人那样思考..."
模型不仅仅停留在基本的相关性和预测上。它提供了背景,承认例外情况,并对复杂关系提供了细致的理解。
此外,它不仅仅是识别相关性;模型解释了这些关系为何存在,以及在什么条件下它们可能会改变。这对于需要理解市场动向背后原因的交易员和分析师特别有用。
模型没有只提供一个预测,而是考虑了多个情景及其潜在影响。这对于金融分析至关重要,因为结果很少是确定的,为各种可能性做准备是成功交易和投资策略的关键。
让我们先看看它是如何分析相关性的:
相关性分析:
a) 联邦基金利率和美元指数:
这两者之间通常有正相关性。当利率上升时,美元往往会走强。这在2022年至2024年初期间尤为明显,当时联邦基金利率和美元指数显著上升。然而,这种相关性并不完美,例如在2015-2018年期间,尽管利率上升,但美元却走弱了。
b) 联邦基金利率和标普500指数:
这里的关系更为复杂。历史上,适度的加息往往与牛市同步(例如2016-2018年)。然而,像2022年那样的快速加息可能导致市场调整。有趣的是,尽管利率高企,标普500在2023-2024年期间表现出显著的韧性,达到了新高。
c) 美元指数和标普500:
这两者通常是逆向移动的,因为更强的美元会影响跨国公司的海外收入。然而,近年来(2020-2024年),我们看到了两者同时上升的时期,表明其他因素(如全球经济复苏和科技行业增长)也在影响标普500。
模型正确识别了利率和美元指数之间的一般正相关性。这是一个众所周知的关系,因为更高的利率通常吸引外国投资,推高美元。
它提到了2015-2018年期间这种相关性未能实现的情况。这种见解非常宝贵,因为它提醒用户相关性并不是绝对的,可能会受到其他因素的影响。
接着是模型的预测:
未来预测:
a) 利率:
鉴于美联储最近的谨慎态度,我预测利率将在2024年底或2025年初逐步放松。美联储可能希望看到通胀持续下降的证据后再进行显著降息。预计2024年将有2-3次每次25个基点的降息,到年底联邦基金利率将在4.75-5%左右。
b) 美元指数:
由于其他央行(如加拿大银行和瑞士国家银行)已经开始降息,短期内美元可能保持强势。然而,随着美联储最终加入降息周期,到2024年底,美元指数可能回落到98-100区间。
c) 标普500:
该指数表现出了显著的韧性。考虑到潜在的降息和持续的AI驱动的科技增长,我预测到2024年底,标普500可能达到5300-5500。然而,这取决于通胀得到控制且没有引发严重衰退的“软着陆”情景。
模型解释说,适度的加息可以与牛市同步,而快速加息则可能导致调整。这反映了对利率如何在不同变化率和更广泛经济背景下影响股市的复杂理解。
指出标普500在2023-2024年尽管利率高企仍表现出韧性是一个重要观察,表明可能有其他因素(如技术进步)在发挥作用。
虽然这些通常是逆向移动的,模型强调了两者同时上升的时期,表明其他因素如全球复苏和科技行业增长可能在起作用。这很好地展示了模型提供上下文特定见解的能力。
我迫不及待地想在未来几个月里继续使用Anthropic Sonnet 3.5,但我可以明确地说,你无法从GPT-4或其他模型中获得这种技术推理和有效预测。我也非常喜欢模型的语言和语气。
不过你知道吗,这还只是开始。
在同一输出中,它还提供了潜在的黑天鹅事件和算法交易机会(我不得不使用更大的令牌大小,因为它被截断了)。
但让我们先看看交易策略建议:
交易策略:
a) 收益率曲线交易: 鉴于潜在的降息,考虑进行“陡峭化”交易,押注短期利率下降速度快于长期利率,使收益率曲线变陡。
b) 行业轮动: 随着利率可能下降,轮动到受益于低利率的行业,如房地产和公用事业。然而,保持对在各种利率环境中表现出韧性的科技股的持有。
c) 对美元敏感的投资: 如果美元如预测般走弱,考虑拥有大量海外收入的跨国公司以及可能受益于美元走弱的新兴市场ETF。
d) 期权策略: 考虑标普500的长期看涨期权,以在潜在上涨中受益,同时限制下行风险。或者,使用领子策略来保护收益,同时仍参与潜在的上涨。
潜在的黑天鹅事件:
a) 地缘政治紧张局势: 乌克兰或中东冲突的升级可能导致避险资金流入,强化美元,并可能引发市场波动。
b) 科技泡沫破裂: 标普500的涨幅集中在少数大型科技股上,存在风险。任何显著的监管行动或收益失望可能引发更广泛的市场抛售。
c) 通胀回升: 如果通胀比预期更顽固,美联储可能被迫长时间维持高利率,可能引发更严重的衰退。
算法交易机会:
a) 高频交易: 开发算法以利用利率预期和货币变动之间的短期差异。
b) 机器学习模型: 使用历史数据训练模型,以预测标普500的走势...
预测利率逐步放松与当前的经济状况和美联储的谨慎态度很好地吻合。这种预测对于规划长期投资策略非常有用。
详细预测到2024年底将进行2-3次降息,将利率降至4.75-5%的具体且可操作的建议,有助于投资者设定预期并相应计划。
模型预测短期内美元走强,随后随着美联储降息而回落,这个逻辑合理,反映了对全球货币政策动态的理解。
提供具体范围(98-100)增加了清晰度,有助于制定更精确的交易策略。
预测标普500达到5300-5500是乐观但基于当前趋势(如AI驱动的科技增长)的预测。它依赖于“软着陆”情景,这是一个现实的评估。
提到条件(通胀得到控制并避免严重衰退)表明模型的预测不仅仅是希望,而是基于现实的情景。
收益率曲线交易:
复杂策略:建议进行陡峭化交易反映了对债券市场的深刻理解。鉴于潜在的降息,这一策略很及时。
6. 从 78 页 PDF 创建信息图表
“Claude 3.5,这是一个78页的PDF。请创建一个信息图,描述其主要发现。”(准确,但其含义是模型自己推测的)
“Claude 3.5,创建一个演示中心极限定理的交互应用程序。”
“Claude,请尽可能地将这幅画重新创建为SVG格式。”
7. Python 中带有 Sound FX 的 3D 射击游戏
尝试使用Claude Sonnet 3.5用Python制作一个基本的3D射击游戏。这花了大约90分钟,因为它一开始并不能正常工作,但即使在我进行修改时它也从未崩溃。
8.AI音效生成器应用
Claude Sonnet 3.5与Artifacts还可以播放声音!
使用@elevenlabs API,它创建了一个功能齐全的AI音效生成器应用程序,我所做的只是粘贴了API文档。
9.使用Claude 3.5 Sonnet制作的21点游戏
✅ 游戏逻辑
✅ 游戏区域和牌面设计
✅ 下注系统
它能这么快完成,真是令人难以置信。
10. 可视化深度学习
用Claude 3.5 Sonnet可视化深度学习。
需要暂停一下,因为我快要达到Claude的消息容量了。😅
暂无评论,1178人围观