Claude 3.5一夜封王，10倍编码速度逆天，全网最全实测来了

最新推荐文章于 2025-05-24 17:42:34 发布

原创最新推荐文章于 2025-05-24 17:42:34 发布 · 948 阅读

·

8

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#人工智能 #ubuntu #linux

ChatGPT精选专栏收录该内容

47 篇文章

订阅专栏

有人表示自己一半的工作已经可以由它替代了！

就在昨天，Anthropic深夜发布了下一代旗舰大模型Claude 3.5 Sonnet。

据称，Claude 3.5 Sonnet不仅在评估中胜过GPT-4o，还保持了作为「中杯」的最优性价比，超过了自家的Claude 3 Opus。

如今，Claude 3.5 Sonnet已经面向全球开启免费试用了。

在费用上，Sonnet处理每百万输入token仅需3美元，每百万输出token仅为15美元。

对比之下，GPT-4o的每百万输入token收费5美元，每百万输出token为15美元，在价格上可以说是不相上下。正式对打时，各家可以说是已经都压低到了成本价。

前OpenAI对齐团队负责人Jan Leike表示，我喜欢Sonnet新模型。我经常要求它向我解释ML论文。虽然不一定全对，但可能比我略读要好，而且速度也快得多。自动对齐研究越来越近了…

有网友同样表示，「我有一半的工作都可以由Claude 3.5 Sonnet来完成，我真是太兴奋了」。

Anthropic的产品经理Michael Gerstenhaber将新模型称之为「世界上最智能的模型」。

他表示，「我们正处于这个行业寒武纪大爆发的开端」。

今年晚些时候，Claude 3.5 Haiku和最强版Claude 3.5 Opus将会陆续推出。

模型厂商们是彻底卷起来了！

网友实测

Claude 3.5 Sonnet发布之后，在全网掀起轩然大波，网友们纷纷上手开启一波测试。

10倍编码速度惊人

先来看看Claude 3.5 Sonnet写代码的速度有多可怕。

网友仅在一次对话中，就用threejs+cannonjs创建出一个3D太阳系模型，包含了物体和碰撞效果。

另一个网友称，使用Claude 3.5 Sonnet进行编码比GPT-4，或任何其他大型语言模型效率高10倍。全新的Artifacts功能，可以在聊天旁边生成和运行代码，简直令人惊叹。

没有什么比使用Claude 3.5 Sonnet一次性编写一个程序，来解密维吉尼亚密码更棒的事了。

许多网友纷纷夸赞Claude 3.5 Sonnet速度快到起飞。

2分钟一个小游戏

一位开发者直接用了不到2分钟，做出了一个戴着太阳镜的小狗吃骨头的游戏。

另有人花了3分钟的时间，做出了马里奥克隆版，并且为角色提供了动画效果。

还有另一款「原创」游戏Color Cascade。

用2分钟创建一个蛇梯棋游戏。

网友表示，「我可以通过新的Artifacts功能实时查看代码并玩游戏。使用Claude的编码体验比GPT-4和Gemini好10倍」。

这位网友用Sonnet做了一款乒乓球游戏。

不像ChatGPT，它没有用到编码解释器。在这个过程中，我们可以制作文档、笔记和其他内容，其中一个选项的html/jss。

神经网络可视化

有人还去做了可视化深度学习，不过因为消息限制，不得不暂停。

下面是用动画效果解释反向传播的工作原理。

重建3D「模拟矩阵」

Claude 3.5 Sonnet是第一个能在首次尝试中，重现电影《黑客》中「数据流」3D场景的模型。

而且，在制作恐怖游戏上，Claude 3.5 Sonnet设计的3D结构比Opus更好。

SVG效果图

Claude 3.5 Sonnet可以画出独角兽SVG图。

它甚至可以生成芯片制造工艺流程示意图。

「井字棋」游戏失败

OpenAI研究科学家，德扑之父使用新模型之后表示，

像GPT-4o（现在还有Claude 3.5 Sonnet）这样的前沿模型，在某些方面可能达到了「聪明的高中生」的水平，但它们在像「井字棋」这样的基本任务上无法完成。

人们曾希望原生的多模态训练能够有所帮助，但事实并非如此。

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

AIMaynor 觉得有用，要个免费的三连可有？

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。