人工智能

体验Anthropic刚发布的Claude3.5 最强的是这个新功能

字号+作者: 来源:数字生命卡兹克 2024-06-21 08:52 评论(创建话题) 收藏成功收藏本文

OpenAI的最大对手,Anthropic,没有任何预兆的,官宣了自己的新模型。Claude3.5Sonnet。Claude3家族原本有三个参数量级的模型,分别是:Claude3Opus、Claude3Son'...

OpenAI的最大对手,Anthropic,没有任何预兆的,官宣了自己的新模型。Claude3.5Sonnet。Claude3家族原本有三个参数量级的模型,分别是:Claude3Opus、Claude3Sonnet和Claude3Haiku。可以理解成Opus(大杯)、Sonnet(中杯)、Haiku(小杯)。而这一次,是把中等参数模型Sonnet的3.5升级版放了出来。eZT品论天涯网


eZT品论天涯网


eZT品论天涯网

在跑分上,除了MMLU(本科水平的知识)和MATH(数学能力)上,基本都达到了最佳。eZT品论天涯网

此处要注意,Claude3.5Sonnet只是一个中等参数模型,在参数量级上远远达不到Claude3Opus的级别,但是在跑分上超了,这就很恐怖。eZT品论天涯网

而在多模态的视觉能力上也基本达到了全面领先。eZT品论天涯网


eZT品论天涯网

除了视觉问答(MMMU)离GPT4o还查了小1个点之外,其他的4项:视觉数学推理(MathVista)、科学图表理解(AI2D)、图表问答、文档视觉问答(ANLS),都达到了最佳水平。eZT品论天涯网

最搞的是,Anthropic在发布Claude3.5Sonnet前为了预热,搞了一段小插曲,他们发了一段谜语。eZT品论天涯网


eZT品论天涯网

我看了半天也没看明白,然后朋友跟我说,视频里面的是摩斯密码,转换过来是Sonnet,上面的密码要用维吉尼亚密码去破,那一刻我才焕然大雾。eZT品论天涯网

于是我扔给了GPT,GPT给我破译了出来,得到了一段诗。eZT品论天涯网


eZT品论天涯网

Nomorebegrievedatthatwithwhichthouhastdone-不再因你所做的事情而感到悲伤。eZT品论天涯网

Roseshavethornsandsilverfountainsmud-玫瑰有刺,银色的泉水也有泥。eZT品论天涯网

Allmodelserryetbetweenthethirdandfourth-所有的模式都会出错,但在第三和第四之间。eZT品论天涯网

Runournewcreationbloomsawiserbud-我们的新创造将绽放出一个更智慧的花蕾。eZT品论天涯网

说实话破完了又一次给我干懵逼了,这个谜语让我感受到了我智商的低谷……eZT品论天涯网

搜了半天,然后发现这段,原来是莎士比亚的第35首十四行诗,而十四行诗,其实对应的单词就是Sonnet。eZT品论天涯网

那这下,答案就呼之欲出了,Anthropic要发Claude3.5Sonnet了。eZT品论天涯网

就在我兴致勃勃的准备去炫耀我解出来谜题的时候,发现Anthropic已经发公告正式官宣发布Claude3.5Sonnet10分钟了……eZT品论天涯网

全世界都知道了,而且是在我花了好大力气解完谜题之后,尼玛,瞬间有一种被Anthropic背刺的感觉。eZT品论天涯网

话说回来,除了以中等参数实现了综合跑分第一外,Claude3.5Sonnet的运行速度是Claude3Opus的2倍,但是定价会更便宜,毕竟是中等参数的模型。eZT品论天涯网

推理能力也确实有了提升,但是坦率的讲,对于普通用户来说,可能直观的差异性,不是很大。eZT品论天涯网

最让我惊喜的,其实是他们的新功能,ArtifactseZT品论天涯网

当用户要求Claude生成代码片段、文本文件或网站设计等内容时,右边就会多出来一个实时的窗口,这个就是Artifacts。eZT品论天涯网

这个功能需要手动开启,点击头像,有个FeaturePreview,点进去,把Artifacts打开就行。eZT品论天涯网


eZT品论天涯网

比如说,我想让Claude帮我做一个横版跳跃的小游戏,坤哥跳过各种障碍物的小游戏。eZT品论天涯网

我在打开Artifacts后,先让claude给我画一个主角,跟它说:eZT品论天涯网

给我画一个8-bit的svg小人,灰色身体,白色头发,旁边有一个篮球。eZT品论天涯网

他就会嘟嘟的写代码,这时候,右边的Artifacts窗口就会被打开。eZT品论天涯网


eZT品论天涯网

所有代码全部写完后,他就会出来一个预览和code的tab,此时,你就可以直接在Artifacts窗口里的预览tab看到画出来的svg小人了。eZT品论天涯网


eZT品论天涯网

然后,我们在让claude帮忙画一些装饰的鸡。eZT品论天涯网


eZT品论天涯网

主角有了,鸡有了,现在,我们让claude帮忙做一个游戏,一个横版的跳跃游戏,我们的主角坤哥需要不断的跳过一只一只的小鸡。eZT品论天涯网

我直接说:现在,请帮我做一个横版的跳跃游戏,可操控的主角是8-bit的小人,需要跳过的障碍物是不断迎面而来的一只一只不同的小鸡,背景是蓝色的天空。我每次按空格键就是跳跃。eZT品论天涯网

很快,代码就写好了。eZT品论天涯网


eZT品论天涯网

然后,我们在预览窗口,是真的,可以直接玩这个游戏的。eZT品论天涯网


eZT品论天涯网

虽然把篮球给我干消失了,但是无伤大雅。eZT品论天涯网

所以,Artifacts对于很多开发者来说,未来,是有巨大的效率提升的,直接以可视化的方式展现在你的面前,甚至,还是可以交互的。eZT品论天涯网

可以预期到,未来例如网页设计等等,会有巨大的效率提升。eZT品论天涯网

甚至,你可以在Claude里,直接做一个PPT。eZT品论天涯网


eZT品论天涯网

就非常的离谱。eZT品论天涯网

相比于模型的更新,这种功能的更新,可能会实打实的更让我兴奋,它真的可以提升效率,以及整出不一样的花活。eZT品论天涯网

而ChatGPT虽然也有类似的交互,但是也只局限于一些数据分析场景。eZT品论天涯网


eZT品论天涯网

Claude,这次,是做了大幅度的进化。eZT品论天涯网

最后,Anthropic说,会在今年晚些时候,放出Claude3.5Haiku和Claude3.5Opus。eZT品论天涯网

也在探索ChatGPT目前特有的记忆功能。eZT品论天涯网

反正,这些模型厂商卷起来,对我们普通用户来说,肯定是好事。eZT品论天涯网

只是老黄,可能要抱着他的英伟达,在那个铁王座上,坐的更久一点了。eZT品论天涯网

还有那个奥特曼。eZT品论天涯网

你的GPT-5,到底啥时候端上来?eZT品论天涯网

哦不对,先把你的完全版的GPT4o端上来再说吧。eZT品论天涯网

一个多月了,我还没用上新语音和新视觉呢==eZT品论天涯网

呸,渣男。eZT品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]