GPT-4o成全球网友新玩具，秒秒钟纸质原型转录初始HTML，网友：谷歌你是一点流量摊不上啊-品论天涯网

声明:本文来自于微信公众号量子位（ID:QbitAI），作者:衡宇，授权站长之家转载发布。OSc品论天涯网

好啊，不愧是OpenAI最新旗舰，打开各个社交软件，GPT-4o的上手测试都唰唰唰往我首页推。OSc品论天涯网

请!看!OSc品论天涯网

这，就是用上GPT-4o，花不到30s时间，通过单个prompt把一个电子表格中的内容生成了完整的图表和统计分析。OSc品论天涯网

OSc品论天涯网

在过去，在Excel里做这玩意儿，不得花咱打工人好一阵子时间?OSc品论天涯网

而下面这张图，是网友花了不到20s，用GPT-4o创建出的一张四腿桌子的3D模型的STL文件。OSc品论天涯网

OSc品论天涯网

牛哇牛哇!OSc品论天涯网

毕竟GPT-4o能力横跨听、说、看，主要是，它还免费啊!OSc品论天涯网

就跟网友总结的一样，现在，每个用户都可以通过AI和简单的Prompt来生成非常了不起的东西。OSc品论天涯网

不过，关于“如何生成复杂结构的东西”，还需要再摸索摸索。OSc品论天涯网

一起来看，网友们都在怎么忘我地狂玩儿GPT-4o吧——OSc品论天涯网

狂玩GPT-4o

在一年一度的谷歌 I/O 开发者大会前24小时，OpenAI突袭发布了GPT-4o。OSc品论天涯网

“o”是Omni的缩写，意为“全能”。OSc品论天涯网

敢起这么个名字，是因为GPT-4o接受文字、音频、图像的任意组合作为输入，并生成文字、音频、图像输出。OSc品论天涯网

在5月14日的OpenAI官方演示中，用起来非常丝滑，甚至响应音频输入的速度赶上了人类。OSc品论天涯网

抱着“我不信除非我试试”的态度，网友已经玩疯了。OSc品论天涯网

爱因斯坦谜题

先声明，这个所谓的“爱因斯坦谜题”，很像咱小时候做的奥数题，是用来测试大模型逻辑能力的。OSc品论天涯网

题目背景是这样的:OSc品论天涯网

在一条街上，有五座房子，喷了五种颜色。每座房子里住着不同国籍的人。每个人喝不同的饮料，抽不同品牌的香烟，养不同的宠物。OSc品论天涯网

提示:OSc品论天涯网

（1）英国人住红色房子。OSc品论天涯网

（2）瑞典人养狗。OSc品论天涯网

（3）丹麦人喝茶。OSc品论天涯网

（4）绿色房子在白色房子左面隔壁。OSc品论天涯网

（5）绿色房子主人喝咖啡。OSc品论天涯网

（6）抽Pall Mall香烟的人养鸟。OSc品论天涯网

（7）黄色房子主人抽Dun Hill香烟。OSc品论天涯网

（8）住在中间房子的人喝牛奶。OSc品论天涯网

（9）挪威人住第一间房。OSc品论天涯网

（10）抽 Blends香烟的人住在养猫的人隔壁。OSc品论天涯网

（11）养马的人住抽Dun Hill香烟的人隔壁。OSc品论天涯网

（12）抽 Blue Master的人喝啤酒。OSc品论天涯网

（13）德国人抽 Prince香烟。OSc品论天涯网

（14）挪威人住蓝色房子隔壁。OSc品论天涯网

（15）抽 Blends香烟的人有一个喝水的邻居。OSc品论天涯网

问题来了，谁养鱼?谁住蓝色房子?OSc品论天涯网

前几天，网友在lmsys测试i-am-gpt2-bot（就是在大模型竞技场大杀特杀的神秘GPT-2）时，还没办法解答爱因斯坦谜题——而且也没有任何其他AI可以搞定这个问题。OSc品论天涯网

但上手一试，GPT-4o光速回答对了。OSc品论天涯网

大家可以自己动手测一下（手动狗头）。OSc品论天涯网

OSc品论天涯网

自动选股器

前脚刚看到OpenAI说了，GPT不能用来选股，没有啥参考意义。OSc品论天涯网

后脚就有网友在推特上发布了实现的GPT-4o自动选股器，并配文:强得可怕!OSc品论天涯网

具体来说，他用GPT-4o实现了将两百多行选股指标自动改写成自动选股器、输出图表和数据归档。OSc品论天涯网

OSc品论天涯网

△AI生成内容，不代表任何投资建议

而且只需1轮交互就能完成较为满意的效果，效率暴打GPT-4（哦?我揍前代我自己）OSc品论天涯网

据他说，用GPT-4搞这玩意，需要反反复复修改，而且处理100行以上的代码非常低效。OSc品论天涯网

对此，网友的评价非常精辟:OSc品论天涯网

如果能100%预测那真的是完美!但如果预测不对那不如别预测……OSc品论天涯网

OSc品论天涯网

纸质原型转录初始HTML

也有网友尝试利用GPT-4o，把写在纸上的原型转录为电脑内的初始HTML。OSc品论天涯网

他白纸黑字是这么写的:OSc品论天涯网

OSc品论天涯网

然后把这张图喂给了GPT-4o。OSc品论天涯网

然后GPT-4o说:OSc品论天涯网

OSc品论天涯网

然后就得到了:OSc品论天涯网

OSc品论天涯网

网友本人对吐出的这个结果非常满意，他激动地在推特写下:OSc品论天涯网

就像我们正在进行一场超越世界的对话，这真是Soooooo Cool～OSc品论天涯网

OSc品论天涯网

不止他一个，另外有网友在Hacker News上表示，自己也能用GPT各个版本将原始动态数据动态转换为漂亮的HTML布局。OSc品论天涯网

这样来制作低流量页面，如更改/审核日志，能节省大量的开发时间，还能在数据结构发生变化时保持HTML更新。OSc品论天涯网

不过尝试并不是回回奏效，因为GPT-4-Turbo有时几乎完全忽略了上下文和说明。OSc品论天涯网

OCR

不过，有网友表示对GPT-4o的OCR能力也有点牛气在身上的OSc品论天涯网

事情是这样的，他扔给了GPT-4o一张这个图。OSc品论天涯网

怎么说呢，确实密密麻麻，公司Logo又有图像又有文字，人类肉眼看都有点吃力。OSc品论天涯网

OSc品论天涯网

GPT-4o的结果把测试者本人惊到了，他说:“它不断吐出连人类都难以识别的图中的内容。”OSc品论天涯网

OSc品论天涯网

围观网友纷纷跟帖留言，不外乎是“将来，使用它的人和不使用它的人之间的工作似乎会有很大的区别”“如果您跟不上先进技术，您就会落后”之类的话。OSc品论天涯网

拳打Google，但被马斯克脚踢?

OpenAI出手再次惊艳世界，谷歌果然坐不住了。OSc品论天涯网

在今日凌晨的发布会上，谷歌带来了Project Astra，它家的最新大模型产品。OSc品论天涯网

和GPT-4o一样，Project Astra能写会听会看会说，也能几乎没有延迟地和人类畅快交流。OSc品论天涯网

不过英伟达科学家Jim Fan老师率先出来点评了一番:OSc品论天涯网

首先，谷歌看起来似乎是多模态输入，但不是多模态输出。OSc品论天涯网

谷歌旗下的图像生成模型Imagen-3以及音乐生成模型仍然作为独立组件，没有融合到当中去。OSc品论天涯网

他提到自己的观点，那就是融合所有模态于一体是不可避免的未来趋势，当然了，还有一些他认为不可缺失的细节，具体如下。OSc品论天涯网

启用诸如“使用更机械化的声音”“说话速度加快2倍”“迭代编辑此图像”和“生成一致的漫画”等任务选项;OSc品论天涯网

不会丢失跨模式的信息，例如情感和背景声音。OSc品论天涯网

开辟新的上下文功能，您可以教模型通过少量示例以新颖的方式组合不同的感官。OSc品论天涯网

对比之下，GPT-4o做得不是完美，但大体上是正确的。OSc品论天涯网

而谷歌呢?OSc品论天涯网

Jim Fan老师不愧是老冲浪选手了，他说，谷歌做对的一件事是，“他们终于开始努力把AI集成到搜索框中”。OSc品论天涯网

OSc品论天涯网

还有网友真上手了谷歌新鲜出炉的Project Astra，发了个横向评测视频:OSc品论天涯网

内容我们听了，大体是说，他个人感觉谷歌发布会上的Demo展示环节不太好，他自己和另外三个人去摊位试玩了Project Astra，也只能玩儿2分钟左右。OSc品论天涯网

玩下来的感受，就是大写的“谷歌打的是没准备好的仗”。OSc品论天涯网

排在他前面的测试玩家让Project Astra对着一个事物讲一个故事，Astra信誓旦旦答应说好，然后就没有然后了……OSc品论天涯网

不过让Astra识别画出来的帆船和笑脸，它还是能够胜任的。OSc品论天涯网

相比较而言，他认为GPT-4o更丝滑，不过因为他还没自己上手过GPT-4o，所以不多妄作评价了。OSc品论天涯网

大家的试玩狂欢中，还有一个戏剧性的事情。OSc品论天涯网

那就是马斯克旗下大模型公司xAI的Grok，正确回答了Ilya离开公司的问题。OSc品论天涯网

而OpenAI自己的大模型未能提供正确响应。OSc品论天涯网

OSc品论天涯网

网友故意郑重其事地宣布:OSc品论天涯网

突发事件!xAI的Grok1.0击败OpenAI新推出的GPT-4o。OSc品论天涯网

当然了，这必须归功于xAI背后拥有推特（X）上的实时数据/帖子/新闻，没有什么比这更快、更丰富、更真实了。OSc品论天涯网

还有个有意思的是，Hacker News上大家发起了一个神奇的讨论。OSc品论天涯网

有人亮出了一个链接，跳转的是一个2021年发布的打油诗数据集Needle in a Needlestack（只能说世界之大无奇不有），称他坚信GPT-4o训练时，用了里面的数据，OSc品论天涯网

OSc品论天涯网

事情的起因是这样的——OSc品论天涯网

Needle in a Needlestack用于衡量大模型对上下文窗口中的信息的关注程度，包含数千首打油诗的提示，该提示询问有关特定位置的一首打油诗的问题。OSc品论天涯网

简单来说就是一个有点意思版本的大海捞针。OSc品论天涯网

不过目前而言，还没有谁家的大模型在这个测试中表现惊艳。OSc品论天涯网

OSc品论天涯网

然而，GPT-4o却取得了突破!OSc品论天涯网

OSc品论天涯网

这是一个接近完美的表现。OSc品论天涯网

于是网友就开始激情讨论，OpenAI做了啥，让GPT-4o的表现从GPT-4-Turbo大幅跃升。OSc品论天涯网

最主要的观点就如贴主所说，绝对是OpenAI用了Needle in a Needlestack来训练自己，不然数据集背后团队出来解释解释，是怎么检查并确保数据集没有被任何大模型用来作训练呢?OSc品论天涯网

当然了，也有人发出了此前已经有的声音（我们在3月参加月之暗面发布会，以及采访上海人工智能实验室的领军科学家林达华都听过类似的发言）:OSc品论天涯网

大海捞针测试对模型实际的长上下文功能的了解非常有限。OSc品论天涯网

它之所以被广泛使用，是因为早期的模型在这方面表现很糟糕，而且很容易测试。OSc品论天涯网

事实上，大多数最新模型现在在这一项任务上做得相当不错。OSc品论天涯网

不过这次多了一点信息增量，不少人认为，大模型在执行超过32k tokens的长上下文时，进行任何复杂操作的能力都会大幅下降。OSc品论天涯网

OSc品论天涯网

最后话说回来，OpenAI真的是人干事?OSc品论天涯网

在谷歌 I/O 开发者大会前贴脸输出GPT新功能，等谷歌发布会结束立马又带来了重磅消息，沉寂半年之久的OpenAI首席科学家Ilya，真的如众人猜测那样官宣离职。OSc品论天涯网

好消息:OSc品论天涯网

Ilya还活着。OSc品论天涯网

OSc品论天涯网

坏消息:OSc品论天涯网

谷歌，你是一点流量都摊不上啊……OSc品论天涯网