人工智能

GPT-4o被全球网友玩坏了 谷歌:终究是错付了!

字号+作者: 来源:站长之家 2024-05-16 11:57 评论(创建话题) 收藏成功收藏本文

站长之家(ChinaZ.com)5月16日 消息:在社交软件上,OpenAI的GPT-4o成为了热议的焦点。这款最新旗舰产品以其全能的特性——接受文字、音频、图像的任意组合'...

站长之家(ChinaZ.com)5月16日 消息:在社交软件上,OpenAI的GPT-4o成为了热议的焦点。这款最新旗舰产品以其全能的特性——接受文字、音频、图像的任意组合输入,并生成相应的文字、音频、图像输出——迅速吸引了全球网友的关注。GPT-4o的免费特性更是让其成为了互联网上的新宠。swg品论天涯网

在5月14日的官方演示中,GPT-4o展现出了令人印象深刻的性能,其响应音频输入的速度甚至与人类相媲美。网友们已经迫不及待地开始尝试这款AI的多种功能,从生成图表和统计分析到创建3D模型的STL文件,GPT-4o都能在极短的时间内完成。swg品论天涯网

GPT-4o的应用场景多种多样,网友们的创意层出不穷。例如,有网友使用GPT-4o解答了著名的“爱因斯坦谜题”,展示了其强大的逻辑推理能力。此外,还有网友利用GPT-4o开发了自动选股器,将复杂的选股指标自动改写成选股器,并输出图表和数据归档,极大地提高了效率。swg品论天涯网

GPT-4o的纸质原型转录功能也受到了网友的好评。有网友尝试将手写的原型转录为电脑内的初始HTML,GPT-4o不仅准确地完成了任务,还保持了数据结构变化时的HTML更新。此外,GPT-4o的OCR(光学字符识别)能力也得到了认可,它能够识别并吐出连人类都难以辨认的图像中的内容。swg品论天涯网

image.pngswg品论天涯网

以下是GPT-4o的一些亮点功能:swg品论天涯网

多模态输入输出:GPT-4o能够接受文字、音频、图像的任意组合作为输入,并生成相应的文字、音频、图像输出。swg品论天涯网

逻辑能力测试:GPT-4o成功解答了被称为“爱因斯坦谜题”的逻辑题,展示了其出色的逻辑推理能力。swg品论天涯网

自动选股器:尽管OpenAI表明GPT不能用于选股,但网友使用GPT-4o创建了一个自动选股器,并能输出图表和数据归档。swg品论天涯网

纸质原型转录:网友利用GPT-4o将纸质原型转录为电脑内的初始HTML,大大节省了开发时间。swg品论天涯网

OCR能力:GPT-4o展现了其强大的光学字符识别(OCR)能力,能够识别复杂图像中的文字。swg品论天涯网

在GPT-4o发布的同时,谷歌也推出了自己的大模型产品Project Astra。尽管Project Astra同样具备强大的功能,但有专家指出,谷歌的产品在多模态输出方面仍有待提高。虽然OpenAI和谷歌都先后推出重磅产品,但这波比拼,谷歌可以说是一点好处都没捞着,直接被OpenAI“艳压”了。swg品论天涯网

与此同时,马斯克旗下的xAI公司推出的Grok模型在某些测试中表现超过了GPT-4o,比如它正确回答了Ilya离开公司的问题。而OpenAI自己的大模型未能提供正确响应。swg品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]