人工智能

o1满血版泄露!奥数题图片推理手拿把掐 奥特曼上线剧透o2

字号+作者:量子位 来源:量子位 2024-11-03 17:18 评论(创建话题) 收藏成功收藏本文

o1满血版泄露了!没想到,OpenAI还搁那儿“今年一定”呢,不少网友已经率先上手体验到了(doge)。事情是酱婶的:有网友发现,OpenAI已经在ChatGPT官网上部署了完整'...

o1满血版泄露了!没想到,OpenAI还搁那儿“今年一定”呢,不少网友已经率先上手体验到了(doge)。事情是酱婶的:有网友发现,OpenAI已经在ChatGPT官网上部署了完整版o1,大家伙儿还都能卡bug直接用!dgh品论天涯网

dgh品论天涯网

最初发现此事的网友,测试确认泄露模型具有奥特曼所说的图像推理能力dgh品论天涯网

dgh品论天涯网

图源:X@legit_rumorsdgh品论天涯网

而日志也显示该模型就是o1本模。dgh品论天涯网

dgh品论天涯网

于是,赶在OpenAI出手修复之前,网友们抓紧大玩特玩了一波——dgh品论天涯网

满血o1到底有多牛dgh品论天涯网

和已经发布的o1-preview、o1-mini最直观的不同是,泄露出来的o1支持上传附件。dgh品论天涯网

这也就意味着,终于能测测o1的多模态能力了。dgh品论天涯网

网友们也不说废话,直接上强度,普特南数学竞赛的证明题截图一贴,甩给满血o1。dgh品论天涯网

对正整数n,有fn(x)=cos(x)cos(2x)cos(3x)…cos(nx)。找出最小的n,使得|fn‘’(0)|>2023。dgh品论天涯网


dgh品论天涯网

思考了18秒之后,o1给出答案:18。dgh品论天涯网


dgh品论天涯网

答案正确:dgh品论天涯网


dgh品论天涯网

再来一道更复杂的,虽然在识图上遇到了一点小问题,但还是稳稳做对了。dgh品论天涯网


dgh品论天涯网


dgh品论天涯网

在如此惊艳表现之下,似乎正确识别人类史上首张黑洞照片也不算什么了(doge)。dgh品论天涯网


dgh品论天涯网

不过嘛,也不是没有翻车案例。比如,让大模型数数图里有多少个三角形。dgh品论天涯网


dgh品论天涯网

ID为anagh的??网友,给泄露模型和GPT-4o做了个同屏对比:dgh品论天涯网

dgh品论天涯网

4o速度很快,给出了错误答案19。dgh品论天涯网

而满血o1花了1分39秒,狂刷一堆token……给出了不同的错误答案:29。dgh品论天涯网

正确答案是24。dgh品论天涯网

这个bug现在已经修复了。不过,有意思的是,这次模型泄露,持续了整整3个小时。dgh品论天涯网

不小心还是故意的?dgh品论天涯网

有网友犀利地点出,这事儿看上去不是“不小心”,而是“精心策划”:dgh品论天涯网

目的是让人们对即将发布的模型有一个预期。dgh品论天涯网


dgh品论天涯网

不少网友赞同这样的观点:dgh品论天涯网

奥特曼的目的是测试和炒作。dgh品论天涯网


dgh品论天涯网

而由于一切看上去已经部署就绪,甚至有人猜测,o1完整版的正式上线时间就在未来一周之内。dgh品论天涯网


dgh品论天涯网

值得注意的是,就在这次泄露事件之后,奥特曼马上在X上开始了自己的表演:dgh品论天涯网


dgh品论天涯网

好家伙,都已经吹上o2的风了(还假装上错号……)。dgh品论天涯网


dgh品论天涯网

至于为什么是这个时间……dgh品论天涯网

那不得赶在Anthropic发布ClaudeHaiku3.5之前搞点事嘛(doge)。dgh品论天涯网


dgh品论天涯网

参考链接:dgh品论天涯网

[1]https://x.com/legit_rumors/status/1852625385801859321dgh品论天涯网

[2]https://x.com/koltregaskes/status/1852657291469709626dgh品论天涯网

[3]https://x.com/anaghnairr/status/1852668741751919016dgh品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]