OpenAI为期12天的年终“技术盛宴”已结束第二天的直播。从当地时间12月5日发布的“满血版”o1模型和最贵ChatGPTPro服务,到6日发布的强化微调(ReinforcementFine-Tuning),无不证明AI世界又将迎来一次全新的产品升级和迭代。
在AI的狂欢中,其他科技公司也不甘示弱。有着“AI教母”之称的李飞飞创立的WorldLabs以及谷歌DeepMind团队本周先后发布重磅产品,让用户可以通过单张图片生成交互式3D场景,展示了AI在虚拟世界构建领域的巨大潜力。
Meta和马斯克的xAI也来凑了个热闹。Meta推出了今年的压轴AI大模型:Llama3.370B,该模型据称能实现和Meta最大Llama模型——Llama3.1405B同样的性能,成本还更低。xAI宣布Grok从今天起全球免费,但有使用限制。免费用户每2小时可以询问最多10个问题,每天最多可分析3张图片和生成4张图片。
随着各路玩家在AI领域竞赛的深入,AI的竞争焦点也转向了智能体和通用人工智能(AGI)。
据外媒6日的最新报道,
清华大学电子工程系长聘教授、清华大学精准医学研究院临床大数据中心共同主任吴及告诉《每日经济新闻》记者,
当地时间12月5日,OpenAI为期12天的圣诞季特别活动开启。
在第一天的活动上,
“满血版”o1的特征是,在回答用户提问时不是“脱口而出”,而是形成一个类似人类思维方式的内部思维链条。
“满血版”o1比9月发布的预览版更快、更强大、更准确,同时增加了多模态输入(可以上传图片)的能力。OpenAI表示,现在的o1模型“思维已经被训练得更加简洁”(大概快50%),而且
图片来源:X
同时发布的ChatGPTPro服务也引发了外界的广泛关注,每月200美元的订阅费是目前ChatGPTPlus定价的10倍。不过,用户
次日,OpenAI打出活动“第二弹”,推出了强化微调(ReinforcementFine-Tuning)。阿尔特曼表示:
图片来源:X平台
强化微调与标准微调不同,利用强化学习算法,研究者可以强化产生正确答案的思路,抑制产生错误答案的思路,只需要“几十个例子”(afewdozenexamples)、甚至12个例子,模型就能以有效的新方式学习特定领域的推理,提升模型在特定领域任务中的推理能力和准确性。
据介绍,它甚至可以让简易版推理模型o1mini的效果超过前一天刚发布的“满血版”o1。OpenAI预计将于2025年初公开发布强化微调功能。
除了OpenAI的首批年末“王炸”外,本周还有诸多AI相关的重磅产品出炉。
在WorldLabs网站的演示里,由AI生成的场景均通过浏览器实时渲染而成,用户可以使用箭头键或键盘(WASD)键移动,然后单击并拖动鼠标实现交互,从而自由探索场景。WorldLabs的AI工具配备了可操控的滑块来调节模拟景深(DoF)与模拟推拉变焦(dollyzoom),当使用者将景深效果调至越强时,背景中的物体便会越发模糊,为整个视觉体验增添了更多层次感与真实感。
图片来源:WorldLabs推特截图
但WorldLabs目前只向公众发布了关于该技术的博客,外界能够体验的功能极为有限,而且并未放出任何代码和模型。
在单图生成3D世界领域探索的还有谷歌。北京时间12月5日凌晨,谷歌DeepMind在官网发布了大型基础世界模型Genie2,可通过单张图片和文字描述生成种类多样的游戏3D世界,标志着AI在虚拟世界生成领域的又一次突破。
简单来说,给Genie2一张图片,它可以生成供人类游玩、可实时渲染、可控和可交互的无限3D世界,不需要借助任何游戏引擎。例如,输入“森林中的可爱人形机器人”,模型便可构建一个包含机器人角色和可探索环境的动态场景。用户可以通过键盘或鼠标操作角色在世界中进行跳跃、游泳等互动。
清华大学电子工程系长聘教授、清华大学精准医学研究院临床大数据中心共同主任吴及在接受《每日经济新闻》记者采访时表示,
WorldLabs和谷歌之后,Meta也来凑了个热闹,于当地时间12月6日推出了今年的压轴AI大模型:Llama3.370B。Meta生成式AI副总裁AhmadAl-Dahle在X发帖表示,纯文本的Llama3.3能实现和Meta最大Llama模型——Llama3.1405B同样的性能,成本还更低。
Al-Dahle还附上了一张图表,显示包括针对大模型语言理解能力的测试MMLU在内,Llama3.3在一系列行业基准测试中表现优于谷歌的Gemini1.5Pro、OpenAI的GPT-4o和亚马逊本周稍早发布的NovaPro。
图片来源:X
随着大模型竞赛的深入,AI的风又更多地吹向了智能体和通用人工智能(AGI)。
吴及告诉每经记者,目前,尽管单个大模型在某些方面表现出色,但也存在诸多不足,例如幻觉和遗忘效应等问题。他强调,
在《纽约时报》于当地时间12月4日举办的DealBook峰会上,阿尔特曼表示,“智能体是现在每个人都在谈论的话题,我认为这背后是有充分理由的。设想一下,你可以让AI系统完成一项相当复杂的任务,比如需要一位非常聪明的人,花费一段时间,借助各种工具来完成并产出有价值成果的任务。我预计,这样的场景将在明年成为现实。”
他同时指出,AI行业即将迎来的发展将比预期更具冲击力。他将AI的影响力比作晶体管的发明,认为AI的推理功能未来将走向普及化和商业化。“
据外媒12月6日最新报道,
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】