今天凌晨,知名科技媒体Venturebeat消息,OpenAI高级研究科学家、德扑AI之父NoamBrown,在美国旧金山举办的TEDAI大会上提出了一个震惊的理论——让AI模型思考20秒所带来的性能提升,相当于将模型扩大100,000倍并训练100,000倍的时间。
最初,Brown也被这个结果吓到了,还写了多篇论文来验证其真实性。他发现
现在是时候进行训练、推理范式转变了,AI模型需要超越单纯的数据预处理,进入“系统二思维”模式,以一种更慢、更审慎的拟人化推理形式来解决超复杂的难题。
系统二思维介绍
“系统二思维”是一个心理学概念,描述了人类处理复杂问题时所采用的深度思考方式。这个概念最初由心理学家DanielKahneman在他的著作《思考,快与慢》中提出,用来解释人类大脑的两种不同的思考模式。
在Kahneman的理论中,系统一思维是快速、直觉、自动的,它处理日常的、熟悉的任务,比如识别熟悉的面孔或者理解简单的句子。
这种思维方式不需要我们有意识地思考,它依赖于我们的直觉和经验,但有时也可能导致错误,因为它不涉及深入的逻辑推理。
而系统二思维则是缓慢、逻辑、努力的,它涉及到深思熟虑、计算和推理。
Brown直接将这个概念应用到AI领域,提出了一个革命性的想法:通过模拟人类的系统二思维,AI模型可以在不增加大量数据或计算资源的情况下显著提升性能。
以他开发的战胜人类的德扑AILibratus为例,
而OpenAI最新发布的o1模型同样引入了系统二思维,能够进行深度推理,模仿人类逐步解决问题的过程,通过自我对弈等强化学习训练方式提升推理能力。
例如,在国际数学奥林匹克资格考试中,o1模型凭借系统二思维准确推理复杂数学公式取得83%的准确率,远高于GPT-4o的13%。这对于金融、医疗、科研、编码等对数据要求严谨的行业来说非常重要。
所以,系统二思维对于增强大模型的能力有很多好处,使其能够更好地适应新的、未见过的任务和环境。在面对错误、不确定性和异常情况时,系统二思维还可以帮助大模型变得更加鲁棒,因为它鼓励模型采取更加谨慎和保守的策略。而在人机交互方面,模拟系统二思维能帮助大模型可以更好地理解和预测人类用户的需求和意图,从而改善交互体验。
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】