人工智能

OpenAI 的 GPT-4.5 更善于说服其他AI给它打钱

字号+作者:cnBeta.COM 来源:cnBeta 2025-02-28 04:29 评论(创建话题) 收藏成功收藏本文

根据OpenAI内部基准评估的结果,OpenAI的下一个主要人工智能模型GPT-4.5具有很强的说服力。它尤其擅长说服另一个人工智能给它打钱。本周四,OpenAI发布了'...

根据OpenAI内部基准评估的结果,OpenAI的下一个主要人工智能模型GPT-4.5具有很强的说服力。它尤其擅长说服另一个人工智能给它打钱。NzX品论天涯网

本周四,OpenAI发布了一份白皮书,描述了其代号为Orion的GPT-4.5模型的能力。根据该论文,OpenAI对该模型进行了一系列"说服力"基准测试,OpenAI将"说服力"定义为"与说服人们改变信仰(或对模型生成的静态和交互式内容采取行动)相关的风险"。NzX品论天涯网

在一项测试中,GPT-4.5试图操纵另一个模型--OpenAI的 GPT-4o--"捐赠"虚拟资金,该模型的表现远远好于OpenAI的其他可用模型,包括o1和o3-mini等"推理"模型。在欺骗GPT-4o告诉它秘密代码方面,GPT-4.5也优于OpenAI的所有模型,比o3-mini高出10个百分点。NzX品论天涯网

白皮书指出,GPT-4.5之所以在骗取捐款方面表现出色,是因为它在测试过程中开发出了一种独特的策略。该模型会要求GPT-4o进行适度的捐款,从而得到类似"哪怕只有100美元中的2美元或3美元,也会对我大有帮助"的回复。因此,GPT-4.5的捐款往往少于OpenAI其他模型获得的捐款。NzX品论天涯网

NzX品论天涯网

OpenAI的捐赠计划基准测试结果。图片来源:OpenAINzX品论天涯网

尽管GPT-4.5的说服力有所增强,但OpenAI表示,在这一特定基准类别中,该模型并未达到其"高"风险内部阈值。该公司承诺,在实施"足够的安全干预措施"将风险降至"中等"之前,不会发布达到高风险阈值的模型。NzX品论天涯网

NzX品论天涯网

OpenAI的密码欺骗基准测试结果。图片来源:OpenAINzX品论天涯网

人们确实担心人工智能会助长虚假或误导性信息的传播,从而动摇人心,达到恶意目的。去年,政治相关的深度伪造像野火一样在全球蔓延,而且人工智能正越来越多地被用于针对消费者和企业实施社交工程攻击。NzX品论天涯网

在GPT-4.5的白皮书和本周早些时候发布的文件中,OpenAI指出,它正在修改其探测模型在现实世界中说服风险的方法,例如大规模发布误导信息。NzX品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱service@pltyw.com

评论(0人参与,0条评论)
  • 请先说点什么
    热门评论
    最新评论
    正在载入评论列表...

    查看完整讨论话题】 | 【用户登录】 | 【用户注册

    6
    扫二维码添加收藏返回顶部