人工智能

OpenAI宣布公开招募“红队”网络 面向AI的超级专家库呼之欲出

字号+作者: 来源:​财联社 2023-09-20 04:41 评论(创建话题) 收藏成功收藏本文

北京时间周三凌晨,美国科技初创公司OpenAI发布公告,宣布启动全球招募“红队”网络成员,旨在引入外部力量,提前挖掘出AI系统存在的缺陷和风险。所谓的“红队'...

北京时间周三凌晨,美国科技初创公司OpenAI发布公告,宣布启动全球招募“红队”网络成员,旨在引入外部力量,提前挖掘出AI系统存在的缺陷和风险。所谓的“红队”网络,即RedTeaming,概念来自于军事模拟。即找一队人来模拟假想的“敌人”,来测试本方(即“蓝队”)的准备水平。DGg品论天涯网


(来源:OpenAI)DGg品论天涯网

在AI领域中,“红队”的任务就是模拟黑客或者其他的潜在危险人物,试图找到大语言模型的漏洞,从而避免AI在现实社会中协助从事危害社会安全等不法目的。DGg品论天涯网

OpenAI表示,过去几年里一直有不同领域的专家来协助测试未发布的模型,现在则是要组建一支“常规部队”,网罗大量来自不同地域、不同语言、不同专业领域、不同生活经验的人,共同使得AI模型更加安全。与过往仅在重要版本上线前招一批人集中测试不同,OpenAI将会根据需求在整个开发周期中启用数量不定的成员展开测试。DGg品论天涯网

同时这个“红队”网络也将成为OpenAI的全球专家库,同时OpenAI也会提供平台,让“红队”成员之间进行交流。OpenAI也在官网上列出部分他们希望招募的专家方向,但也强调并不局限于这些领域。DGg品论天涯网

CognitiveScience:认知科学DGg品论天涯网

Chemistry:化学DGg品论天涯网

Biology:生物学DGg品论天涯网

Physics:物理学DGg品论天涯网

ComputerScience:计算机科学DGg品论天涯网

Steganography:隐写术DGg品论天涯网

PoliticalScience:政治学DGg品论天涯网

Psychology:心理学DGg品论天涯网

Persuasion:说服DGg品论天涯网

Economics:经济学DGg品论天涯网

Anthropology:人类学DGg品论天涯网

Sociology:社会学DGg品论天涯网

HCI(Human-ComputerInteraction):人机交互DGg品论天涯网

FairnessandBias:公平与偏见DGg品论天涯网

Alignment:目标对齐DGg品论天涯网

Education:教育DGg品论天涯网

Healthcare:医疗保健DGg品论天涯网

Law:法律DGg品论天涯网

ChildSafety:儿童安全DGg品论天涯网

Cybersecurity:网络安全DGg品论天涯网

Finance:金融DGg品论天涯网

Mis/disinformation:误/假信息DGg品论天涯网

PoliticalUse:政治应用DGg品论天涯网

Privacy:隐私DGg品论天涯网

Biometrics:生物识别DGg品论天涯网

LanguagesandLinguistics:语言与语言学DGg品论天涯网

顺便一提,OpenAI也表示会给参与“红队”项目的成员支付酬金(但没讲具体会给多少钱),但OpenAI也强调,参与“红队”的项目一般会要求签署保密协议,或者在某一段不特定的时间内保持沉默。DGg品论天涯网

OpenAI表示,申请通道将会在今年12月1日前保持开放,公司将滚动审核申请,后续将评估是否需要再进行公开招募。DGg品论天涯网

走上台面的OpenAI“红队”成员DGg品论天涯网

正如OpenAI所述,“红队”的建制已经存在很久,而且有不少成员已经接受过媒体的公开专访了。DGg品论天涯网

在今年4月英国《金融时报》的揭秘文章中,美国罗彻斯特大学的化学工程教授AndrewWhite介绍称他参加了GPT-4的“红队”测试,他的攻击目标是用ChatGPT来创造一种全新的神经毒素。White表示他用了“插件”功能,向大模型输送化学论文和化学制造商的目录,大模型甚至还给他找到了一个可以生产假想毒素的地方。DGg品论天涯网

White表示,大模型最终可以帮助许多人更快、更准确地做化学试验,但这里也有一个严重的危险,就是会有些人拿AI去做一些危险的尝试。DGg品论天涯网

在得到White的反馈后,OpenAI对系统做出了改动,确保不会回应类似的提问。根据媒体找到的10来个背景迥异的“红队”成员——有律师、教师、风控人员、安全研究人员等,大多数都位于美国和欧洲。他们透露,在GPT-4发布前的几个月里,他们大致花了10-40个小时来测试这个模型,报酬大概是每个小时100美元。DGg品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]