人工智能

OpenAI开发ChatGPT“反作弊神器” 99.9%超高命中率 但没发布

字号+作者: 来源:新智元 2024-08-05 18:39 评论(创建话题) 收藏成功收藏本文

OpenAI又左右互搏上了,给AI生成的文本打水印,高达99.9%准确率抓“AI枪手”作弊代写。去各大高校图书馆转一圈,会发现头上一副耳机、手边一杯咖啡,电脑上一个'...

OpenAI又左右互搏上了,给AI生成的文本打水印,高达99.9%准确率抓“AI枪手”作弊代写。去各大高校图书馆转一圈,会发现头上一副耳机、手边一杯咖啡,电脑上一个AI工具网页几乎成了当代大学生标配。eCq品论天涯网


eCq品论天涯网

学生热衷于在ChatGPT的帮助下完成作业,教师们却头疼于无法杜绝学生用ChatGPT作弊的行为。eCq品论天涯网

人工智能可以根据一个提示,在几秒钟内免费创建整篇论文或研究论文。教师和教授表示,他们迫切需要帮助来打击滥用行为。eCq品论天涯网

《每日邮报》2023年1月30报道称,UNSW的1名学生使用ChatGPT自动生成论文被抓,这也是全澳第一个使用AI技术作弊被抓的学生。eCq品论天涯网


eCq品论天涯网

UNSW人工智能教授TobyWalsh表示,各大高校都在评估如何阻止学生使用AI技术作弊。eCq品论天涯网

随后,新州、昆州和塔州都封锁了校园网络对于ChatGPT的访问,以防学生通过该技术作弊。eCq品论天涯网

但Walsh教授表示,阻止校园网络访问ChatGPT是没有意义的,因为学生们可以通过代理绕过封锁。eCq品论天涯网

“想要彻底阻止学生作弊,只能把他们放在一个没有网络的环境里,给他们一张纸和一支笔。”eCq品论天涯网

CDT最近进行的一项调查发现,59%的中学教师确信有些学生使用了AI来帮助完成学业,比前一个学年上升了17个百分点。eCq品论天涯网

要想靠老师和学校的盯梢,避开ChatGPT的诱惑很难办到,解铃还须系铃人——让AI企业亲自出马解决抓“AI枪手”。eCq品论天涯网

据悉,OpenAI已经开发出一款能够高精度识别ChatGPT生成文本的工具,但迟迟未发布。eCq品论天涯网

“文本水印”抓作弊,成功率99.9%eCq品论天涯网

ChatGPT由人工智能系统提供支持,生成原理是根据输入内容预测句子中接下来出现的token。eCq品论天涯网

OpenAI正在讨论的反作弊工具将稍微改变token的选择方式,这些变化会留下一种称为水印的图案。eCq品论天涯网

这些水印肉眼无法察觉,但可以通过OpenAI的检测技术发现,检测器提供整个文档或部分文档由ChatGPT编写的可能性的分数。eCq品论天涯网

根据内部文件,当ChatGPT创建足够多的新文本时,水印的有效率可以达到99.9%。eCq品论天涯网

虽然准确率超高,OpenAI工作人员仍然担心,换一种方式可以轻松卡Bug,通过简单的技术来删除水印。eCq品论天涯网

例如让Google将文本翻译成另一种语言,然后再翻译回来,或者让ChatGPT在文本中添加表情符号,然后手动删除它们。eCq品论天涯网

另一方面,公司内部普遍认为,谁可以使用该探测器将也是一个棘手的问题。eCq品论天涯网

如果拥有该工具的人太少,工具基本上就没有用处。如果太多人获得访问权限,有些人可能会尝试破译水印技术。eCq品论天涯网

OpenAI员工也讨论过,直接向教育工作者或外部公司提供检测器,帮助学校识别人工智能撰写的论文和抄袭作品。eCq品论天涯网

Google其实也开发过一种水印工具,可以检测GeminiAI生成的文本,叫做SynthID,正处于Beta测试阶段,尚未广泛使用。eCq品论天涯网


eCq品论天涯网

OpenAI有一个工具可以确定图像是否是使用文本到图像生成器DALL-E3创建的,该工具于去年春天发布用于测试。eCq品论天涯网

该知情员工表示,该公司优先考虑音频和视频水印而不是文本,因为其危害更为严重,尤其是在美国繁忙的选举年。eCq品论天涯网

AI文本分类器eCq品论天涯网

早在2023年1月,OpenAI就发布了一种算法,旨在检测多个AI模型(包括其自己的模型)编写的文本。eCq品论天涯网


eCq品论天涯网

但它的成功率仅为26%,七个月后OpenAI就将其撤回。eCq品论天涯网

其他公司和研究人员还开发了一些工具来检测人工智能创建的文本,许多教师表示他们已经使用过这些工具。eCq品论天涯网

但它们有时无法检测由高级大语言模型编写的文本,并且准确率很低,可能产生误报。eCq品论天涯网

最近在佐治亚州一所私立高中任教的教育工作者人工智能顾问MikeKentz表示,起初,学生们确实被震慑到,以为老师们已经完全掌握了一种方法,可以弄清楚他们是否使用了人工智能代写。eCq品论天涯网

但到了年底……他们慢慢发现,等一下,我的老师好像不知道。eCq品论天涯网


eCq品论天涯网

一些老师鼓励学生使AI来帮助研究或提供想法反馈。但问题是,当学生使用像ChatGPT这样的应用程序来完成所有工作时,学生甚至不会去检查自己交的是什么。eCq品论天涯网

去年,犹他大学政治学教授JoshMcCrain给学生布置了一份写作作业,作业要求插入了难以辨认的小文字,其中提到了和作业无关的蝙蝠侠。eCq品论天涯网


eCq品论天涯网

如果他们将作业复制并粘贴到人工智能中,作业提示内容就会被合并,“蝙蝠侠”就会干扰作业内容。eCq品论天涯网

果然,少数学生提交了作业——一篇蝙蝠侠论文。eCq品论天涯网

McCrain教授正在调整写作作业,更多地关注人工智能不太熟悉的时事,并恳求学生不要将他们的工作外包给人工智能。eCq品论天涯网

“这就是我试图向学生们强调这一点的地方:你需要自己学习这些东西。”McCrain教授说。eCq品论天涯网

争论不休eCq品论天涯网

知情人士称,有关水印工具的讨论早在OpenAI于2022年11月推出ChatGPT之前就已经开始。eCq品论天涯网

它是由计算机科学教授ScottAaronson开发的,过去两年他在德克萨斯大学休假期间一直在OpenAI从事安全工作。eCq品论天涯网


eCq品论天涯网

2023年初,OpenAI联合创始人之一JohnSchulman在一份共享的Google文档中概述了该工具的优缺点。eCq品论天涯网

OpenAI高管随后决定,在采取进一步行动之前,他们将征求一系列人士的意见。eCq品论天涯网

在接下来的一年半时间里,OpenAI高管反复讨论,并寻求新数据集优化算法,犹豫是否发布该技术。eCq品论天涯网

内部文件显示,2023年4月,OpenAI委托进行了一项调查,结果显示,世界范围的人们以四比一的比例支持人工智能检测工具的想法。eCq品论天涯网

同月,OpenAI对ChatGPT用户进行了调查,发现69%的人认为作弊检测技术会导致使AI技术错误指控。eCq品论天涯网

近30%的人表示,如果ChatGPT部署了水印功能,而竞争对手没有部署水印,他们会减少使用。eCq品论天涯网

另外,OpenAI内部还有一种反对的声音是反作弊工具可能会损害ChatGPT的写作质量。eCq品论天涯网

知情人士称,OpenAI今年早些时候进行了一项测试,发现文本水印不会降低输出质量。eCq品论天涯网

6月初,OpenAI高级员工和研究人员再次聚会讨论该项目。该组织一致认为水印技术效果良好,但去年的ChatGPT用户调查结果仍然是一个头疼的问题。eCq品论天涯网

内部文件显示,OpenAI需要在今年秋天之前制定一项计划,围绕AI透明度以及相关潜在新法律来左右公众舆论——eCq品论天涯网

“如果做不到这一点,我们就有可能失去负责任企业的信誉。”eCq品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]