89%美国大学生竟用ChatGPT写作业纽约大学教授警告：用AI就是剽窃-品论天涯网

调查发现，89%的美国大学生已经在用ChatGPT写作业了，而其中的72%也同时支持封杀。对此，老师们的态度倒是褒贬不一，值得玩味。ChatGPT诞生才两个月，但它给全世界投下的‘重磅炸弹’就没停下来过。DyK品论天涯网

虽然在很多学校，老师们防ChatGPT如洪水猛兽，却还是屡禁不止。DyK品论天涯网

一项调查显示，现在美国89%的大学生都是用ChatGPT做作业的。DyK品论天涯网

89%的学生用ChatGPT做作业DyK品论天涯网

89%？没错，甚至，真实的比例更高。DyK品论天涯网

虽然此前，纽约的教育系统全面封杀了ChatGPT，但凭学生们的聪明才智，怎么可能真正把它禁掉呢？DyK品论天涯网

果然，现在教育工作者们不得不直面现实：学生们已经在用ChatGPT肆无忌惮地作弊了。DyK品论天涯网

比如，北密歇根大学哲学教授AntonyAumann在为自己的世界宗教课评分时发现，全班第一的论文竟然是用ChatGPT写的。DyK品论天涯网

DyK品论天涯网

在线课程供应商Study.com向1，000名18岁以上的学生中发起一项调查，询问了他们在课堂上使用ChatGPT的情况。DyK品论天涯网

结果显示——DyK品论天涯网

每10个学生中就有超过9个知道ChatGPT，远远超过小学教育工作者DyK品论天涯网

超过89%的学生使用ChatGPT来完成家庭作业DyK品论天涯网

48%的学生用ChatGPT完成小测验，53%的学生用ChatGPT写论文，22%的学生用ChatGPT生成论文大纲DyK品论天涯网

令人惊讶的是，72%的大学生认为ChatGPT应该在大学网络中被禁DyK品论天涯网

这些高得惊人的数据，令我们不得不正视这个现象：AI已经融入了人类的社会结构，且产生了广泛而深远的后果。DyK品论天涯网

有趣的是，虽然有将近90%的学生在家里用ChatGPT做作业，但也有将近四分之三的学生希望ChatGPT在学校被禁。DyK品论天涯网

也就是说，不患寡而患不均，无论是在哪个场景，学生们都希望站在同一起跑线上。DyK品论天涯网

要么大家一起用，要么就都不用。DyK品论天涯网

老师们怎么看？DyK品论天涯网

同时，Study.com也调查了100多名教育工作者，以便深入了解他们对ChatGPT的感受。DyK品论天涯网

了解ChatGPT的大学教授中有72%担心它对作弊的影响，而小学教育工作者中这一比例为58%DyK品论天涯网

超过三分之一（34%）的教育工作者认为ChatGPT应该在学校中被禁，剩下66%的则支持学生使用DyK品论天涯网

看来，老师们远比我们想象得开明。那么他们打算如何使用ChatGPT呢？DyK品论天涯网

根据Study.com的调查，已经有21%的老师开始用ChatGPT辅助教学工作了——DyK品论天涯网

7%使用ChatGPT提供写作提示DyK品论天涯网

5%使用ChatGPT来帮助授课DyK品论天涯网

4%使用ChatGPT来制定课程计划DyK品论天涯网

4%使用ChatGPT教授写作风格DyK品论天涯网

3%使用ChatGPT作为数字导师DyK品论天涯网

可以看到，与我们的印象不同，参与调查的老师中，大部分人对于AI的态度是相对开明的，66%的人认为ChatGPT可以作为帮助学生的资源。DyK品论天涯网

与之相比，反倒是学生们自己的信任度要低得多，高达72%的人认为ChatGPT在学校里应该被禁。DyK品论天涯网

在整个人类历史上，一项新事物的诞生，往往伴随着诸多争议。DyK品论天涯网

很显然，面对ChatGPT这个诞生两个月的‘新生儿’，教师团队内部也并没有统一意见。DyK品论天涯网

其中一部分教师，对于学生使用ChatGPT的态度非常鲜明——就是纯纯的作弊！DyK品论天涯网

纽约大学教授：要像避瘟神一样躲开ChatGPT！DyK品论天涯网

这几天，美国的很多学校开学了，师生中最热门的话题，无疑就是ChatGPT。DyK品论天涯网

在纽约大学，教学大纲的‘学术诚信’部分已经明确把使用AI视为作弊行为，明令禁止。DyK品论天涯网

此外，学生们在上课第一天也收到了教授的警告。DyK品论天涯网

DyK品论天涯网

在纽约大学Tisch艺术学院的一堂课上，教授在教学大纲上直截了当地写道——DyK品论天涯网

‘问：使用ChatGPT或其他生成文本或内容的AI工具是否视为作弊？答：是的。’DyK品论天涯网

即使在不需要写论文的课上，教授也提出了ChatGPT警告。DyK品论天涯网

一份宏观经济学教学大纲这样写道：‘我们刻意把时间限制得很紧，所以你不可能有时间查阅书籍、ChatGPT或其他资源，同时还能完成测试。在测验的24小时中，学生不得与任何人（包括ChatGPT）交流。’DyK品论天涯网

DyK品论天涯网

当然，众所周知ChatGPT面对数学题时常犯蠢，因此数学系的教授们倒是免了这一层担忧。DyK品论天涯网

DyK品论天涯网

纽约大学文理学院副院长JenniQuilter表示，现在教授们都在担心学生会使用ChatGPT作弊。DyK品论天涯网

据Quilter介绍，早在12月，就有学生使用ChatGPT的事件发生。DyK品论天涯网

‘在未经允许的情况下使用ChatGPT，后果等同于任何学术剽窃事件，处理结果包括重做作业、扣分、写检查。’DyK品论天涯网

纽约大学古典学教授DavidLevene表示，他正在密切关注所有与ChatGTP相关的剽窃行为。DyK品论天涯网

‘我已经明确警告学生，除非有我的许可，否则无论以任何形式使用ChatGPT，都是作弊。’DyK品论天涯网

‘我还跟他们说，我已经试过用ChatGPT写论文，它的最好成绩是B-，最差是F。所以如果他们想得到比B-更高的成绩，就应该像避瘟神一样避开它！’DyK品论天涯网

纽约大学教授们的担心并非杞人忧天。DyK品论天涯网

根据斯坦福日报进行的一项调查，17%的学生曾使用ChatGPT来完成秋季学期的作业和考试。DyK品论天涯网

不过，比起Study.com的89%和48%，斯坦福这边的比例显然要低了很多。DyK品论天涯网

DyK品论天涯网

AI会让学生‘大脑萎缩’？DyK品论天涯网

很多教授在担心，AI聊天机器人会对教育产生灾难性影响。DyK品论天涯网

‘仅仅因为有一台机器可以帮助我举起哑铃，并不意味着我的肌肉就会发达，’西华盛顿大学历史学教授JohannNeem接受《华尔街日报》采访时说。DyK品论天涯网

‘同样地，有一台可以写论文的机器并不意味着我的思维就会发展。’DyK品论天涯网

但其他教授认为，应该利用ChatGPT强大的技术，让学生为新的现实做好准备。DyK品论天涯网

韦伯州立大学教授AlexLawrence表示：‘我希望它能给你足够的启发和教育，让你想要学习如何利用这些工具，而不仅仅是学会更好地作弊。’DyK品论天涯网

而宾夕法尼亚大学的EthanMollick说，他希望自己文学系的学生能够利用技术‘写得更多’和‘写得更好’。DyK品论天涯网

‘ChatGPT是写作的力量倍增器，’Mollick补充道。‘我希望他们使用它。’DyK品论天涯网

Google可以，ChatGPT就不行？DyK品论天涯网

虽然引发了学术诚信的风暴，但许多专家认为，这项技术只是一个新学习时代的开始——AI写作工具是学习的未来。DyK品论天涯网

迪肯大学数字研究中心主任PhillipDawson表示：‘我认为这是人类能力提升的一个重大时刻。’DyK品论天涯网

DyK品论天涯网

‘在我看来，五年后毕业的学生比现在的学生能做的事情要多得多，因为他们有这些AI工具。’DyK品论天涯网

他把写论文的学生与驾驶现代飞机的飞行员做了类比。‘是的，你必须学会使用所有的仪器，你需要知道这些仪器是如何工作的，但你也需要在仪器出现故障时驾驶飞机。’DyK品论天涯网

阿德莱德大学计算机与数学学院讲师CherylPope博士表示，ChatGPT非常适合编写初稿，但无法取代人工编辑和事实核查的需求。‘你需要理解这个话题，才能评论它产生的答案。’DyK品论天涯网

ChatGPT能让你走出几步，但不能让你获得高分。但它的可能性让人兴奋，能让我们走向更高的标准。就像我们对两个小时的笔试和两个月写出的论文有不同的期待。DyK品论天涯网

还有一个原因是，获得帮助需要大量的社会资源。DyK品论天涯网

问别人一个蠢问题，会让人很羞愧，但是面对AI，我们永远不会有这样的担心。DyK品论天涯网

斯坦福最强检测器：DetectGPTDyK品论天涯网

有攻就有防，能为老师们解忧的AI作弊检测工具，也火速诞生了。DyK品论天涯网

最近，来自斯坦福大学的研究团队就提出了一种用于检测AI生成文本的全新方法——DetectGPT。DyK品论天涯网

概括来说：DyK品论天涯网

DetectGPT通过利用模型的对数概率函数的局部曲率（由LLM生成的往往占据负曲率区域），来检测文本是否出自预训练语言模型。DyK品论天涯网

DetectGPT只使用兴趣模型计算出的对数概率和来自另一个通用预训练语言模型（如T5）的随机扰动，无需训练单独的分类器，收集真实或生成的段落数据集，或给生成文本加水印。DyK品论天涯网

DetectGPT的检测效果比现有的零样本（zero-shot）方法更好，特别是将20B参数GPT-NeoX生成的假新闻的检测率从0.81AUROC提高到了0.95AUROC。DyK品论天涯网

DyK品论天涯网

论文地址：https：//arxiv.org/abs/2301.11305DyK品论天涯网

我们可以观察到，机器生成的文本（左）有位于对数负曲率区域的趋势，而附近的样本平均具有较低的模型对数概率。DyK品论天涯网

相比之下，人类的文本（右）则不会明显占据负对数概率曲率区域。DyK品论天涯网

DyK品论天涯网

接下来，想要确定一段文字是否由一个特定的LLM产生，如GPT-3。DyK品论天涯网

首先需要DetectGPT使用一个通用的预训练模型（如T5）对该段落产生轻微的扰动。然后再让DetectGPT比较原始样本与每个扰动样本的对数概率。DyK品论天涯网

如果平均对数比很高，则该样本很可能来自源模型。DyK品论天涯网

DyK品论天涯网

具体的测试结果如下：DyK品论天涯网

DyK品论天涯网

此外，经过真实和生成文本的大型数据集训练的有监督检测模型，在分布式文本上的表现与DetectGPT一样，甚至更好。（上）DyK品论天涯网

然而，对于新的领域，如PubMed医学文本和来自WMT16的德国新闻数据，zero-shot是开箱即用的，而有监督的检测方法则会由于过度的分布偏移而垮掉。（下）DyK品论天涯网

DyK品论天涯网

不过，DetectGPT自身也存在着明显的限制。DyK品论天涯网

首先，DetectGPT基于的是白盒假设，即我们可以评估有关模型的对数概率。对于那些API背后的模型（如GPT-3），评估概率还需要花钱。DyK品论天涯网

其次，DetectGPT需要获得一个合理的扰动函数。虽然在这项工作中，作者使用了现成的掩码模型，如T5和mT5（用于非英语语言），但如果现有的模型不能很好地对空间进行表征，那么DetectGPT在一些领域的性能就可能会降低。DyK品论天涯网

最后，DetectGPT比其他检测方法的计算量更大，因为它需要对每个候选段落的扰动集进行抽样和评分，而不是仅仅对候选段落进行评分。DyK品论天涯网

虽然DetectGPT现阶段还没开放，但问题不大。DyK品论天涯网

毕竟，市面上还有很多工具可以直接使用。DyK品论天涯网

尤其是GPTZero，不仅免费，而且效果拔群。DyK品论天涯网

小编亲测发现，最新版本的GPTZero甚至可以明确地指出一段文字中，哪段是AI生成的，哪段是人类写的。DyK品论天涯网

DyK品论天涯网

原理上，GPTZero主要靠‘困惑度’（文本的随机性）和‘突发性’（困惑度的变化）作为指标进行判断。DyK品论天涯网

在每次测试中，GPTZero还会挑选出困惑度最高的那个句子，也就是AI写出的最像人话的句子。DyK品论天涯网

DyK品论天涯网

89%美国大学生竟用ChatGPT写作业 纽约大学教授警告：用AI就是剽窃

89%美国大学生竟用ChatGPT写作业纽约大学教授警告：用AI就是剽窃