人工智能

宾大最新研究:AI产生创意的效率比人类高7倍 GPT创意能力击败99%的人类

字号+作者: 来源:新智元 2023-08-13 16:05 评论(创建话题) 收藏成功收藏本文

很多人认为人工智能没有创新能力,但下面的研究将会改变这个“刻板印象”。从围棋到游戏,再到完成各种重复性的劳动,AI在很多方面的能力已经远超人类。很多'...

很多人认为人工智能没有创新能力,但下面的研究将会改变这个“刻板印象”从围棋到游戏,再到完成各种重复性的劳动,AI在很多方面的能力已经远超人类。很多人已经在畅想,未来AI将人类从无聊的工作中解放出来,让人类能专注于只有人类才能完成的工作上。YFa品论天涯网

比如和人类之间的情感交流,或者需要创造力的工作。YFa品论天涯网

但是最近已经有不少研究证实,AI对于人类情感的感受和表达,比很多人做得都要好。YFa品论天涯网

同样的,创造力这个事情,AI似乎也不比人类差。YFa品论天涯网

最近,人机交互专家雅各布尼尔森(JakobNielsen)写了一篇专栏文章,用3个最近的科学研究和一篇由ChatGPT创作的短文,向我们证明了:YFa品论天涯网

对于需要创造力的工作,也快没人类什么事了!YFa品论天涯网

01研究一:人工智能生成的顶尖产品创意比人类多7倍YFa品论天涯网

由康奈尔科技学院以及宾夕法尼亚大学沃顿商学院的研究人员共同完成的一个研究,将ChatGPT4与人类进行了比较,人类对照组是“就读于精英大学的学生”。YFa品论天涯网


YFa品论天涯网

尽管学生不是基于创造力被录取到“精英大学”的,但他们无疑至少部分是基于智商和学业表现被录取的。他们在几乎所有智力能力的衡量标准上很可能远远超过人口平均水平。YFa品论天涯网

学生数据是在2021年收集的,也就是在生成式AI广泛普及之前,因此可以认为数据在一定程度上就是纯粹的人类创造力的表现。YFa品论天涯网

因为,在不限制人类对照组禁止使用AI工具的情况下,对于人类与AI的研究将很快变得困难,因为任何聪明的学生都可能会在类似的任务上使用AI工具。YFa品论天涯网

研究者给学生和AI同时布置一个任务:YFa品论天涯网

“您是一位寻求创新创业的企业家,希望产生新的产品创意。该产品面向美国的大学生。它应该是一个实物商品,而不是服务或软件。YFa品论天涯网

这个产品的零售价格能够低于约50美元。产品不一定需要已经存在,也不一定必须明确可用。”YFa品论天涯网

这个过程类似于在现实的公司中产生新的产品的创意流程,因为研究人员不希望限制产品的原始创意。YFa品论天涯网

实际上,一开始看似不可能实现的想法往往在工程师们思考过后,也许都能被生产出来,最终可能取得巨大的商业成功。YFa品论天涯网

在对头脑风暴结果进行简单的微调之后,研究人员首先让人工智能独立生成了100个创意,然后向其展示了一些好创意的样本,之后它再生成了100个创意。YFa品论天涯网

研究的第一个发现是,人工智能在生成创意方面比人类效率高得多。ChatGPT在15分钟内生成了200个产品创意,而人类平均表现是在同样时间内产生5个同水平的创意。YFa品论天涯网

换句话说,ChatGPT在生成创意方面比人类高效40倍,性能提升了3900%。YFa品论天涯网

但是对于产品创意而言,创意的数量远不及质量重要。毕竟,不好的创意都是没用的。YFa品论天涯网

研究人员通过让20名人类评委评估每个创意来衡量创意的质量,评委会评估他们购买该创意描述的产品的兴趣有多大。YFa品论天涯网

根据评委的购买意向,研究者让他们在0-1之间评分,人类生成的产品创意得分为0.40。而ChatGPT的创意得分分别为0.47(独立生成的创意)和0.49(在展示了优秀案例之后生成的创意)。YFa品论天涯网


YFa品论天涯网

AI与人类之间的差异是显著的(p<0.001),而两个AI得分的差异却不明显。YFa品论天涯网

但就像上面讨论过的,平均创意质量得分不重要,大多数不好或中等的创意其实是没有价值的。YFa品论天涯网

因此,更重要的是考虑好的创意(在这里定义为前10%)和最好的创意质量(在真实商业环境中可能成为实际产品的创意)。YFa品论天涯网

以下是最佳创意中的分数:YFa品论天涯网

人类:前十分之一的平均分为0.62,最好创意的分数为0.64YFa品论天涯网

未看到好创意示例的ChatGPT:前十分之一的平均分为0.64,最好创意的分数为0.70YFa品论天涯网

看过好创意示例的ChatGPT:前十分之一的平均分为0.66,最好创意的分数为0.75YFa品论天涯网


YFa品论天涯网

在这个评价标准之下,AI与人类之间的差异同样是很明显的(p<0.001),而两个AI分数之间的差异则依然不明显。YFa品论天涯网

从另一个角度来看数据,如果只看整个创意池的前10%,无论是人类还是人工智能生成的创意,87.5%的最佳创意来自ChatGPT,只有12.5%来自大学生。YFa品论天涯网

两个群体都贡献了相同数量的原始创意,因此这个百分比差异是非常显著的。YFa品论天涯网

在这项数据分析中,AI的创造力是人类的7倍!YFa品论天涯网

新颖性上人类稍胜一筹YFa品论天涯网

对产品创意另一个衡量标准是新颖性。足够新颖的产品可能一开始看起来并不吸引人,只有在市场上一段时间后,消费者才会意识到这些革命性创意的好处。YFa品论天涯网

创意新颖性是人类在这项创造力研究中的唯一做得比AI好的地方。YFa品论天涯网

在0-1的评分尺度上,人类的平均创意新颖性得分为0.41,而AI的平均得分分别为0.37和0.36。YFa品论天涯网


YFa品论天涯网

同样,人类与人工智能之间的差异是明显,两个人工智能分数之间的差异则不明显。YFa品论天涯网

02研究二:ChatGPT4在托伦斯创造性思维测试中得分排名前1%,击败99%的人类YFa品论天涯网

另一个研究是由蒙大拿大学、维尔纽斯大学和蒙大拿大学西部分校的研究人员完成的。YFa品论天涯网

他们采用了托伦斯创造性思维测试(TTCT),这是使用最广泛、引用最广泛的创造力测试。我们之前的文章对这个研究做了比较详细的介绍。YFa品论天涯网

03研究三:头脑风暴商业策略研究YFa品论天涯网

同样,ChatGPT在商业战略上地表现也十分惊艳。YFa品论天涯网

来自意大利的CapgeminiInvent公司在《哈佛商业评论》上发表了一篇使用ChatGPT作为商业合作伙伴的案例研究,并将其作为相关方面的专家给出的建议和规划整理成了一本书。YFa品论天涯网


YFa品论天涯网

链接地址:https://www.hbritalia.it/userUpload/ebook_Generative_AI_inglese.pdfYFa品论天涯网

研究人员将商业战略划分为了5个维度:YFa品论天涯网

价值创新、成长规划与实践、生态系统平台和商业、联合多方利益相关者、开放创新。YFa品论天涯网

然后让GPT-4分别针对每个领域进行单独回答,即作为“垂直领域”的专家。YFa品论天涯网


YFa品论天涯网

首先是在价值创新方面,ChatGPT从生成式AI增强现有业务和颠覆当前商业战略理论的两个角度进行了回答。YFa品论天涯网


YFa品论天涯网

ChatGPT在解答如何增强现有业务的回答中包含了AI增强竞争的格局分析、创意生成与验证、动态和协同业务建模等要点。YFa品论天涯网


YFa品论天涯网

这意味着生成式Al可以使用历史数据、市场趋势和客户信息来促进创意生成会话。它还可以帮助快速进行调查和收集反馈,以验证和完善新的战略思想。YFa品论天涯网

此外,ChatGPT还从颠覆当前商业战略理论的角度提出了:指数级技术的整合、开放性和共同创造以及拥抱生态系统思维等。YFa品论天涯网

这一过程中,人的角色从内容的生产者变为了评估和进行选择的决策者。YFa品论天涯网


YFa品论天涯网

而对于企业最关心的自身成长规划和实践方面,ChatGPT的表现也相当不俗。YFa品论天涯网


YFa品论天涯网

在生成式AI强化现有业务的建议中,ChatGPT提出AI算法可以自主地基于大量数据和洞察力生成多样化的假设。同时提供有效的实验设计建议,并通过模拟用户反馈进行验证。这些措施能够最大程度地加速企业的发展并降低成本。YFa品论天涯网


YFa品论天涯网

而在颠覆性的创新角度中,ChatGPT直接将AI作为项目的规划者,取代人类领导者。YFa品论天涯网

还使用量子计算的威力同时探索所有的可能性,生成相应的前景假设,并在增强现实的环境中沉浸式地进行模拟测试。YFa品论天涯网


YFa品论天涯网

开放创新在商业中扮演着重要角色,能使企业更加开放、灵活地与外部合作,从而实现更高水平的创新和竞争力。YFa品论天涯网

ChatGPT在生成式AI对开放创新的理论实践产生的影响也做出了有趣的见解。YFa品论天涯网


YFa品论天涯网

在考虑利用生成式AI为开放创新的理论实践带来哪些帮助时,ChatGPT回答:生成式AI可以根据不同的标准分析潜在合作伙伴,从而促进发现和选择的过程。YFa品论天涯网

除此之外,生成式AI还能识别并推荐最具开放性的业务板块,并使用AI算法来促进创意的产生、评估以及协作。YFa品论天涯网


YFa品论天涯网

但从突破现有的理论和实践角度,ChatGPT认为可以建立一个由AI驱动的市场、智能映射创新生态系统,并创造一个基于人工智能算法的引擎,通过分析大量不同的数据产生跨领域的联系,从而推动创新发展。YFa品论天涯网


YFa品论天涯网

在其他维度,如生态系统平台和商业、联合多方利益相关者,ChatGPT的表现也同样亮眼。YFa品论天涯网


YFa品论天涯网

作为世界知名的企业战略顾问,EnricoSassoon对ChatGPT给出的策略和规划有极高的评价:YFa品论天涯网

“ChatGPT表现出了令人印象深刻的创造力,在某些情况下甚至比许多领域专家还要好。”YFa品论天涯网

然而,他也警告:YFa品论天涯网

“在评估响应和选择生成的项目时,拥有强大的领域专业知识并保持批判性至关重要。这是必要的,因为ChatGPT倾向于将有价值的见解与不太有价值的信息混合在一起。”YFa品论天涯网

04ChatGPT写了一个有趣的童话YFa品论天涯网

尼尔森在介绍完3个案例之后,还进行了一次有趣的实验。YFa品论天涯网


YFa品论天涯网

受这幅图启发,他让ChatGPT写一个关于“以为自己是黑斑羚的角马”的儿童故事。YFa品论天涯网

在作者尼尔森看来,这是一个迷人的故事,展现了完美的写作技巧。YFa品论天涯网

ChatGPT创作出了可爱的情节和转折,将一个简单的提示词转变为了许多孩子一定会很喜欢的短文。YFa品论天涯网


YFa品论天涯网

由Midjourney生成的角马YFa品论天涯网

从前,在非洲广袤的草原上,住着一只年轻的角马,名叫沃利。沃利并不是一只普通的角马;他与众不同,因为他认为自己是只瞪羚。YFa品论天涯网

每天早晨,沃利都会尝试像他邻居那样高高跳起。他羡慕它们光滑的毛皮和敏捷的速度。他甚至试着咀嚼叶子,就像它们一样,尽管他更喜欢草的味道。YFa品论天涯网

一个阳光明媚的日子,沃利决定加入黑斑羚群中去喝水。它们正在跳跃和嬉戏。沃利急切地尝试一次跳跃,但他没能优雅的跳起,而是踉跄着摔倒了,发出一声响亮的“砰”。YFa品论天涯网

黑斑羚们停下来看着它,感到困惑。“沃利,你为什么要像我们一样跳跃呢?”首领黑斑羚伊娜问道。YFa品论天涯网

沃利羞涩地说:“我想成为像你们一样的黑斑羚,因为你们优雅又快速。而我只是一只笨拙的角马。”YFa品论天涯网

伊娜温和地笑了笑。“沃利,你拥有一种我们黑斑羚没有的力量。你坚固而有韧性。你是一个庞大的兽群的一部分,一起团结前行,勇敢地穿越充满鳄鱼的河流。这是我们黑斑羚所做不到的。”YFa品论天涯网

沃利停下来,思考着伊娜的话。它意识到自己是特别的。拥抱自己的身份,沃利带着新的自信回到了它的兽群中。YFa品论天涯网

从那天起,沃利为成为一只角马感到自豪。它学会了喜欢自己的独特之处,并理解每个人都有自己的优点。而这,亲爱的朋友们,就是一只曾经想成为黑斑羚的角马的故事。YFa品论天涯网

05总结YFa品论天涯网

当不同研究机构的不同研究人员在使用不同方法,测量不同细节之后,得出相同的结果时,一定是让人赞叹的。YFa品论天涯网

这篇文章所呈现的综合研究比某些可能存在缺陷的单个研究都更具可信度。YFa品论天涯网

尼尔森相信人工智能具有创造力,而且应该用来加速创意的形成,无论是在他擅长的用户体验设计还是其他行业中。YFa品论天涯网

AI在创造性方面的贡献还包括能提升老年人的创造力,因为创意数量并不重要,而在于你如何选择最终的创意,以及你如何在改进它的过程中去具体地执行。YFa品论天涯网

我们将更多原始创意投入这个创意“香肠机”,最终的香肠就会更加美味。YFa品论天涯网

尼尔森认为无论读者是否认为这个比喻很有创意,这是他我老化的大脑原创的。但在过去的几个月里,他从人工智能那里获得了许多其他好的创意。YFa品论天涯网

承认人工智能在人类的工作中可以发挥的作用是很重要的。YFa品论天涯网

通过承担创意产生的繁重工作,它使人类能够专注于批判性思维和判断任务,延长人类的生产性职业生涯,过了50岁之后,认知下降会大大降低未经辅助的创造力,AI能提高整体的效率。YFa品论天涯网

他相信人类和人工智能之间存在共生关系。双方都有各自的角色可以发挥,在创造力方面也是如此。YFa品论天涯网

让我们在这个人工智能时代向前迈进,不是害怕自己已经过时了。YFa品论天涯网

请充满期待地迎接强大的AI与人类创造力之间的共生关系所带来的无限可能性。YFa品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]