ChatGPT-4在创造力测试中表现不俗

科技日报北京3月3日电 美国阿肯色大学科学家开展了一项最新研究,让151名人类参与者与人工智能(AI)工具ChatGPT-4在3项测试中进行对决,以评估二者的发散思维。结果显示,AI的表现优于人类。相关论文发表于最新一期《科学报告》杂志。



发散思维是创造性思维的衡量指标,其特点是能对没有预期解决方案的问题提出独特的答案。在最新研究中,GPT-4提供了比人类参与者更新颖、更精细的答案。


最新研究使用的3项测试分别是“替代用途任务”“结果任务”及“发散联想任务”。“替代用途任务”要求参与者针对绳索或叉子等日常物品,提出创造性用途;“结果任务”要求参与者想象假设情况的可能结果,如人类不再需要睡眠会怎么办;“发散联想任务”则要求参与者提供10个语义上尽可能遥远的名词。“狗”和“猫”之间的语义距离不大,而“猫”和“本体论”等词之间的语义距离很大。


研究团队对人类和AI工具回答问题的数量、长度和单词间的语义差异进行了评估。结果发现,在每一项发散性思维任务上,GPT-4提供的答案都比人类提供的答案更具独创性,且更精确。换言之,在一整套发散性思维任务中,GPT-4都表现出了更高的创造力。


研究负责人之一、阿肯色大学心理学博士生肯特·休伯特表示,最新研究也有一些需要注意的地方,如研究中使用的指标都是对创造潜力的衡量,但参与创造性活动或获得成就是衡量创造能力的另一个方面。此外,AI依赖人类用户的帮助,除非得到提示,否则AI的创造力一直处于停滞状态。


尽管如此,研究团队强调,大型语言模型正在迅速发展,并以前所未有的方式超越人类。它们能否取代人类的创造力还有待观察。但不管怎样,让AI作为灵感工具,为人类的创造性活动提供帮助已是指日可待。


来源:人民网 记者:刘霞


责任编辑:栗蓝

(声明:请读者严格遵守所在地法律法规,本文不代表任何投资建议)

本文来源:元宇宙头条 文章作者:元宇宙头条
收藏
举报
元宇宙头条
累计发布内容523篇 累计总热度10万+
523篇 10万+
FTX 后院起火,Binance 釜底抽薪
FTX 后院起火,Binance 釜底抽薪
FTX 后院起火,Binance 釜底抽薪

元宇宙头条现已开放专栏入驻,详情请见入驻指南: #

免责声明:
1、本文版权归原作者所有,仅代表作者本人观点,不代表元宇宙头条观点或立场。
2、如发现文章、图片等侵权行为,侵权责任将由作者本人承担。

评论 共0条
默认
|
点赞
说点什么吧
相关文章
您需要登录后才可以回帖 立即登录

元宇宙头条
个人认证

下载APP

微信公众号