关闭

人工智能聊天机器人的创造力超越人类平均水平

发表于:2023-9-19 09:22

字体: | 上一篇 | 下一篇 | 我要投稿

 作者:cnBeta    来源:今日头条

  最近发表在《科学报告》杂志上的一项研究表明,大型语言模型 (LLM) 人工智能聊天机器人在创造性任务中可能超越普通人类,例如集思广益常见物品的替代用途——这反映了发散性思维。 然而,在这些任务中得分最高的个人仍然超过了表现最好的聊天机器人的结果。
  发散思维是一种通常与创造力联系在一起的思维过程,强调针对特定任务产生许多不同的想法或解决方案。
  它通常通过替代用途任务(AUT)进行评估,其中要求参与者在短时间内想出尽可能多的日常物品的替代用途。 回答分为四个不同的类别:流畅性、灵活性、原创性和详尽性。
  Mika Koivisto 和 Simone Grassini 将 256 名人类参与者的反应与三个 AI 聊天机器人(ChatGPT3、ChatGPT4 和 Copy.Ai)的反应进行了比较,并对四种物体(一根绳子、一个盒子、一支铅笔和一支蜡烛)的 AUT 做出了反应。 作者通过对语义距离(响应与对象原始用途的相关程度)和创造力进行评级来评估响应的原创性。
  使用计算方法以 0 到 2 的范围来量化语义距离,而人类评估者对响应的发起者视而不见,主观地对创造力进行 1 到 5 的评分。平均而言,聊天机器人生成的响应得分明显高于 人类对语义距离(0.95 vs. 0.91)和创造力(2.91 vs. 2.47)的反应。
  人类的反应在这两项指标上都有更大的范围——最低分数远低于人工智能的反应,但最高分数通常更高。 在八个评分类别中的七个中,人类的最佳反应优于每个聊天机器人的最佳反应。
  这些发现表明,人工智能聊天机器人现在至少可以像普通人一样产生创意。 然而,作者指出,他们只考虑了与创造力评估相关的单个任务的表现。 作者提出,未来的研究可以探索如何将人工智能整合到创意过程中,以提高人类的表现。
  你是否对AI技术感兴趣,想通过掌握AI技术高效完成测试工作?现在私聊恬恬圈/甜甜圈,或识别下方二维码,添加天天圈,回复“AI”,了解更多关于AI的内容↓↓↓
  本文内容不用于商业目的,如涉及知识产权问题,请权利人联系51Testing小编(021-64471599-8017),我们将立即处理
《2023软件测试行业现状调查报告》独家发布~

关注51Testing

联系我们

快捷面板 站点地图 联系我们 广告服务 关于我们 站长统计 发展历程

法律顾问:上海兰迪律师事务所 项棋律师
版权所有 上海博为峰软件技术股份有限公司 Copyright©51testing.com 2003-2024
投诉及意见反馈:webmaster@51testing.com; 业务联系:service@51testing.com 021-64471599-8017

沪ICP备05003035号

沪公网安备 31010102002173号