鉴别ChatGPT回复的真伪——AIGC自动化编程(08)

发表于:2023-10-25 09:37

字体: | 上一篇 | 下一篇 | 我要投稿

 作者:李宁    来源:51Testing软件测试网原创

#
AI
  1.10  鉴别ChatGPT回复的真伪
  1.10.1  重要的问题问3遍
  因为ChatGPT每次的回答都不同,所以可以利用ChatGPT的这个特性,向ChatGPT多次提出同一个问题。如果提问3次或以上,ChatGPT的回复大体意思都相同,那么说明ChatGPT的回复的正确率就会非常高;如果多次提问ChatGPT同一个问题,ChatGPT的每次回答都差别很大,有的意思甚至完全相反,就说明ChatGPT的回复很有可能是错误的。但要注意,每次提问同一个问题时,要开启新的会话,这是因为ChatGPT有上下文记忆功能,如果在同一个会话中多次问同样的问题,ChatGPT可能会在上下文的影响下每次的回答都类似,即使这个回答是错误的。
  示例如下。
  武则天是哪一年登基做皇帝的?登基那一年的年号是什么?只回答我问的问题,不要回答多余的内容。
  武则天于690年登基做皇帝,那一年的年号是天授。
  如果在ChatGPT的不同会话中问以上问题,得到的回复都是690年,以及“天授”,那么说明ChatGPT回答的是正确的。因为ChatGPT不可能每次胡说八道,并且在没有上下文的情况下都一样。
  1.10.2  交叉验证
  利用多个生成式AI系统互相验证(也称为交叉验证),也是一个非常好的验证回复真伪的好方法。这里的交叉验证有如下两种方法。
  在一个生成式AI系统中提问和接收回复,然后在其他生成式AI系统中验证这个回复。如果其他生成式AI系统认为这个描述是正确的,或基本正确,那么这个回复准确率会非常高。
  在多个生成式AI系统中问同一个问题,如果这些生成式AI的回复都差不多,那么说明这个回复基本是准确的。
  由于不同生成式AI系统的训练数据、模型算法都不相同,因此如果多个生成式AI系统的回复基本相同,或者它们互相认可对方的回复,那么不太可能胡说八道。这就像在审问不同的犯罪嫌疑人,在这些犯罪嫌疑人没有串供的前提下,就算胡说八道,也不可能说得完全一样。当然,由于训练模型的数据来自互联网,因此如果互联网上的数据本来就是错的,那么不同生成式AI系统有可能会输出相同的错误回复。
  示例如下。
  将1.10.1节中问题的回复放到New Bing和Claude中进行验证,会得到如图1-26和图1-27所示的回复。
图1-26  New Bing的验证结果
图1-27  Clause的验证结果

  图1-28与图1-29是分别向New Bing和Claude提问同一个问题的回复。
图1-28  New Bing的回复
图1-29  Claude的回复
  我们可以看到,两种交叉验证方式都通过了,说明这个回复基本上是准确的。如果读者还不相信这个回复,可以从New Bing的回复结果获得出处的链接,并做进一步的验证。
  1.11  小结
  详细读完这章的读者一定心潮澎湃,原来ChatGPT有这么多功能和使用技巧。其实,这只是冰山的一角,本章只是概述,并没有涉及ChatGPT在各个领域的应用。本书后面的章节将彻底揭开ChatGPT的面纱,而在面纱下面的是比宝藏还珍贵的东西,那就是力量—智慧的力量。
版权声明:51Testing软件测试网获得作者授权连载本书部分章节。
任何个人或单位未获得明确的书面许可,不得对本文内容复制、转载或进行镜像,否则将追究法律责
《2023软件测试行业现状调查报告》独家发布~

关注51Testing

联系我们

快捷面板 站点地图 联系我们 广告服务 关于我们 站长统计 发展历程

法律顾问:上海兰迪律师事务所 项棋律师
版权所有 上海博为峰软件技术股份有限公司 Copyright©51testing.com 2003-2024
投诉及意见反馈:webmaster@51testing.com; 业务联系:service@51testing.com 021-64471599-8017

沪ICP备05003035号

沪公网安备 31010102002173号