1.10 鉴别ChatGPT回复的真伪
1.10.1 重要的问题问3遍
因为ChatGPT每次的回答都不同,所以可以利用ChatGPT的这个特性,向ChatGPT多次提出同一个问题。如果提问3次或以上,ChatGPT的回复大体意思都相同,那么说明ChatGPT的回复的正确率就会非常高;如果多次提问ChatGPT同一个问题,ChatGPT的每次回答都差别很大,有的意思甚至完全相反,就说明ChatGPT的回复很有可能是错误的。但要注意,每次提问同一个问题时,要开启新的会话,这是因为ChatGPT有上下文记忆功能,如果在同一个会话中多次问同样的问题,ChatGPT可能会在上下文的影响下每次的回答都类似,即使这个回答是错误的。
示例如下。
武则天是哪一年登基做皇帝的?登基那一年的年号是什么?只回答我问的问题,不要回答多余的内容。
武则天于690年登基做皇帝,那一年的年号是天授。
如果在ChatGPT的不同会话中问以上问题,得到的回复都是690年,以及“天授”,那么说明ChatGPT回答的是正确的。因为ChatGPT不可能每次胡说八道,并且在没有上下文的情况下都一样。
1.10.2 交叉验证
利用多个生成式AI系统互相验证(也称为交叉验证),也是一个非常好的验证回复真伪的好方法。这里的交叉验证有如下两种方法。
在一个生成式AI系统中提问和接收回复,然后在其他生成式AI系统中验证这个回复。如果其他生成式AI系统认为这个描述是正确的,或基本正确,那么这个回复准确率会非常高。
在多个生成式AI系统中问同一个问题,如果这些生成式AI的回复都差不多,那么说明这个回复基本是准确的。
由于不同生成式AI系统的训练数据、模型算法都不相同,因此如果多个生成式AI系统的回复基本相同,或者它们互相认可对方的回复,那么不太可能胡说八道。这就像在审问不同的犯罪嫌疑人,在这些犯罪嫌疑人没有串供的前提下,就算胡说八道,也不可能说得完全一样。当然,由于训练模型的数据来自互联网,因此如果互联网上的数据本来就是错的,那么不同生成式AI系统有可能会输出相同的错误回复。
示例如下。
将1.10.1节中问题的回复放到New Bing和Claude中进行验证,会得到如图1-26和图1-27所示的回复。
图1-26 New Bing的验证结果
图1-27 Clause的验证结果
图1-28与图1-29是分别向New Bing和Claude提问同一个问题的回复。
图1-28 New Bing的回复
图1-29 Claude的回复
我们可以看到,两种交叉验证方式都通过了,说明这个回复基本上是准确的。如果读者还不相信这个回复,可以从New Bing的回复结果获得出处的链接,并做进一步的验证。
1.11 小结
详细读完这章的读者一定心潮澎湃,原来ChatGPT有这么多功能和使用技巧。其实,这只是冰山的一角,本章只是概述,并没有涉及ChatGPT在各个领域的应用。本书后面的章节将彻底揭开ChatGPT的面纱,而在面纱下面的是比宝藏还珍贵的东西,那就是力量—智慧的力量。