鉴别ChatGPT回复的真伪——AIGC自动化编程（08）

发表于：2023-10-25 09:37

作者：李宁来源：51Testing软件测试网原创

　　1.10 鉴别ChatGPT回复的真伪

　　1.10.1 重要的问题问3遍

　　因为ChatGPT每次的回答都不同，所以可以利用ChatGPT的这个特性，向ChatGPT多次提出同一个问题。如果提问3次或以上，ChatGPT的回复大体意思都相同，那么说明ChatGPT的回复的正确率就会非常高；如果多次提问ChatGPT同一个问题，ChatGPT的每次回答都差别很大，有的意思甚至完全相反，就说明ChatGPT的回复很有可能是错误的。但要注意，每次提问同一个问题时，要开启新的会话，这是因为ChatGPT有上下文记忆功能，如果在同一个会话中多次问同样的问题，ChatGPT可能会在上下文的影响下每次的回答都类似，即使这个回答是错误的。

　　示例如下。

　　武则天是哪一年登基做皇帝的？登基那一年的年号是什么？只回答我问的问题，不要回答多余的内容。

　　武则天于690年登基做皇帝，那一年的年号是天授。

　　如果在ChatGPT的不同会话中问以上问题，得到的回复都是690年，以及“天授”，那么说明ChatGPT回答的是正确的。因为ChatGPT不可能每次胡说八道，并且在没有上下文的情况下都一样。

　　1.10.2 交叉验证

　　利用多个生成式AI系统互相验证（也称为交叉验证），也是一个非常好的验证回复真伪的好方法。这里的交叉验证有如下两种方法。

　　在一个生成式AI系统中提问和接收回复，然后在其他生成式AI系统中验证这个回复。如果其他生成式AI系统认为这个描述是正确的，或基本正确，那么这个回复准确率会非常高。

　　在多个生成式AI系统中问同一个问题，如果这些生成式AI的回复都差不多，那么说明这个回复基本是准确的。

　　由于不同生成式AI系统的训练数据、模型算法都不相同，因此如果多个生成式AI系统的回复基本相同，或者它们互相认可对方的回复，那么不太可能胡说八道。这就像在审问不同的犯罪嫌疑人，在这些犯罪嫌疑人没有串供的前提下，就算胡说八道，也不可能说得完全一样。当然，由于训练模型的数据来自互联网，因此如果互联网上的数据本来就是错的，那么不同生成式AI系统有可能会输出相同的错误回复。

　　示例如下。

　　将1.10.1节中问题的回复放到New Bing和Claude中进行验证，会得到如图1-26和图1-27所示的回复。