🔀 ChatGPT与人类思维的差异
引言
在上一次关于ChatGPT是怎么被训练出来的?的文章里,我介绍了以ChatGPT为代表的大多数LLM(大型语言模型)被训练出来的过程,这个过程本身的特性已经把ChatGPT本身的优劣势很清晰地展 现出来了。在这篇文章里我再进一步讲解人类的思维模式和LLM之间的差异,同时说明如何弥补LLM的“思维缺陷”从而让它更好的完成人类的任务。这期内容的大部分观点来源于OpenAI联合创始人Andrej Karpathy的演讲,你也可以直接去看他的视频:Andrej的演讲点这里
我也做了个B站视频讲解本次文章的内容,你可以点这里前往。
人类思维VS ChatGPT思维
现在大多人使用ChatGPT的时候都很容易陷入两类误区,一种是觉得ChatGPT太牛叉了,它居然能这么丝滑地进行聊天,居然懂量子力学,还能跟我探讨哲学,我是不是可以把我所有的工作和学习的内容交给它,真的这么做的时候就会遇到很多困扰。还有一类是觉得ChatGPT就是一帮卖课的和搞互联网的在瞎鼓吹,明明我尝试过问他“鲁迅和周树人有什么分歧”他都不知道这俩是同一个人,问它类似于89x78这样的乘法,给的结果也不对,简直太垃圾了。
这两类觉得ChatGPT太牛叉和太蠢了其实属于同一类观点,都是盲人摸象,只了解的ChatGPT微小的特点就推及全部,觉得那是ChatGPT完整的特点了。这个思维的问题是,我们用人类一般具备的能力和常识去评价了解ChatGPT了,因为ChatGPT在跟人类对话过程中所表现出来的逻辑能力和表达能力都太像人了。
然而,ChatGPT并不是人。他的思维模式和他的优缺点都和人类存在巨大的差异。我们先来讲讲人的思维模式是什么样的。
人类思维示例-常识、反思、工具使用 假设你要写一个财经类的文章,因为某种原因,你要写这么一段话,“截 止6月28日,拼多多的市值是B站的xx倍”。
在写这个对话的时候,首先你会启动自己的反思能力,你知道要比较拼多多和B站的市值,还是最新的市值差异,估计没人写过这个准确的数据,所以最好的方式不是直接搜拼多多的市值是B站的多少倍,而是去找到拼多多和B站截止昨天分别的市值,再除一下。
接着,你知道自己的大脑里肯定没有这种数据,但是你知道雪球大概能查到这个数据,你上去查到了,截止昨天,拼多多的市值是932.8亿美元,B站的市值是63.6亿美元。
接下来你会把两者记一下,你知道你脑子里也不好一下算清楚932.8/63.6等于多少,所以你可以用个计算器算一下,发现是14.7倍。
这时候你可能会想拼多多居然比B站值钱这么多,你是没想到的,但是再确认一眼你的信息来源和数字,好像是对的。
然后你开始写这段话,“拼多多比B站股价贵13.7倍”。
你会实时反思不对这句话写得不准确,你重新调整自己的措辞,把时间限制加上去,把描述变得更准确,“截止6月28日,拼多多的市值是B站的14.7倍”。
这就是你写一下这么一句简单的话的时候可能会经历的一系列全过程,但是对ChatGPT来说,它就不是这样的,它只会是讲你输入的信息就行一层一层的关系分解,然后开始预测它自己下一个单词应该写什么会更准确,并且没写一个字的时候,都会再把它自己的写的那个字纳入进去思考,然后kua、kua、kua地不断产生下一个字,形成完整的句子。你可以从我上一期介绍ChatGPT是怎么被训练出来的视频去了解更深的ChatGPT的文本生成机制。
所以最终结果来说就是,人的思维过程和ChatGPT是有巨大的差异的。
prompt engineering(提示词工程)的本质就是去缝合这种差异,最大化地发挥ChatGPT的优 势,规避它的缺陷。
1、提供充足背景和知识
你知道自己不知道什么,但是ChatGPT是不知道自己不知道什么的,所以你在跟ChatGPT沟通的时候需要完整地把你的任务背景信息和你认为它需要的知识提供给他。
2、给ChatGPT提供工具武装
你知道自己不擅长什么,你会使用搜索引擎、计算器等工具帮自己完成任务,ChatGPT也是这样的。所以当你需要ChatGPT完成需要含2021年9月以后知识的任务时,你应该使用带web browsing的能让ChatGPT浏览网页的插件去完成任务。其他像是数学计算,或者阅读pdf文本,买机票之类的也是同理,你可能需要不同的plugins插件去让ChatGPT能使用对应工具。
3、允许ChatGPT回溯和反思
ChatGPT的生成机制导致它不能回溯发现自己的错误,但是你可以要求他回溯,比如在ChatGPT回答完问题之后,你问他你觉得自己的回答是准确的吗,有完成我的要求吗,是可以让它会成对自己回答的反思和分析的。