AI和知识
作者:微信文章继续讨论如何克服对信息的上瘾。
前文中说互联网上的信息可以划分为存量信息和增量信息。我想如果可以把所有的存量信息汇总起来放在身边,是不是就不会对这些信息那么挂念了?
AI就是这样的一个工具。比如deepseek不联网模式就是一个单机程序,它所有的知识都保存在它的模型和参数里面。
deepseek等AI虽然不能包含人类所有的知识,但它的知识范围很广(虽然给出的答案可能是错误的),相当于互联网上所有存量信息的一个缩影。假想AI包含了互联网上所有的存量信息,这时如果找到了一种克服AI上瘾的方法,那么这个方法同样也适用于互联网上所有的存量信息。
我发现认识到AI可以本地部署,把所有的存量信息都放在身边还不够。我又做了一些其他的尝试。
一个方法是想象AI的运算过程。
用之前文章介绍的手摇发电的办法,想象电子电路每一步运算过程。现实中可以发明一种可调节运算频率的计算机,可随时降低或加快它的计算频率,并且把它每一步的运算用可见光展示出来。这样就可以随时让它变慢,看清它的每一步运算了。
另一个办法是想象如果把AI换成一个或多个人,他们能提供和AI相同的答案,是不是就不会那么想去问问题和获取答案了?
可以想象在没有电的世界里,所有的知识都保存在纸质书上,一群人负责提供任何问题的答案。他们中有的人精通某具体领域的知识,有的人负责总揽全局。当用户提问时,这些人可以互相交流,可以查阅所有的纸质书,最终给出答案。
还有个想法是假想自己对AI的提问命中了之前人工标注过的问题,AI给出的答案就是之前人的回答,那这时就和去问真人一样了。
还有个想法是思考为什么我小的时候对互联网不上瘾。
我大概从2001年开始上网,当时的互联网有几个大的门户网站(如sina、sohu等),上面有新闻和杂七杂八的知识,体量都不大,有点像杂志。还有很多小网站,专注于某一领域,上面也有很多知识(类似于现在的http://main.warstudy.com/index.html)。
现在的互联网和当时的区别是:现在大网站的功能更丰富,更吸引人(可认为每个App就是一个网站),用户大部分时间都花在大网站上,很少有人去看小网站。互联网的搜索功能变强了,想找什么都很容易。如果在2000年左右,想找的答案可能也在互联网上,但是通过搜索引擎查不到,如果自己在漫无边际的各种网站中搜寻,既浪费时间,又要过滤很多错误和虚假的信息。
所以,现在的互联网和2000年左右相比,也许不是包含的知识变多了,也不是包含的内容的质量提升了,而是有了更强的搜索和提炼工具。
假想AI是用2000年左右互联网上的资料训练出来的,因为训练资料是不让我上瘾的,我是不是对AI也就不上瘾了?可以想象训练过程是人在原始资料上划线,告诉AI哪些信息是正确的。
从互联网上有虚假和错误信息这点,我想到人类社会的知识很难说哪条是百分之百正确的。比如史书上记录的历史,只能说可信度比较高,不能说真实的历史一定是史书上这样的。
假如AI训练是用当前可以找到的所有的古今中外的资料,完美的AI给出的每条知识都应该带有这条知识正确的概率、原始资料的来源和推导它正确概率的过程,这样用户看答案时也能更客观。当前的AI不仅没有输出可信度的能力,它提供的很多答案本身就是错的。也许世界上有更强的AI,只是普通人接触不到。如果AI给的答案是它自己编的,那和我自己自问自答,我自己来编有什么区别呢?
人之所以使用AI和互联网是为了找到正确的知识。什么是正确的知识呢?相信的人多的知识就是正确的知识吗?
我想,正确的知识就是全社会的公识。对于一个问题,不同的人可能有截然相反的答案,但从全社会的角度看,每个问题都有一个相对一致的答案。
决定公识的不是书籍或程序,而是人。任何问题,能给它下定论并让人信服的一定是活着的人。
可以把AI的运算过程看作是对于任意问题,它定位到一个最权威的人,让他给出答案(他是可以查阅资料的)。
但是,全社会的公识也是在变化的。古代认为正确的东西,现在可能认为是错误的;现在认为正确的放在古代可能是错误的。未来人的公识和现在也会不一样。比如,二战有哪些著名战役,几千几万年后,这个问题的答案可能就和现在不一样。
很多事情可以推动公识的变化。比如对于小众的领域,公识可能就掌握在为数不多的专家的小圈子中。如果这些专家中大部分人突然死亡(比如发生交通事故),那这个领域的公识可能就会发生变化。在人类历史进程中,资料的遗失或发现、国家和信仰的灭亡、战争、科技的进步、疫情等,都会导致公识的变化。
当下,如果掌握搜索引擎的公司,想改变某个公识,可能真的有能力做到。想象它掌握了每个人的生活轨迹、内心活动和社会关系,再有针对性地改变每个人搜索出的答案。
同样的道理,如果使用AI的人足够多,AI也是有能力改变人类公识的,并且它可能不被它的训练者控制。
这样想,我就觉得我从AI那里获得的是变化中的公识。如果哪天公识变化了,那么变化前的是正确的还是变化后的是正确的呢?既然自己从AI那里得到的不一定是正确的,为什么还要去问它呢?
页:
[1]