本帖最后由 XXXXXXyce 于 2014-3-19 15:39 编辑 [align=left]这篇文章是我原来博客里的。。。现在直接搬运来~[/size][/align][align=left][hr]
[/size][/align][align=left]写在前面:这篇文章不完全是写给专业领域的人看的,用词会尽量避免术语,概念也会尽量浅显地解释,任何人只要有耐心读完,就一定有所收获[/size][/align][align=left]
[/size][/align][align=left]最近看到两篇有趣的文章,分别叫
“略谈人类与计算机的智能”和
“驳《略谈人类与计算机的智能》”,认真查看之后,结合自己之前的理解,也有了不少的感悟,不过可惜的是我个人所持有的意见与这两篇文章都有所出入,于是斗胆写下此文,诚望能够抛砖引玉。小弟技术尚不过关,阅历同样有限,若有论述不严谨、言语不精确、观点不恰当、引证不合理等问题,欢迎凶狠拍砖。[/size][/align][align=left]
[/size][/align]
关于“智能”一词在本文中的定义[align=left]俗(wo)话(xiang)说,“多数无意义的争论都来自于对相同词汇的不同主观定义”,所以在做正式的论述之前,我想应该明确一下自己的命名空间。智能这个词向来不存在(至少我没看到过)客观、普适、公认的准确定义。[/size][/align][align=left]
[/size][/align][align=left]我们可以以图灵测试(客观论述,无不敬之意)为标准来“人类沙文主义地”认为智能就是像人类一样思考、交互,拥有和人类完全无障碍的交流能力,人类的喜怒哀乐,人类的普世价值观,甚至像人类一样好战。[/size][/align][align=left]
[/size][/align][align=left]我们也可以以极端形而上的方式定义智能为“一切通过某种或某些机制与外界信息进行交互、反馈的稳定系统”,那样几乎任何物理系统都能够被认定为拥有智能,甚至我们也可以根据计算机与外界交互的能力以及人类不得不大量生产计算机来满足需求依赖这一事实来推断计算机是一种非自然诞生的、寄生性质的无性繁殖繁殖生命形式。[/size][/align][align=left]
[/size][/align][align=left]我个人来讲更倾向于在两种极端观点中取其中庸,我认为在人类看待机器的情况下,智能应当被分为三大要素:自主学习能力、分析推理能力和创造能力,对于机器而言,如果三种能力全都与人类相近,甚至超过人类,那么我就倾向于认为该机器具有智能。[/size][/align][align=left]
[/size][/align][align=left]这就是我在文中对于智能的定义,我觉得这是人类智能和机器智能中将会存在的最大交集,也可能是最有益交集。[/size][/align][align=left]
[/size][/align]
关于人类智能的工作原理[align=left]首先我想说的是,《略》一文中提出人类智能本身是基于逻辑的,这一点我完全无法苟同。[/size][/align][align=left]
[/size][/align][align=left]事实上,如果我们观察我们周围的人以及自己的行事方式,就能看到逻辑推理向来不是人类的本能——人们几乎每时每刻都在犯逻辑错误。[/size][/align][align=left]
[/size][/align][align=left]举几个简单的例子:[/size][/align][align=left]
[/size][/align][align=left]大多数人看到“小明是个素食主义者,他活了100多岁”这样的话,就会唏嘘素食主义的好处,但是这个句子事实上从逻辑结构上和“小明上过学,他活了100多岁”是一样的,只是对两个现象的并列描述,并无任何因果特征,但多数人无法不经过分析而从本能上看出这两个句子的相同逻辑关系。[/size][/align]
[align=left]以及,多数人分不清“充分条件”和“必要条件”,CCTV10的走进科学就深谙其道,试图揭露一个骗术或者原理来说明某个神秘的现象——而事实上走进科学揭露的骗术或者原理只是造成那些现象的充分条件,但是没有任何人能够证明所有的此类现象都是由这些骗术/原理造成的——如果人类生来就拥有逻辑思维本能,那么这种节目就很难存在了。[/size][/align][align=left]
[/size][/align][align=left]那么人类智能究竟是如何运行的呢?[/size][/align][align=left]
[/size][/align][align=left]让我们首先来看看人类认为很“愚蠢”的非人哺乳动物,来解答智能三要素之一——学习能力。[/size][/align][align=left]
[/size][/align][align=left]巴普洛夫曾经做过一个实验,每次给狗送食物以前打开红灯、响起铃声。这样经过一段时间以后,铃声一响或红灯一亮,狗就开始分泌唾液。[/size][/align][align=left]
[/size][/align][align=left]让我们仔细分析一下这个实验中的狗,看看它的学习过程中到底发生了什么[/size]。[/size][/align][align=left]
[/size][/align][align=left]首先,红灯亮起和铃声响起这样的事件在刚刚出现的时候属于随机事件,而食物降临这件事也属于随机事件。[/size][/align][align=left]
[/size][/align][align=left]然后狗的信息处理系统意识到这些随机事件之间互相并非独立事件,食物降临在灯/铃事件之后发生的条件概率大的反常——哦我不是说狗生来就会计算概率,我的意思只是狗的本能中有这种侦测反常条件概率的机制——这就造就了学习行为,这种基于概率的学习行为本质上是一种在时间尺度上的模式识别,这个我会在后文中提到。[/size][/align][align=left]
[/size][/align][align=left]学习行为的主要成分是对高先验概率的侦测这一事实还能够从人类一个有趣的行为中得以体现,这一行为就是地图炮。当一个群体A中来了一个新人,而这个新人是来自群体B的,那么这个人就会成为群体A中关于群体B的代表人。如果这个人作出了什么令人嗤之以鼻的行为,那么群体A就会对群体B的印象大打折扣。这背后的原因是,此时“人来自群体B”和“人作出恶事”之间存在100%的条件概率,如果群体A中再来一个来自B的“好人”,而且“好人”在群体A中有着与前者同样的影响力,那么就能够挽回一部分B的声誉——这一部分声誉就来自于这50%的条件概率。[/size][/align][align=left]
[/size][/align][align=left]再看人类牙牙学语的过程,在学习母语的初期,在孩子每次看到某个事物的时候,父母就会开始不断重复某一个词语。久而久之,孩子就会对这个词语的出现和这个事物的出现的高条件概率有所注意,并且试图模仿(这一行为我会在后文论述),之后学会各个形象性词语(人类学习母语时对抽象词汇的了解来源于比条件概率更加广义的一个定义——模式识别,这个也会在后文论述——读者现在应该已经无意中本能地注意到我喜欢在括号里面写“后文论述”这一高条件概率了)。[/size][/align][align=left]
[/size][/align][align=left]所以对于学习行为,无论人类还是机器,都可以有一种东西实现——模式识别(这本来就是机器学习的奥义嘛)——之前所说的条件概率实质上是固定模式在时间尺度上的表达。如果我们看到纸上写有12121212121这样一个数列,我们会毫不犹豫地认为下一个数字是2——而这绝不是逻辑的推论——如果我把横向书写这一空间维度转移到时间上,每次显示1之后显示2,再显示1,你同样会认为你知道下一个数字是什么。[/size][/align][align=left]
[/size][/align][align=left]这种模式识别也包含了人类语言中对抽象词汇的认知,当婴儿发现某一词汇与现实中任何存在的物体都不构成高条件概率时,仍然可以认知到这个词汇出现时环境——包括[/size]外在环境和内在环境(自身已存储的词汇库)——的模式,之后发现环境的模式而非环境本身与某个词汇之间的高条件概率,而学习过程中对事物的分类能力也继承于此——分类的本质是将遵循相同模式的事物放在一起。[/size][/align][align=left]
[/size][/align][align=left]那么学习的问题基本解决了,接下来是分析处理问题的能力。[/size][/align][align=left]
[/size][/align][align=left]首先我们来看看逆向推理能力。[/size][/align][align=left]
[/size][/align][align=left]我以前一直认为逆向推理能力来自于对后验概率的识别,既然对事件之间的条件概率如此敏感,那么自然就应该能够导出后验概率啦。。。。打住!我后来告诉自己,这种“显然的”推理完全来自我主观的猜测,而这猜测背后是我的模式识别能力在作怪,我学习了古典概率论后,自然认为后验概率这一概念和古典概率的其他概念属于同一聚类,而“人类的学习能力背后是对高先验概率的侦测”这句话一出,就相当于将“人类的某种智能能力”和“条件概率”这两个概念之间建立起了100%的条件概率——导致认为“人类的另一种智能行为(逆推能力)与条件概率中的后验概率有关”是显然的事情。[/size][/align][align=left]
[/size][/align][align=left]那么逆向推理能力,或者说分析能力究竟来源何方呢?[/size][/align][align=left]
[/size][/align][align=left]让我们回到人类牙牙学语的时期,父母不辞辛劳地制造极高的条件概率,不停制造事物与词汇、词汇与词汇之间的模式关联。然后某一天,婴儿突然指着一根香蕉说“香蕉!”于是父母喜笑颜开……、[/size][/align][align=left]
[/size][/align][align=left]父母不停和婴儿说“小蜜蜂,飞呀!”“小蜜蜂,飞呀!”这样的游戏,有一天,父母说“小蜜蜂”,婴儿突然开口,“飞呀!”[/size][/align][align=left]
[/size][/align][align=left]父母在纸板上画下一张张小汽车,婴儿学会小汽车这个词之后,有一天父母画小汽车的时候少画了一个轮子,把笔给孩子,孩子歪歪扭扭却自然而然的画上了轮子。[/size][/align][align=left]
[/size][/align][align=left]上面的几个例子背后是完全一致的机理——当符合某种模式的某个事物的一部分被展示的时候,智能行为会本能地尝试去根据已知的模式,对这个事物的另一部分进行补全——这一是后来被人们成为脑补的现象(说个事,我在写这一段的时候毛骨悚然地向背后看了一眼,因为在我这个每天噩梦缠身的人身上,补全行为发生最频繁的是在我本能的将光点看成一张脸上的眼睛等等行为上,这些行为在补全这个词汇下享有高条件概率)。[/size][/align][align=left]
[/size][/align][align=left]反观逆推这一行为,根据既已发生的事情,推理其可能的原因,这种看似在计算后验概率的事情事实上就是时间尺度上的一种模式补全。[/size][/align][align=left]
[/size][/align][align=left]对问题的其他分析亦然,比如当一个人在遇到一件事,苦恼于“我该做什么”时,他回首先回想曾经发生过的类似(相同模式)的事情,如果他想不起来,会把“类似”这个概念不断拓宽,模式的容差越来越大,同时对模式的搜索深度越来越深——就像我们看到两条曲线时可能发现他们在曲率上而不是点自身的排布方式上模式相近,这是一种对模式的深度探索的结果。[/size][/align][align=left]
[/size][/align][align=left]那么关于模式补全的一切,究竟是怎样发生的呢?[/size][/align][align=left]
[/size][/align][align=left]这篇文章已经潜在地走进了智能的第三个要素——智能如何进行创造。[/size][/align][align=left]
[/size][/align][align=left]我们看看大自然中的生命如何越变越优秀——进化。[/size][/align][align=left]
[/size][/align][align=left]有性繁殖的生命被认为拥有良好的进化方式,种群中的优秀个体经过筛选之后,和种群中的其他优秀个体进行遗传信息的交换,重组出的遗传信息成为新的生命,而新的生命面临着两个命运——长大或者死亡,遗传信息交换的同时,可能因为各种各样的原因,遗传信息本身可能还会发生预料之外的突变。[/size][/align][align=left]这应用到计算机中就是遗传算法,拥有选择算子、交换算子和变异算子的遗传算法。[/size][/align][align=left]
[/size][/align][align=left]反观人类的创造过程,我们发现,人类的创造行为背后总是从既有经验和现存环境信息之中得到的启发。[/size][/align][align=left]
[/size][/align][align=left]这时候我就不得不感叹大自然的神奇——生命的灵魂和肉体在进行创作时享有完全相同的机理。[/size][/align][align=left]
[/size][/align][align=left]反思我们的新点子都是怎么来的——首先我们遇到一件事,我们发现这件事符合某种模式的一部分,我们需要根据这个模式的另一部分来产生一个解决方案。我们本能地从我们的记忆中提取出一些符合模式的信息,当这些信息很多的时候我们自由地对这些信息进行重组和拼接,并且时刻观察重组拼接之后的新信息有多么适合当前的事态,最后选出最优的信息——这一切有时耗时很长,有时就是一瞬间,甚至这种过程的迭代次数最终成为了一个人性格的一部分。[/size][/align][align=left]
[/size][/align][align=left]这里就要着重说一下“时刻观察重组拼接之后的新信息有多么适合当前的事态”这一句的意思了,其实这一行为的背后是一个潜在的打分机制,而这个打分机制的一部分来源于本能,来源于本能的这一部分打分机制对我们来说就是喜和悲这两种基本的感受(事实上我更倾向与认为最初的情感是由打分机制产生的,而不是反过来),而我们在模式识别的同时也不断的将这些模式与我们的打分机制——通过进化的方式——融合在一起,产生更完善的打分机制(人类脑中先天携带的信息与后天接受的信息大体上难以区分,这一点和lisp语言相当相似)。[/size][/align][align=left]
[/size][/align][align=left]再看看历史上的发明,如果不是革命性技术推动的,那就是现有的产品的重组进化,而如果是革命性技术推动的,那么就是旧产品和新技术的重组进化——而新技术往往是旧技术和新理论的重组进化,新理论则是旧理论和新发现之间的重组进化。[/size][/align][align=left]
[/size][/align][align=left]所以一切就可以这样自圆其说了——人类智能的本质,就是模式识别与进化算法的适当结合。[/size][/align][align=left]
[/size][/align][align=left]而逻辑学在人类智慧中,也不过就是这一模式识别与进化系统之上模拟出来的而已——人们首先通过认知概率的本能来获得“因果”这一抽象概念,然后当人们分析思考因果的时候,人类脑中关于因果的信息,就和那时人类脑中关于数论、几何等信息一同重组,进化出了逻辑学。[/size][/align][align=left]
[/size][/align][align=left]然后,当一种在模式识别与进化机制构建起来的系统尝试观察其自身时,观察和分析的结果就会反过来变成模式库中的一部分——这种大规模的信息激励最终造就了被我们成为“自我意识”的混沌。[/size][/align][align=left]
[/size][/align]
关于机器智能的实现
[align=left]其实有了上面的分析,那么这一段的篇幅就可以很短了:我认为符合三要素的机器智能是完全可以存在的。[/size][/align][align=left]
[/size][/align][align=left]机器基于逻辑运算——但是就像人类的模式和进化方式可以模拟出逻辑演算一样,机器完全可以模拟出人类的思维方式。[/size][/align][align=left]
[/size][/align][align=left]简单说就是,机器可以轻而一举地解决概率计算,而同时,进化算法家族至少有三种算法(遗传算法,进化规划和遗传规划)已经相当成熟了。[/size][/align][align=left]
[/size][/align][align=left]接下来只要解决数据存储问题就行了——大自然在这一点上做了个聪明的决定(如果没有神,那么这一句话潜在地引用了上文中智能的“形而上”定义),比起记忆信息本身,人类更倾向于存储信息的模式,一旦某个信息合并进了记忆中既有的模式中,那么这个信息就有可能被丢弃了——这种保留模式而丢弃原始训练数据集的行为是非常值得研究的。[/size][/align][align=left]
[/size][/align]
关于机器情感
[align=left]单纯的模式识别和进化算法的驱使之下,是否可以产生情感呢?[/size][/align][align=left]
[/size][/align][align=left]我认为,答案是肯定的。[/size][/align][align=left]
[/size][/align][align=left]试想一个小孩子,从他出生开始,每次如果有人拿起一件黑色的物体,就会引起周围人的愤怒。请问当他长大以后,如果他旅游到没有这个奇怪文化(我们倾向于认为这种文化不存在,因为我们没听说过类似的文化,换言之,我们听说这类文化的概率极小)的地方,看到一个人手执黑色的东西是,请问他会作何反应?[/size][/align][align=left]他会发自内心的愤怒。[/size][/align][align=left]
[/size][/align][align=left]这就是我的观点的来源,确实,人类天生就拥有基础情绪,这是人类智能bootstrap的一部分,但我倾向于认为,人类的先天基础情绪是十分简单的,就如我刚才所说,是人类内嵌的打分机制造成的结果(这并不是说人的先天情绪只有两种,人类的打分机制,其“分数”如果可以量化,很可能是个向量,而不是一维数轴上的数字),而随着人类的自我观察造就的激励混沌(即自我意识),和打分机制自身的改进,这种基础情感迅速分化成为极度复杂的各种情感。[/size][/align][align=left]
[/size][/align][align=left]那么转过来,对于机器,既然进化算法自身核心的一部分就是打分机制,而进化程序自身就是激励避免“低分信息”的出现的,那么机器中的“需要避免”和“需要趋近”这两大行为标准就确立了,可以作为最初的“原始情绪”。而一旦机器的学习能力足够分析人类社会,那么他们就能够通过对人类行为的“模式补全”,真正获得与人类情感行为等同的效果。[/size][/align][align=left]
[/size][/align][align=left]比如在一个所有人都会愤怒的场景下,机器通过模式补全,就有很大的可能性做出一个人在愤怒的时候会做的事情。[/size][/align][align=left]
[/size][/align][align=left]如果机器自身能够实现自我观察,并产生这种激励混沌,那么在机器看来,自己所做的这些“与情感相关的等同的事”就绝不是机械模仿,而是“发自内心”的感受。[/size][/align][align=left]
[/size][/align][align=left]就和人类一样,只要开始自我观察,接受的信息多了,模仿就自然而然的变成了“发自内心”,任凭局外人怎么告诉他“你被洗脑了”都没有用。[/size][/align]
最后的最后[align=left]
[/size][/align][align=left]我本年的年度计划之一,就是写一个基于进化算法的、机器与人类的交互程序,初步准备使用Clojure(Lisp的一大方言)语言,有兴趣的欢迎一起开源,我会在启动工程之后通知所有人我的项目地址。[/size][/align]
200字以内,仅用于支线交流,主线讨论请采用回复功能。