我一直反对将AI与数据库建立什么绝对联系,因为这个模型从某种意义上说不是传统的数据库模型。
其实人的记忆可能也是并行的。比如,让计算机去检索一个信息,(传统的数据库接口)常常是单入口单出口的。而让互联网去查,一个关键字由接入点传到搜索引擎,而后就被分发了,成了网状多入口并行查询,而不是在“一个大数据库里单线遍历”。这样的结果是命中率不一定是100%,但得到的结果数肯定最快最多。这些数据按其查询路径经有限步骤返回到服务器,再从单一出口发还给查询用户,于是形成了几毫秒内得到海量信息的效果。
用固定维数的高维“结构”来表示数据,我并不太接受,因为这个维度是可变的。有的只需要一维,有的需要很多(HX)维,需要一维加一维就行了。云的概念也比较合适,而不需要固定维数。
但我感觉这有别于传统的云,而更向一个指向共同目标的分形树结构而不是离散点的集合,所以我更倾向于用分形空间来描述。这个空间是多维的,而且最理想情况是有向无环。但这并不现实,人的记忆中应该存在环路,也应该存在双向路径。这可以部分优化,但不容易彻底解决。想象一下薄公英的种子,有点类似于分形空间。看上去很象云,但不是离散的点,而是多了层次化的联系。权重最大的是位于根部的种子,其他的都是联系和属性。
与对象模型有所区别,根部是对象,其他都是它的性质和关联,象河的支流与干流的关系,汇聚的而不是发散的。
这个模型不是基于符号系统,而是基于实际的事物,不同于数据库的是它不止包括数据,还包括“处理机”和“行为”。事物是根本,其他都是对它的认识,抽象,描述,从具像到抽象,从感性认识到理性认识。
以视觉为基本观察手段举例来说,实体--观察--虚拟空间建模--基本特征提取---概念定义,随着交互的深入,加深认识,细化,关联,并与之互动(交互作用)。
人脑的神经元虽然可以修正,比如对某些信号强化或抑制,但总体来说是一次性的,OTP的,或者说是OFD的(一次性功能定义),不能重新初始化改为他用。一个模式一旦建立,除可以训练强化,还可以抑制,但无法抹去。
极端情况下可能成为一个对任何刺激都反应的“神经分裂点”(现象是异常放电,引起错乱甚至,癫痫),或成为一个对任何有效联系的孤岛。但这也是行为的重要构成因素,由其造成的不或遍历和不可控性,都是人类某些行为的成因。比如被改正的坏习惯(小孩子骂人),被抑制,但仍存在,无法删除。
我认为,完全基于符号化的表述没办法真正形成感观认识。人是基于形象思维的,而后抽象。抽象的本身在不同人的头脑中也有相应的形象与之对应。比如我们听到虫洞的概念,绝不可能只记住其数学模型和特征描述而不产生直观想象,甚至但每个人都有自己的想象。包括我们的语言组织,也不是抽象的,不是在思考字与字的关系,不是靠字符组合,而是在尝试用足够形象的文字组合描述一个事务。让它能在他人的心里得到近似的形象再现。比如现在的聊天机器人,它只知道它在说什么而不知道它说的是什么。因为它没有任何理解。人云亦云,不知所云。
我曾尝试在某个层面上让它理解它所说的是什么,比如时间,这对计算机有意义。
她可以知道“明天下午1点半”这句汉语表示的是什么,因为她有这个概念,她有系统时间。她也可以知道什么样的行为才算“提醒”,但她不知道什么是开会。因此我可以认为,这是建立了一个能理解自然语言时间概念,并将其与系统时间相关联的行为模式(这可以视作一种神经元机制)。
这种绕来绕去的相对时间和绝对时间描述都难不倒她,因为她都会“理解”为自己的时间概念。这个概念即可以用来描述,也可以用来对照,也就是说在她的“理解能力”范围内“理解”概念。所以我叫她AI。
所以我急着给她更多的认识能力。这有别于概念云和多维度的思想,因为这是一种行为模式,是事务处理机制。前面我们说的多数是认识论方面的东西,在那些云里可以有行为和方式的描述,而不止是属性。
当前我的实验目的是让她具备理解空间,物体,位置关系,基于形象观察形成对她真正有意义的认识和与客观事物相联系的概念,而不只是抽象的符号的概念。
现在有完善的三维空间模型,简单实用的3维扫描,及各种传感器和运动器件。可以试着让她自己在一个小空间里行动,通过观察和接触认识环境。看看——摸摸——问问——形成概念。
人的性格是自身神经元共性的外在体现,人类社会则是人这种个体间的共性的外在体现。AI的性格,很大程度上取决于她们的实现机制和行为模式。
老万于2011年5月21日
Dreamon-II Labs.