【科普】生物大分子是如何“计算”生命逻辑的。
冬瓜哥2016/01/13农业 IP:北京

本文转载至微信公众号“大话存储”  

最近业界有些逼格极高的新闻,比如生物存储,DNA存储,DNA计算等。冬瓜哥其实在之前的文章(《时空参悟上/下》)的下篇中畅聊了一番生物和计算机的联系,恐怕很多人都没有心思去看这篇文章,或是没有静下心来思考。冬瓜哥在高中的时候,就自己学习过生物无机化学、分子生物和分子免疫的相关知识,也正是在那个时候,潜移默化中培养了架构师思维,因为研究这些课题,俨然就是在研究上帝所设计的架构和逻辑,架构,说白了就是两种东西:执行部件+时序控制,弄清楚每一步要做的事,怎么做的,搞清楚整体上的信息是怎么流动的,如何控制的。研究分子生物学、细胞生物学、分子免疫学的有意思的点在于,你总能发现惊喜,总能被上帝设计的巧妙关系所震撼,总有无穷无尽的未知等着你去探索,用各种实验和仪器,来证实你的猜测或者偶然发现某些新的执行路径、逻辑。  
【主线1】氧气是怎么运输的
血液是红色的,因为其中含铁,如果把血液说成是铁锈水的话,其实也很贴切。为什么要含铁?因为氧气分子可以结合到铁原子上,这就是血液运输氧气的方式,用铁来吸引氧分子,那么为什么不能用锌来吸引氧?如果人工设计一下的话,应该可以,但是铁是宇宙中恒星燃烧之后最终生成物,含量丰富,所以上帝直接顺手就用了铁原子了。那么,铁在血液中以什么形式存在?经过科学家们的不懈努力,用了各种方式,终于确定了,铁存在于血红蛋白分子内部,后来,科学家们利用x光衍射等手段,确定了血红蛋白分子的空间构象。然而,铁原子到底与这个蛋白分子中的哪个原子结合,存在于哪个位置呢?经过更精细的测定,铁原子首先位于一个卟啉环上,卟啉是一种环状有机分子,其中4个氮原子与铁形成配位关系。冬瓜哥不禁回想起当年在大学做的毕业设计,就是用说不清楚是什么的环状有机物,与已经忘了是什么的某种金属离子,形成配位,在实验室里搅和n天,然后过滤,离心,结晶,最后拿到衍射仪上出个图,分析一下氢键的位置,毕业设计时候上去讲了讲,就这么稀里糊涂的毕业了,冬瓜哥对不起国家,对不起对环境的污染,对不起高中化学老师,结果稀里糊涂转行了,其实冬瓜哥本来应该是个化学家或者分子生物学家的,但是这个梦想,在考研科目上,冬瓜哥打了退堂鼓,冬瓜哥实在不想去背诵那些扯尼玛蛋的政治stuff,去tmd,断送了冬瓜哥成为科学家的路径。伤心事不提了。卟啉环如下图所示,铁原子就呆在这个孔洞内。这个环,加上铁原子,就是所谓血红素,Heme。缺铁,那么血红素就不够,氧气运输就不够,生化反应就较弱,整个人就是萎靡不振,因为物质燃烧不起来,无法提供足够的能量给整个身体。
7acb0a46f21fbe09a465804c6b600c338744adab.jpg
那么,卟啉环又接在了什么上面了?根据衍射仪分析,其处于游历状态,不与任何氨基酸残基相连,直接嵌入到血红蛋白大分子内部的一个空隙内,其周围的化学力环境刚好能够把这个环卡主,结结实实的。同时,环的两侧,各有一个组氨酸残基夹住这个环,图中的Histidine F8和E7。
搜狗截图20150827182111.jpg
所有的蛋白质分子,都是由氨基酸合成的,先水合,成肽链,然后折叠成各种形状,有的形成α螺旋,有的形成β片,或者无规则loop,在空间第二个维度上再次折叠,形成单体,多个单体之间还可以依靠化学力组合起来形成完整的多合体。血红蛋白就是一个四合体,其中图中两个红色部分的区域,各结合一个血红素。
t01acd0e929d84aed59.jpg P4-8.jpg

肺泡将呼吸进来的空气传递给毛细血管,在这里,氧气充分的与静脉血接触,氧气结合到铁原子上,将铁原子氧化成+3价,从而颜色变为鲜红色。那么,吸收了氧气的血红蛋白,下一步要怎样呢?当然是要用氧气去燃烧糖了,或者直接烧葡萄糖,或者去烧一下脂肪,最终形成ATP能量子,这就像变形金刚们总是要储备一定的能量块一样。用这些能量子,供给其他蛋白质机器来合成生命所必须的物质,然后各自储备、按需利用,至此,冬瓜哥脑海中产生千万个问号,比如,氧气怎么燃烧糖,在哪里烧(线粒体)?生个炉子么?怎么引燃?烧完了的ATP储存在哪里?怎么被释放?这一系列的问号,驱使着冬瓜哥的探索欲望,但是可惜,冬瓜哥精力有限,还是那句话,冬瓜哥骨子里或许应该是个科学家,但实际上是个IT屌丝而已。如果广大的高中生、大学生有幸看到此文,可以继续追随冬瓜哥的这成千上万个问号,不断的去探究这奇妙的世界。
搜狗截图20150827182145.jpg
话说回来,吸收了氧气的血红素,会产生形变,如上图所示,整个蛋白质分子内部会受到一定的牵拉,构象改变,包括卟啉环本身也受到牵拉。那两个组氨酸残基(His)就是一种探针,氧分子结合之后,化学力环境改变,His受到牵拉或者排斥,将这种变化传递到整个蛋白分子。蛋白分子构象变化之后,便可以导致下游逻辑的触发,至于如何触发,具体流程,冬瓜哥只能说到这了,因为没货了。  
【主线2】更复杂的生化逻辑是如何完成的  
各种生化酶,能够加速化学反应,比如磷酸葡萄糖激酶,谷氨酰转肽酶。这些蛋白质大分子,能够主动捕获反应物,将其主动接触,使用“能量”克服反应物接触时候产生的阻碍,成功将反应物联结在一起,生成新的物质,ATP作为能量子,结合到蛋白质分子上之后,由于反应物A和B之间的强行接触会导致整个蛋白质三维构象产生“挤压”,形变,这种形变被传递到ATP分子上,从而将ATP的一个磷酸键被压断,相当于ATP将这股力量传递给了反应物分子,从而强行将反应物结合了起来,也就是说,ATP分子将其磷酸键保存的能量,传递给了反应物,就像汽油才气缸中受压爆炸,将动力传递给车轮一样。有些反应物很强悍,需要提供更多能量,一分子ATP不足以提供足够能量,所以一些生化酶蛋白分子上具有多个ATP结合点,相当于单缸发动机变成多缸发动机。上述过程可以用如下等式表示:反应物A+反应物B+ATP(能量子)===新反应物+ADP+磷酸,生化酶写在等号上方。可以看到,生化酶这个蛋白质大分子,就像一种CPU一样,有输入,有输出,其内部是有执行实体的,然而,它又是一个专用CPU,只能接收特定的输入,给出特定的输出。细胞内存在大量不同的蛋白质分子,各完成不同的功能,有促进生化反应的生化酶,有负责肌肉运动的微管蛋白,有负责结合异物的抗体蛋白,有负责传递信号的信使蛋白,有负责在细胞内和细胞外运输各种离子的离子通道蛋白,有免疫调节的干扰素蛋白,等等,太多数不胜数。每一个,都可以认为是一个专用CPU。而ATP分子,则是所有这些小机器的通用能量子。高中生物课里,老师也是这么讲的,ATP提供能量,但是怎么提供能量的?老师无法解释或者并不能很好的表达出来。缺乏感性认识的话,就无法彻底理解底层,那么以后的工作就更加浮于表面。冬瓜哥真的很适合去做老师,如果有哪个大学甚至高中愿意吸纳冬瓜哥去做一名计算机教师的话,冬瓜哥很乐意前往。
对于一个钠钾泵来说,这个蛋白质分子可以根据两侧的离子浓度来决定是否启停(将某种离子运送到细胞膜另一侧)。
Scheme_sodium-potassium_pump-zh.svg.png
  【主线3】蛋白质机器与数字电路机器的异同
那么如果把这个逻辑用计算机来模拟的话,就需要先设置一个计数器,然后采样,每秒采样到的钾离子数量,计入到变量A,然后将A与B比较,A大于B,则跳转到后续逻辑执行。然而,对于蛋白质来讲,其内部并没有这种串行执行部件,并不需要计数器、代码、比较器、PC指针、跳转等逻辑。那么,冬瓜哥就不禁思考了,蛋白质到底是如何判断离子浓度而而做出转运某种离子的选择性的呢?如果不是使用数字编码,那一定就是模拟量的信号处理了,但是模拟量底层并不是无限连续的,其最小单元则是一个正弦波形状。在此,冬瓜哥设想了一种模型:细胞一侧的钾离子浓度如果较高,那么该蛋白质分子在这一侧的某些残基上的能够与钾离子相互产生物理电作用或者化学力作用的基团,会受力,每次受力,该基团会对整个蛋白质分子深处的各个原子进行牵拉,当钾离子浓度较高的时候,每次碰撞到钾离子,就被牵拉一次,整个分子内部当牵拉频率达到某个值的时候,引起分子的构象产生一个比较大的越变,形成一个非常有利于钾离子通过的孔洞状区域,便成功捕获一个钾离子,孔洞通道内的各种基团的强有力吸引作用下,钾离子被迅速吸引到孔道的另一侧,成功运输一个钾离子。当钾离子浓度不够的时候,阀值频率未达到,孔洞关闭,随着钾离子被运输到另一侧,本侧浓度持续降低,最后形成一个闭环的负反馈控制。
20150724110126_44646.jpg
产生连续变化的电信号,然后用一个运放比较电路,来比较当前值和阀值电压/电流,大于或者小于,利用这个信号,输入到数字电路,完成后续逻辑,这也是生物监测芯片的做法。从这一点上看,上述冬瓜哥猜测的那个模型,其实还是存在某种量化采样的思想在里面,比如使用牵拉”频率“来作为条件输入,这本身已经是一种数字量化手段了,然而,确实想不出这个世界存在真正连续变化的事物,就算是转换成所谓”连续变化“的电流,其底层也还是不连续的,比如,一个钾离子通过,这是一个电荷,至今未发现”半个电荷“或者”四分之一个电荷“的电荷量,就算再继续细分,也还是无穷尽。
那么,用数字电路来模拟上述生物物理过程,就是小菜一碟,但是需要可执行单元和指令代码,效率极低,生化或者生物物理领域内并没有看到这种”执行实体“存在,就连解码DNA的核糖体蛋白分子,其也并没有这种串行执行实体。
那么,蛋白质的执行生化逻辑,其底层到底是怎样的呢?对应到计算机的话,冬瓜哥认为应该是专用数字逻辑,说白了,组合逻辑电路。组合逻辑电路是对串行执行部件的一种展开和并行,或者说,一种降维。维度越低,在时间轴上的并行度越大,被封装成更高的维度之后,时间上的并行度就越低,需要靠时间的流逝来遍历所有之前被展开的维度,从而完成同样的逻辑,然而,对于高维度生物来讲,其感受到的效果就是计算变慢了,因为产生了先后顺序,有了先后,才有时间。
在数字电路中,一个加法器,本质上也是一套封装之后的组合逻辑电路。加法器并不是天然存在的,而是人们根据已有结果,也就是0和0应该为0,0和1为1,1和0为1,1和1为0且进1,这种关系,被人们取了个名字叫做“加法”。人们找到了或者说设计出了某种电路,最终可以表达成上述的关系,用高电压表示1,低电压表示0。所以,各种基本的运算电路,都是人们按照既定逻辑“拼凑”出来的,然后再优化,比如先行进位等。对于更复杂的运算,比如”当输入为1001时输出为1111,当输入为0011时输出为1001”,这种逻辑并不是加减乘除,而是某种代表某种更具智能的逻辑,此时无法用加减法来完成这种计算,而是要用组合逻辑电路实现,写出真值表,直接翻译成一堆与或非门相互连接而成的电路。而加法器,如果用纯数字电路视角来看,只不过加法器这个组合逻辑电路恰好能体现”加法“这个逻辑而已。
所以,代表蛋白质分子更像是一种能够译码复杂逻辑的组合电路,是一个译码器。其中的氨基酸残基、肽链骨架、原子、二级三级构象,共同完成了将输入信号翻译成输出信号的作用,每个原子分子,仿佛都是被精心按照电化学和物理受力环境计算出来而摆到那个位置的。就像电路中的与或非门一样。这是上帝的杰作。
那么,如果人们能够人工合成一款蛋白质分子,其能够接收某种输入,产生某种输出,不就可以完成某种复杂的逻辑了么。人工合成蛋白质并不是问题,只需要设计好对应的DNA编码,然后使用基因技术将这段DNA连接到某繁殖力强的细菌的DNA中的某个必须蛋白质编码后方,将终结子编码延后到该段基因后面,然后注入细胞核,细菌的核糖体蛋白在读出那个必须蛋白编码后,接着读出这个嵌入的编码,解码,然后将对应的氨基酸水合成肽链,游离于细胞质内,后续经过一系列的辅助蛋白,该肽链成功折叠成一个具有功能活性构象的蛋白质分子。然而,这个分子如何受控,又怎样被用起来?目前看来,蛋白质可以接收某种信号,也就是可以与其他某种信使蛋白质比如G蛋白分子结合之后,构象变化,从而产生某种输出,该输出的结果,或者是打开某个特定的化学环境孔洞,或者露出或者封闭某种活性基团,从而影响该生化过程下游的逻辑,比如,通过负反馈或者正反馈抑制或者激发某种蛋白质的生产力度,比如,免疫学是个正反馈过程,受刺激的T细胞表面受体会将对应该受体表达的基因进行正反馈刺激,表达出更多游离的抗体,从而封闭异构物质表面关键的基团,封闭其电化学环境,从而无法侵入细胞。
问题是,上述过程中,好像并没有什么合适的输入输出,可以将蛋白质利用来完成某种基本数学或者逻辑运算的,比如加法,目前无法直接用蛋白质算加法。可以说,蛋白质计算的,是一种更高层的逻辑,其完成的一整段大型组合代码,而CPU则是靠基本的数学和逻辑运算,堆成某种高层逻辑运算。
目前,有人使用蛋白质来模拟成与或非门,然后再把这些这种生物分子门堆成基本算子电路,这相当于做了一层封装,效率极低的封装,相当于让闪电侠来算1+1,其路子是不对的,这样下去是玩不动的。反而,量子计算机,则似乎是抛弃了这个世界被上帝封装出来的一层层算子,而直接看透到了上帝的最终砝码,直接使用世界底层的那个执行引擎来计算更高逼格的算子,同理,用量子计算机算1+1=2,也是不行的,或者说效率低到无法忍受的。
所以,蛋白质这种高维度封装后的算子,如何被直接利用,是个无法逾越的问题,生物大分子“计算”的并不是数学上的加减乘除,其“计算”的其实是细胞内的生化环境变化,也就是,如果“钾离子浓度为xx,则xx”,如果“细胞表面嵌入式抗体结合了某种异物,则xx”,这些输入条件和输出结果,无法直接拿来满足人类的需求,于是便出现了之前那种用蛋白质的两个状态来模拟成与或非门的倒退式的思想。然而,如果可以将这个组合逻辑降维,拆解到分子层面,直接利用其元件来搭建计算部件,看似是个正路,但是这样就和生物没有关系了,而属于分子计算了,直接用分子的某种状态来表示某种关系和逻辑,在更细的粒度上,或许可以模拟出基本的数学运算和逻辑运算。
所以,蛋白质大分子更像是一种早期的手摇式机械计算机,或者八音盒中的那个滚筒+拨片一样的计算机,只不过处于分子级别,其运行速度远高于手摇机械而已,依然是依靠机械形变,正负反馈控制来完成计算。
  【结局】“生物计算”何去何从?
要从上帝那里吸取一种思想,也就是利用数量庞大的专用小CPU,靠之间的相互通信,来完成更高级的逻辑。每一个蛋白质,是一个组合逻辑,而如果使用通用CPU来执行,则其相当于某个功能函数,输入参数,执行,输出,返回。通用CPU在时间上是串行执行的,虽然也有并行化因素,但是杯水车薪。而生物细胞内,大量的逻辑在同时执行,每个细胞都是一个CPU核心,这个核心内,又将大量的生化逻辑做成专用组合逻辑,并行执行,相当于大量的弱ASIC芯片并行工作。恐怕,数字电路计算机后续也可以走向这条路,才能释放更多的潜力,产生更加奇妙的效果。而利用生物分子进行计算的想法,冬瓜哥猜测,恐怕是死路一条了,但是利用更小的分子甚至原子进行计算,则看上去更走得通。

[修改于 4年3个月前 - 2020/10/07 18:59:48]

来自:农林牧渔 / 农业
2
已屏蔽 原因:{{ notice.reason }}已屏蔽
{{notice.noticeContent}}
~~空空如也
郝如新
4年3个月前 修改于 4年3个月前 IP:宁夏
886958

是篇很好的文章,作者估计有国外留学背景。

引用
评论
加载评论中,请稍候...
200字以内,仅用于支线交流,主线讨论请采用回复功能。
折叠评论

想参与大家的讨论?现在就 登录 或者 注册

所属专业
上级专业
插入公式
评论控制
加载中...
文号:{{pid}}
投诉或举报
加载中...
{{tip}}
请选择违规类型:
{{reason.type}}

空空如也

加载中...
详情
详情
推送到专栏从专栏移除
设为匿名取消匿名
查看作者
回复
只看作者
加入收藏取消收藏
收藏
取消收藏
折叠回复
置顶取消置顶
评学术分
鼓励
设为精选取消精选
管理提醒
编辑
通过审核
评论控制
退修或删除
历史版本
违规记录
投诉或举报
加入黑名单移除黑名单
查看IP
{{format('YYYY/MM/DD HH:mm:ss', toc)}}