本帖最后由 atlas 于 2014-8-11 17:16 编辑
LZ对这个问题的态度可能过于乐观了。测序成本的确在不断降低,我们做过全测序的确实有体会。几年前测定一个微生物仅仅5M base pair的碱基数量,达到90%的覆盖率就要5W软妹币,现在成本降低了大概10倍左右。但LZ可能不了解微生物的测序难度与人类基因组测序难度简直比起来是小巫见大巫。测定99.75%的覆盖率需要重复测序至少6次(覆盖率=1-e^-n),至此成本已是微生物测序的数十倍成本了。就算如此仍有约7.5M base pair的Gap,仍会丢失大量的基因数据(一个基因的长度一般在1-2K base pair)。其次是拼接难题。高等生物含有大量的小卫星,微卫星重复序列,重复序列是3,4代测序技术的瓶颈,3,4代测序普遍读长短(200-300bp),这使拼接产生了难题,需要测序前在建库基础上的RFLP或光学作图等手段确定位置与长度。就算这些问题已能够解决。虽然基因的预测是比较容易实现的,但是基因的注释仍旧是一个难题,你知道他是个基因,但根本不知道他是干啥的。是你知道了基因序列,who care?
最后跟你讲,一个基因到翻译为蛋白,并表现功能有至少7个水平的调控方式(as far as I know),转录调控,miRNA,siRNA调控,翻译调控,泛素化降解调控,蛋白修饰调控,组蛋白修饰调控,lncRNA调控等等。基因并不代表表型。你知道你有一个基因,so what? who care?
早年基因组测序还能发些好文章。现在很难了。除了多倍体植物的大基因组测序这种难题还能登上CNS(cell, nature, science)的宝座。
LZ的想法我认为至少早了10年。至少。