超新星のktjc 发表于 2014-8-24 19:54
话说这数据是怎么来的,是多人总结来的还是某一人的.那个M染色体正常人也有吗?有带注释的版本吗?
这个数据来自华大测序的第一个黄种人基因组(炎黄一号),是单独一个人的。M表示线粒体染色体,他是最小的,1万多个序列,所有人都有。你所说的注释我理解是差异位点的描述吧,这个数据是非常庞大的,我大概说说吧,SNP位点(也就是某个核苷酸有多种可能)大概300万个,目前要就远不止这么多,indel位点(就是某些位增加或者缺失了核苷酸),这个大概10多万个,还有些结构变异的。这么多序列的差异引起表型的差异很多都还没有研究清楚,更不用说环境等外部因素造成的表型差异。为了研究方便,这种数据一般都是通过构建数据库,让全世界查询,以免重复研究。如果你感兴趣,你可以去NCBI ,UCSC ,OMIM这样的去数据库看看。但是这些数据库都很复杂,所以我们就像建一个简单的数据库,让非专业的认识查询,做个科普嘛。另外,我这倒是有份SNP和indel的位点数据,就是那个位点在哪条染色体上,定位是多少,那个碱基有什么差异,但是表型数据是没有的。你如果要我可以发给你。