
7个月后,这一争论还没有平息。一些学术期刊和无数的博客针对这个话题发表观点。在4月8号,Ceurrent Biology杂志发表了关于该话题的第二篇文章,这一现象让人不得不感到好奇,为什么“功能”这个简单的词语能引起如此大的分歧呢?
Encode项目是由美国NIH的国家人类基因组研究所(National Human Genome Research Institute)赞助,目的是对在人类基因组项目中产生的数据进行分析处理。不同的基因编码了各种特定蛋白质,完成了细胞中的大部分功能,但这仅仅是少部分的基因,对于基因组中大部分序列的作用,科学家们并不知道。
因此,Encode项目几乎分析了基因组中所有部分——尤其是其中不编码蛋白质的98%,希望能够找到有关它们在人体中作用的相关线索。这些工作非常重要,因为科学家们确信这98%中有些部分作为调节元件,指导了蛋白质何时何地,以多大量合成。这一工作对于了解正常细胞行为非常关键,然而科学家目前也仅仅了解少数个例。他们不知道是否存在比目前已知数量更多的调节元件,也不知道如果确实如此的话,它们又是如何发挥作用的。这些调节区域可能有助于解释某些与遗传相关,但是又与特定编码基因无直接关联的疾病的基础。
在2012年9月,Encode项目的主要研究阶段正式结束。研究者们发表了几十篇同行评审的文章,其中发表在Nature杂志上的论文称,人类基因组中80%的序列是具有功能的。同时研究者们还公开了数据库,这个数据库对大部分非编码序列进行了注释。注释方式基本上就是这样:“这部分序列与一种蛋白质结合”,“这部分序列常被甲基基团标记”,“这部分序列通常隐藏在组蛋白的包围中”。
而对于Encode项目的批评大部分并不是针对其所构建的数据库。牛津大学的遗传学研究专家Chris Ponting说道,“Encode项目为科学界提供了大量有用的数据,这些数据正在用于的研究中。”但Chris Ponting并不赞同Encode项目有关功能性DNA的结论。实际上,主要的批评针对的是项目研究者在结论上的“大跃进”,尤其是他们公开发表称人类基因组中大部分序列是人类生命所必需的。批评意见认为,Encode项目的工作并不能支持这样的结论,向公众传达了不准确的有关遗传与进化的观念。
产生这些分歧的关键在于,Encode在DNA中发现了具有化学活性的部分,并称其具有“功能”。但是,并非所有的这类活性都是人类生命所必需的。例如,Encode的科学家寻找与蛋白质结合的DNA区域,因为这类结合对于打开、阅读以及标记DNA是必须的。但是有的DNA序列也可以结合蛋白质,但是却与人类健康无关。在漫长的进化过程中,人类的基因组中吸纳了许多来自病毒的DNA。那些不会危害或者协助宿主的DNA序列可能仍然包含有可与蛋白质结合的区域,或者发挥某些功能,但是并不影响细胞正常功能。
Encode项目不可避免地将一些可能对人体并无重要作用的区域当作活跃的功能区域。不过,Stamatoyannopoulos博士和其他的生物学家认为,Encode项目的80%的结论带来了有关人类基因组的新视角。他说,人类基因组中如此高比例具有生物化学活性的事实说明,人类基因组中受到调控的序列比以前了解到的要多得多。甚至某些来自于病毒或者其他寄生生物的序列可能在人体中发挥有用的功能。西奈山医学院的遗传学家Eric Schadt (未参与该项目)说:“我认为这种调节网络的复杂性将持续拓展我们的思维。我想我们会发现,基因组中的大多数序列在调节中发挥作用。”
批评意见强调,Encode项目并不是为了研究基因组中有多少非编码序列在人类健康中发挥了重要作用。他们认为,Encode项目并没有通过实验证实那些新发现的“功能”区域如何对人体产生影响,因而获得了多么新颖而具革命性的成果的这种说法是站不住脚的。
Encode项目的人士将人类基因组描述为其中大部分序列可被有效利用,但批评人士认为这不是正确的看待基因组的方式。“人类基因组是一台的机器吗?人类基因组是所有基因组中的吗?或者它只是一团糟?搞清这些问题非常重要,”帮助设计Encode项目的遗传学家Sean Eddy说。“我们对基因组的认识是,它确实是一团糟。”
对于“一团糟”,Eddy指的是从进化的数学模型得出的结论:基因组中至少有85%质90%的序列对人类健康不是必须的,即便它们具有化学活性。这么说的部分理由是,人类基因组在漫长历史中积累了无数的突变,如果基因组中大多数序列是必须的,那么人类早就因为这些突变对健康的影响而灭绝了。另一方面,Stamatoyannopoulos博士和Schadt也表示,那些数学模型是基于1960年代的一些简单方程而建立的,可能具有某些数值上的错误。Eddy说,那是有可能的,但是科学家在贬低这些模型前应该先找到更好的论据来驳倒它们