Nature:首次获得类人猿的完整染色体序列

发布日期:2024-06-12 来源:生物谷 浏览次数:244
在一项新的研究中,一个国际研究团队首次从非人灵长类动物中获得了完整的染色体序列。这些序列揭示了不同物种 Y 染色体之间的显著差异,显示了快速的进化,此外还揭示了大型类人猿(great ape)基因组中以前未研究过的区域。由于这些灵长类物种是人类的近亲,这些新序列可以为人类的进化提供启示。相关研究结果于2024年5月29日在线发表在Nature期刊上,论文标题为“The complete sequence and comparative analysis of ape sex chromosomes”。



该团队重点研究了 X 和 Y 染色体,它们在性发育和生育以及其他许多生物功能中发挥作用。他们对黑猩猩(chimpanzee)、倭黑猩猩(bonobo)、大猩猩(gorilla)、婆罗洲猩猩(Bornean orangutan)和苏门达腊猩猩(Sumatran orangutan)五种大型类人猿,以及一种与人类亲缘关系较远的灵长类动物——合趾猿(siamang gibbon)的染色体进行了测序。

论文共同第一作者、美国国家卫生研究院国家人类基因组研究所博士后Brandon Pickett说,“这些染色体序列增加了大量新信息。在此之前,只有黑猩猩的基因组序列比较完整,但即使是黑猩猩的基因组序列也有很大的空白,特别是在重复DNA区域。”

通过分析这些新序列,该团队估计,62%到66%的X染色体和75%到82%的Y染色体由重复DNA序列组成。对科学家们来说,对这些序列进行表征更具挑战性,而对重复 DNA 的研究也是近年来才有可能的,这得益于新的 DNA 测序技术和分析方法。

该团队将类人猿染色体的序列与人类的 X 和 Y 染色体进行了比较,以了解它们的进化史。与人类的 X 和 Y 染色体一样,大型类人猿Y 染色体的基因数量也远远少于 X 染色体。

该团队还使用了一种名为 “比对(alignment)”的计算方法,这种方法可以指出染色体在进化过程中相对不变的区域,从而揭示不同的进化压力对基因组不同部分的影响。

该团队发现,90% 以上的类人猿 X 染色体序列与人类 X 染色体比对得上,这表明 X 染色体在数百万年的进化过程中保持相对不变。然而,只有14%到27%的类人猿Y染色体序列与人类Y染色体一致。

论文共同第一作者兼论文共同通讯作者、宾夕法尼亚州立大学教授Kateryna Makova博士说,“这些物种的 Y 染色体之间的差异程度令人非常惊讶。其中一些物种在 700 万年前才从人类谱系中分化出来,这在进化过程中并不算长。这说明Y染色体的进化速度非常快。”

不同灵长类动物的 Y 染色体之间的一个显著差异是它们的长度。例如,苏门达腊猩猩的 Y 染色体是合趾猿Y 染色体长度的两倍。DNA 重复序列的数量和类型的差异是造成染色体长度差异的部分原因。

其中的一种DNA重复序列被称为 “回文序列(palindrome)”,即一包含反向DNA重复序列的 DNA 序列。DNA回文序列与回文语言(如 “racecar”或“kayak”)类似,其中前半部分的字母在后半部分反向重复,因此字母的前后顺序是相同的。然而,DNA回文序列的长度可能超过十万个碱基。

该团队发现,灵长类动物 X 和 Y 染色体上的 DNA 重複序列几乎总是包含基因,这些基因在染色体的长度上重复了很多份。灵长类动物基因组中的大多数基因只有两个拷贝,一对染色体上各有一个拷贝。

科学家们猜测在这些DNA回文序列上有许多基因拷贝有助于保护基因,尤其是 Y 染色体上的基因。由于每个细胞通常只有一条 Y 染色体,如果 Y 染色体上的基因受损,就没有另一条染色体上的基因拷贝可以用作修复损伤的模板。


图片来自Nature, 2024, doi:10.1038/s41586-024-07473-2

论文共同通讯作者、美国国家卫生研究院国家人类基因组研究所高级研究员Adam Phillippy博士说,“DNA回文序列上的这些基因就像保留了一个备份。我们知道,这些基因中有很多都在发挥重要功能,因此我们期望在不同物种中看到相同的基因出现在DNA回文序列中,但情况似乎并非如此。”

该团队对包含在DNA回文序列中的几组基因进行了研究,其中许多基因在精子生成中发挥作用,因此对生育能力非常重要。虽然在研究的所有灵长类动物Y染色体上都发现了DNA回文序列,但每个物种的特定DNA回文序列和这些DNA回文序列包含的基因往往是不同的。

Phillippy博士说,“可能还有更多我们尚未发现的变异。在人类的 Y 染色体上,一些基因的数量会因个体差异而不同。对于其他灵长类物种,我们仅在个体水平上看到这一点。我们还不知道这个群体中的其他成员是否也是如此,也不知道我们可能会发现哪些其他变异。”

Makova博士补充说,“不过,我们团队之前的研究工作已让我们了解到一些新见解,这些见解表明,人类和其他类人猿的 Y 染色体基因拷贝数存在着广泛的变异。”

这些类人猿染色体序列还解析了另一类称为卫星DNA的重复序列,其中卫星DNA是一类片段较长的重复序列。在大型类人猿中,这些作者发现了几种以前未知的物种特异性卫星DNA序列。

这些序列为深入了解大型类人猿基因组提供了重要见解,因为卫星DNA遍布整个基因组。具体来说,它们集中在染色体末端(称为端粒)附近,以及另一个称为着丝粒(centromere)的区域,其中着丝粒有助于染色体在细胞分裂过程中组织起来。在这项研究和该团队近期开展的另一项研究工作之前,这些物种的着丝粒序列完全不为人知。

Makova博士说,“这些来自类人猿的卫星DNA为我们开辟了新的探索领域,与我们对Y染色体的其他发现类似,我们可以看到Y染色体的着丝粒具有高度的动态性。”

这些染色体序列可以帮助科学家们研究包括人类在内的类人猿的进化。该团队目前正在努力描述这些类人猿物种的整个基因组,但即使单独来看,这些X 和 Y 染色体序列也能提供很多启示,尤其是关于 Y 染色体上的进化力量是如何促使其快速进化的。

其中一个因素是每个细胞通常只有一条Y染色体,这导致DNA序列的变化不断累积。Makova博士说,另一种进化力量是一种称为雄性突变偏倚(male mutation bias)的现象。与卵子的产生相比,精子的产生涉及更多的DNA复制。每次复制,DNA 序列都有可能发生变化。这影响到所有染色体,但对 Y 染色体的影响尤其大。

另一个潜在因素是种群规模小,这会影响进化速度。这些类人猿不仅野外种群数量有限,而且Y染色体只存在于一半的种群中,这进一步限制了基因组这一特殊部分在种群上的数量。Makova博士说,“重要的是要记住,这些类人猿物种都濒临灭绝。我们不仅可以从这些序列中了解人类的进化,还可以运用我们对它们的基因组和人类基因组的了解,更好地理解这些濒危物种的生物学和繁殖。”