联系方式
  • 电 话:010-62559405
  • 地 址:北京市海淀区北四环西路25-2
  • 编 码:100190
  • Email:nscrc@ioz.ac.cn
“不老药”的前世今生系列 之 远古的入侵

 

原创:丽萍,若通

 

地球40多亿年的生命历程中,孕育了无数的生命形式。时光流转,岁月变迁,现在的我们似乎只能通过古老的化石去感受远古时代的壮丽和沧桑。殊不知,远古生命早已入侵我们祖先的基因组,并在其上悄无声息地打上了烙印,而漫长的时光并没有将这些入侵的远古印记消磨殆尽,反倒让这些打入人类基因组的暗桩借助其自身独特的复制方式,伴随人类的进化从星星之火化为遍布基因组的非编码序列的重要组分。

已有研究表明,这些主要由重复序列以串联重复或间隔重复等方式分布于整个人类基因组中的“垃圾序列”,其实正在通过其独特的方式影响着人类的发育、衰老和疾病的进程。那么,如此庞大的“远古军团”究竟是敌是友?它们又是如何影响人类的生命活动呢?

 

1 什么是重复序列?

 

基因组重复序列(Repetitive Sequence,RS)是指位于基因组不同区域的具有相似碱基序列的或者对称性的DNA片段,其中相似的碱基序列既包括同一个基因组中相似的片段,也包括不同物种间基因组中的相似片段。根据结构、功能和基因组位点等,重复序列可以被分为:(1)散在重复序列(Interspersed repeat);(2)串联重复序列(Tandem repeat);(3)片段重复序列(Segmental duplication)。

散在重复序列(Interspersed repeat)是指重复单元并不直接相连,而是相对均匀地分布在基因组不同区域的重复序列。这类序列是远古病毒入侵人类基因组的最直接证据。目前主要发现四类散在重复序列:长末端重复序列(LTR),长散在重复序列(LINE),短散在重复序列(SINE)以及DNA转座子(DNA transposon)。前三种重复序列都是通过RNA介导转座,而DNA转座子则是通过DNA介导转座。LTR元件是指两端都有长末端重复序列的反转座元件,主要源于反转录病毒(retrovirus)和内源性反转录病毒(Endogenous retrovirus, ERV)基因组的入侵和整合。没有LTR的反转座元件被称为反转座子(DNA retrotransposon)。根据重复序列的长度,反转座子可分为LINE和SINE两类。LINE中包含一个反转座酶样基因,可介导其反转座过程,典型的LINE是KpnI家族;SINE不包含反转座酶但仍能通过其它方式转座,典型的SINE包括Alu家族和Hinf家族等。

串联重复序列是指重复单元首尾依次相连,重复几十次到几百万次不等。串联重复序列的重复单元通常含有1-500个碱基,可分为编码区串联重复序列和非编码区串联重复序列。编码区串联重复序列主要是编码rRNA、tRNA和组蛋白的基因,而非编码区串联重复序列则主要包括卫星DNA、小卫星DNA和微卫星DNA三种类型。我们熟知的端粒(Telomere),着丝粒(Centromere) 和rDNA都属于串联重复序列。

 

Rita Gemayel, et al. Annu Rev Genet. (2010)(左)

Sheila A. Stewart, et al. Annual Review of Cell and Developmental Biology. (2006)(右)

 

片段重复是指长度为1-300 kb的大片段重复序列,分为染色体内片段重复Intrachromosomal duplication)和染色体间片段重复(Interchromosomal duplication)。片段重复还包括不同物种间的相似性片段重复。

 

2 重复序列的功能

 

尽管重复序列在人类基因组中占据很大比例,但是长期以来人们都认为重复序列不过是冗余DNA或者“无用”DNA(Junk DNA)。然而,随着实验技术的发展和研究的深入,科学家们逐渐发现重复序列不仅含有非编码序列也含有编码序列,并且与基因表达调控、染色体三维结构的维持以及细胞和机体衰老等都有着非常密切的联系。

 

2. 1 重复序列与基因表达调控

 

Alu重复序列作为哺乳动物基因组中SINE家族的一员,是灵长类动物基因组特有的一类散在重复序列,因其序列中含有限制性内切核酸酶AluI的识别序列AGCT,故被称为Alu重复序列。Alu重复序列多集中分布于基因转录活跃的染色体区段内,因此是基因组中最活跃的遗传元件之一。由于Alu元件在灵长类动物基因组中存在的普遍性、多样性和特异性,因此一直是科学家们研究的热点。Alu序列中含有一个14 bp的类似于SV40病毒和乙型肝炎病毒的复制起始序列,提示Alu序列可能与真核生物基因组中的复制起始有关。在目前已知基因的内含子中,几乎都发现了Alu序列,并且Alu序列中也含有某些类似真核基因内含子剪切接头的序列,提示Alu序列可能也参与了细胞核内RNA的剪接加工。此外,Alu序列大量存在于人基因组中,并且在人类组织细胞中自然存在的染色体外双链环状DNA中也包含大量Alu序列,提示其还可能与DNA重组及染色体不稳定密切相关。

最近LingLing Chen等发表在《Trends in Cell Biology》的一篇综述论文系统总结了灵长类基因组中特异存在的Alu重复序列在基因表达调控过程中的重要作用。45%的人类基因组序列由转座子来源的序列构成,而其中很重要的一部分是特殊的SINE序列-Alu序列,其占据了人类基因组超过11%的序列构成。Alu等重复序列在前期通常被认为是无用的“垃圾”序列,但是随着研究的深入,大量的证据表明Alu序列可以通过RNA Polymerase III独立转录、或者是通过RNA Polymerase II共转录,从而产生各色各样的RNA分子,并在基因组进化(DNA和转录调控水平)或者遗传信息多样性(表观遗传调控和RNA水平)等方面发挥重要的调控作用。

 

Ling-Ling Chen, Li Yang. Trends in Cell Biology. (2017)

 

 

2. 2 重复序列与染色质三维结构

 

几乎所有的雌性哺乳动物都具有两条X染色体,其中一条染色体处于几乎完全失活的状态。X染色体的失活对于雌性哺乳动物的发育至关重要,而最近的研究表明X染色体上的重复序列DXZ4与X染色体失活密切相关,利用基因组编辑技术删除失活染色体上的DXZ4,会导致X染色体三维结构的解聚。

 

Darrow EM et al. Proc Natl Acad Sci U S A. (2016)

 

 

2. 3 重复序列与衰老

 

长期以来,关于重复序列与衰老相关性的研究众多,但是由于重复序列的多样性以及细胞和机体衰老进程的复杂性,因此许多研究方向仍有待深入探索。

2.3.1 端粒与衰老

端粒DNA是位于染色体末端的串联重复序列,其与端粒结合蛋白构成了端粒结构,在控制细胞分裂周期的同时,也维持着染色体的完整性和稳定性。细胞衰老进程中通常伴随着明显的端粒缩短,因此端粒被称作细胞寿命的" 有丝分裂钟",同时端粒长度也被作为重要的细胞衰老分子标志物之一。

 

Sheila A. Stewart, et al. Annual Review of Cell and Developmental Biology. (2006)

 

2.3.2 着丝粒与衰老

着丝粒是真核生物细胞发生有丝分裂和减数分裂时,辅助染色体分离的一种“装置”。着丝粒功能的正常发挥对于细胞的正常生命活动至关重要。尽管目前关于着丝粒和衰老相关性的研究尚不深入,但是已有研究发现老年雌性小鼠卵母细胞中的着丝粒凝聚能力明显弱于年轻雌性小鼠,而这种着丝粒凝聚能力的减弱会诱导衰老相关的非整倍体卵母细胞的出现,说明着丝粒结构和功能的正常维持对于细胞正常的生命活动和细胞的健康衰老有着十分重大的意义。最近,Weiqi Zhang等的发现也揭示了人间充质干细胞衰老过程中伴随着基因组中着丝粒区异染色质的减少,而后者被证明是细胞衰老的驱动力之一(Weiqi Zhang et al. Science. 2015)。

 

Teresa Chiang et al. Current Biology. (2010)

A: 着丝粒功能正常组;B-E: 着丝粒凝聚异常组。

 

2.3.3 核糖体DNA(rDNA)与衰老

核糖体是负责蛋白质翻译的重要细胞器,由核糖体蛋白和核糖体RNA(Ribosome RNA,rRNA)构成。而核糖体DNA(Ribosome DNA,rDNA)则是基因组中可以转录产生rRNA的基因。rDNA的活性改变在核仁周期(即细胞分裂过程中核仁的消失与重建)中发挥着重要作用。在利用模式生物酵母开展的多项研究中,研究人员发现rDNA的稳定性与酵母的衰老调控密切相关。

 

Austen R.D. Ganley et al. Molecular Cell. (2009)

 

2.3.4 LINE1(L1)与衰老

哺乳动物基因组中都散落着众多称之为反转录转座子(Retrotransposons)的DNA重复序列。反转录转座子在人类基因组中以LINE1为代表,LINE1在人类基因组中占据了17%的序列构成。活化的LINE1序列首先被转录成RNA,然后再被由LINE1自身编码的逆转录酶重新转变为DNA,该DNA可再次随机整合进入基因组中。正常情况下,紧致的异染色质状态、LINE1重复序列区域的高度甲基化以及SIRT6蛋白在LINE1启动子区域实施的组蛋白去乙酰化功能等因素可有效抑制LINE1的转录,从而限制其转座活性。伴随衰老进程,细胞核内的异染色质解聚,LINE1重复序列区域DNA甲基化水平的变化以及SIRT6蛋白表达下调使得LINE1启动子区域组蛋白表观遗传修饰状态发生改变;这些都会导致LINE1转录和转座活性的增强,从而诱发全基因组范围的基因组不稳定性,最终导致细胞的衰老和组织功能的衰退。

 

 Vera Gorbunova et al. Science. (2014)

 

2.3.5 Alu与衰老

已有研究证明了Alu序列与人类组织器官衰老之间存在重要的相关性。美国肯塔基大学的Jayakrishna Ambati实验室发现microRNA合成相关的重要蛋白DICER的条件性敲除会造成Alu转录本在视网膜色素上皮细胞(RPE细胞)中的大量累积,并进一步导致细胞毒性,从而引起老年性黄斑变性的发生。此外,近期的一项研究发现老年人来源白色脂肪细胞中的Alu序列拷贝数明显高于青年人来源的白色脂肪细胞,而在骨骼肌细胞中却没有显著性差异,提示Alu序列的稳定性对于白色脂肪细胞的功能及其衰老可能也具有一定的调控作用。

 

Hiroki Kaneko et al. Nature. (2011) (左);R. Garrett Morgan et al. PLOS One (2017) (右)

 

目前已有的研究提示我们,人类基因组中广泛分布的重复序列与人类衰老以及衰老相关疾病密切相关。然而,若想深入揭示基因组重复序列调控人类衰老的机制,则必须实现新技术和工具方面的突破。最近,中国科学院的研究人员发展了一种新型的TTALE系统,可用于在细胞内实时标记基因组中的端粒、着丝粒和rDNA等重复序列。并且利用该成像系统观察到了细胞衰老进程中的端粒缩短、着丝粒异染色质失序以及rDNA拷贝数的减少等一系列重复序列变化,为后续进一步研究重复序列对细胞和机体衰老的调控机制提供了便利。此外,该研究还证明了rDNA拷贝数的减少可用做评价人类衰老进程的新型分子标志物。

 

Ren R et al. Cell Research. (2017)

 

随着研究的深入,尽管对基因组重复序列的构成和功能还知之甚少,但是人们已然发觉这些“神奇序列”对于认识和干预人类衰老的重要意义。期待未来的科学研究可以尽早揭开这些基因组中“不速之客”的神秘面纱,让我们拭目以待吧!

 

编辑:王亭亭

插图:竹一贤

(请遵守医嘱服用任何药物)

 

 

(转自微信公众号“醉心科学”)

主办方:

国家干细胞资源库
承办方:

中国科学院干细胞与再生医学创新研究院
中国科学院动物研究所
地 址:北京市海淀区北四环西路25-2
邮 编:100190
电 话:010-62559405
邮 箱:nscrc@ioz.ac.cn
版权所有 ©    国家干细胞资源库     京ICP备05064604号-26