2018年3月28日同济大学生命科学与技术学院杨鹏教授课题组与美国国立卫生研究员、美国MD安德森癌症中心合作,在《Cell》杂志在线发表题为“DNA Conformation Induces Adaptable Binding by Tandem Zinc Finger Proteins”的研究论文,首次解析了含有10个以上串联锌指结构域的KRAB锌指蛋白与靶向DNA晶体复合物的结构,揭示了ZFP568结构生物学的独特性;并首次发现长链锌指蛋白中锌指结构域之间以及其与靶向DNA序列之间构象上的动态协同效应。
含有KRAB(Kruppel-associated box)结构域的C2H2锌指蛋白是脊椎动物数目最大、进化速度最快的一类转录因子家族。这些锌指蛋白基因多在脑和胚胎细胞中表达,并在上述两组织的表观遗传重编程中发挥重要作用。KRAB锌指蛋白以其串联的锌指结构域结合靶向DNA序列,并通过KRAB结构域招募辅抑制蛋白KAP1,从而进一步招募组蛋白去乙酰化酶,组蛋白H3第9位赖氨酸(H3K9)甲基转移酶SETDB1,异染色质蛋白HP1和DNA甲基转移酶等,从而对靶向序列的转录起到抑制作用。人或小鼠的KRAB锌指蛋白的串联锌指结构域长度在3到35个锌指不等,平均长度为11-13个锌指。进化生物学分析显示,KRAB锌指蛋白基因首先出现于腔棘鱼、鸟类和四足类动物的共同祖先中,并在进化过程中不断扩展和变异。而近期在人类胎肾293T细胞系的ChIPseq分析表明,几乎2/3的人类KRAB锌指蛋白结合于基因组中的转座元件。上述研究显示这些新的KRAB锌指蛋白针对于转座元件在基因组中的入侵而进化产生,并随着这些靶向转座元件因遗传漂变导致的退化而退化,只有那些可能已被整合入重要基因调控网络的KRAB锌指蛋白被保留下来。支持这一模型的证据是,在真兽哺乳动物亚纲中出现的几十个KRAB锌指蛋白都保留了DNA结合指纹,例如Zfp57,该锌指蛋白在调节包括人类在内的多种哺乳动物的印迹控制区域中保留了其祖先的功能。作为当前生物学研究的热点,锌指蛋白已经被越来越多的领域所关注,但其生物学功能仍非常不清楚。尽快近期的研究已对锌指蛋白的共有分子特性进行了深入分析,如KRAB-锌指蛋白如何通过招募共抑制因子抑制基因表达,或KRAB-锌指蛋白在基因组结合的靶向位点序列特性等,但上述研究多从宏观水平出发,而针对于特定锌指蛋白的详细研究仍然贫乏。在本研究中,我院杨鹏研究员在其之前的研究基础上,在结构生物学、遗传学、进化生物学水平上,对特定锌指蛋白基因ZFP568进行了深入研究,全面而详细地揭示了其所具有的独特性质。
在之前发表的Science文章中,杨鹏研究员报道了锌指蛋白ZFP568在基因组上专一抑制胰岛素样生长因子Igf2基因胎盘特异转录本Igf2-P0的表达,并通过此通路调控小鼠胚胎及胎盘的发育。ZFP568通过其C端的11个串联锌指结构,直接结合于Igf2-P0启动子上游的24个核苷酸结构域,并通过其N端的两个KRAB结构域招募KAP1、SETDB1等抑制性蛋白,建立H3K9甲基化,从而抑制Igf2-P0的表达。这一研究首次证实了锌指蛋白可在胎儿及胎盘发育中发挥中重要作用,并首次提出了印迹基因Igf2的新型调控机制。但是,ZFP568与Igf2之间的分子生物学机制仍不清楚。此外,在高等哺乳类动物如人类胚胎发育过程中,ZFP568与Igf2之间的调控关系是否保守也不清楚。在本研究中,杨鹏研究员与他人合作,对上述问题进行了深入解析。
小鼠Zfp568基因的人类同源物ZNF568最早是通过人相比于黑猩猩中快速进化基因的筛选中鉴定得到的。ZNF568在人类种群中有三种基因型。这三种基因型都在进化过程中积累了大量突变,有推测认为这些突变可能破坏了KRAB和锌指结构域的功能。在此研究中,通过进化生物学分析,杨鹏研究员发现申请人发现功能性的ZFP568存在于哺乳动物中,如小鼠,非洲象,家猪,恒河猴以及黑猩猩,但不包括人。这一发现与之前“Zfp568是人类基因组中最快速进化的基因”的报道相吻合;并且,ZFP568的结合序列存在于所有哺乳动物的Igf2基因启动子区,而具有转录活性的启动子存在于除黑猩猩和人以外的其他大多数哺乳动物中,说明人源ZFP568在人类中的快速进化与IGF2启动子的活性失活密切相关,两者之间存在着紧密的共进化。
在经典的KRAB锌指蛋白结构模型中,每个C2H2锌指包含两个β链和一个螺旋(helix)结构,并与三个相邻的DNA碱基相互作用;当KRAB锌指蛋白与DNA结合时,每个锌指的helix结构结合DNA双螺旋的大沟(major groove)里,两个β链和C2-Zn-H2单位存在于大沟外;每个helix的N端和前面loop中特定氨基酸侧链使得DNA大沟与一条DNA链的碱基相互接触,并且在典型的含有3个锌指结构的锌指蛋白中,这些氨基酸的同源性决定了其识别DNA序列的特性。上述“1锌指-3碱基”的法则最早发现于含有5-6个串联锌指结构域的锌指蛋白以及PRDM9和CTCF蛋白中,并被广泛推广。然而,对于大量存在于小鼠及人基因组中的含有10个以上串联锌指结构域的长链锌指蛋白,由于结晶困难或其与靶向DNA的作用机制不明等多种原因,目前其蛋白与DNA在原子水平上的生化反应机制仍不清楚。
在本研究中,通过改进蛋白表达纯化方法及荧光偏振技术,杨鹏研究员与他人合作,将小鼠ZFP568蛋白C端的11个串联锌指结构域与28bp的靶向DNA序列共结晶,解析ZFP568-Igf2这一蛋白-DNA复合物的晶体结构。分析发现,小鼠ZFP568的11个串联锌指构象与经典法则之间存在严重偏差。其锌指结构可结合2-4个不等的DNA碱基,并可与反义链上的5个胸腺嘧啶碱基相互作用。此外,ZFP568的每个锌指与其周围的锌指相互作用,共同完成了其对特异性DNA的识别。同时,IGF2 DNA的双螺旋构象也会针对于ZFP568的锌指结构域构象发生适应性变化。
综上所述,本研究首次解析了含有10个以上串联锌指结构域的KRAB锌指蛋白与靶向DNA晶体复合物的结构,揭示了ZFP568结构生物学的独特性;并首次发现长链锌指蛋白中锌指结构域之间以及其与靶向DNA序列之间构象上的动态协同效应;此外,本研究首次阐明了ZFP568与IGF2在进化上的相关性,说明了哺乳动物进化中IGF2的转录活性先于ZFP568退化。上述发现对锌指蛋白及靶向DNA在生化作用机理研究及进化研究都具有重要意义。