doi:10.3969/j.issn.2095-3887.2021.02.010
中国十大名茶!综"!哺乳动物Y染体的测序进展
滑留帅"阳,王璟%$$,汪聪勇&,师志海%,4,施巧婷%,王二耀%
(%•河南省农业科学院畜牧兽医研究所,郑州450002;
2.河南省鼎元种牛育种有限公司,郑州450046;
3.河南省畜禽繁育与营养调控重点实验室,郑州450002;
4.郑州市兽医生物信息重V实验室,郑州450002)
摘要:哺乳动物的性染体由一对常染体演化而来,其中x染体在物种间相对保守,而Y染体则存在很大的变异,包括染体的大小、结构和基因数量等。研究Y染体的遗传结构与变异,对于理解哺乳动物的起源进化、性别决定以及动物繁殖都具有重要意义。因此,文章综述了哺乳动物Y染体的结构与变异,以及Sanger测序技术、二代测序技术、三代测序技术在Y染体测序中的应用,并展望了基于CRISPR-dCas9可视化系统的流式染体分离技术,以及高精度的三代测序技术在Y 染体中的
关键词:Y染体;测序;CRISPR-dCas9;PacBio CCS
中图分类号:Q812文献标识码:A文章编号:2095-3887(2021)02-0049-06
Sequencing Progress of Mammalian Y Chromosome
网银转账手续费HUA Liushuai1'3'4,WANG Jing1'3,WANG Congyong2,SHI Zhihai1'4,SHI Qiaoting1,WANG Eryao1
(1.Institute of Animal Husbandry and Veterinary Science,Henan Academy of Agricultural Sciences,
Zhengzhou450002,China;2.Henan Dingyuan Cattle Breeding Co.Ltd.,Zhengzhou450046,China;
3.Henan Key Laboratory of Farm Animal Breeding and Nutritional Regulation,Zhengzhou450002,China;
4.Zhengzhou Key Laboratory of Veterinary Bioinformatics,Zhengzhou450002,China)
Abstract:The sex chromosomes of mammals evolved from a pair of autosomes.The X chromosome is relatively conserved among species,while the Y chromosome has great variations,including the size,structure,and number of genes.Studying the genetic structure and variation of the Y chromosome is of great significance for understanding the origin and evolution of mammals,sex determination,and animal reproduction.The structure and variation of mammalian Y ch
romosome,and the application of Sanger sequencing technology,second-generation sequencing technology,and third-generation sequencing technology in Y chromosome sequencing was reviewed.The application prospects of flow chromosome separation technology based on the CRISPR visualization system and the high-precision third-generation sequencing technology in Y chromosome sequencing were reviewed. Keywords:Y chromosome;sequencing;CRISPR-dCas9;PacBio CCS忠于职守
大部分脊椎动物都有性染体,其中哺乳动物多是
收稿日期:2021-01-04
基金项目:河南省农业科学院自主创新专项基金(2020ZC37);河南省肉牛产业技术体系(S2013-08);国家肉牛耗牛产业技术体系(CARS-37)
作者简介:滑留帅(1982-),男,博士,副研究员。研究方向为基因组与生物信学
通信作者:王二)1(1971-),男,博士,研究员,研究方向为肉牛生产学雄性异配型(XY雄性,XX雌性),鸟类多是雌性异配型(ZW雌性,ZZ雄性),爬行动物、两栖动物和鱼类比较复杂,除部分物种没有性染体,属于环境型性别决定外,大部分物种都属于遗传型性别决定,既有雄性异配型也有
雌性异配型。哺乳动物的性染体由一对常染体演化而来,其中X染体在物种间相对保守,而Y染体
则存在很大的变异,包括染体的大小、结构和基因数量等叭研究Y染体的遗传结构与变异,对于理解哺乳动物的起源进化、性别决定以及动物繁殖都具有重要意义。与耗资巨大、周期超长的首次人类基因组测序计划不同,随着测序技术的不断进步,目前测序速度和成本都发生了巨大的变化,大规模基因组测序计划,例如1000人基因测序计划叫地球生物基因组计划[3]等,也变得越来越普遍。但是目前仅有少数的哺乳动物Y染体被完整测序。Y染体序列信息的缺乏,已经成为脊椎动物基因组功能与进化研究的重要阻碍。因此,文章综述了哺乳动物Y染体的结构与变异,以及测序技术在Y染体测序中的应用、困难与前景,以期为理解哺乳动物Y染体的遗传与进化
1哺乳动物Y染体的基本结构
Y染体是基因组中小的染体,小于
体基因组的3%。Y染体总体上由2部分组成,分别是拟常染体区域(Pseudoautosomal region,PAR)和雄性特异性区域(Male-specific region of the Y chromosome, MSY)。其中PAR于Y染体的远端,占到Y染体的5%。PAR在减数分裂时期能够与X染体发生同源重组,因此该区域的遗传特征与常染体类似。MSY是雄性个体特有的,不与X染体发生同源重组,占到Y染体的9
5%。根据MSY的基因结构,又可以进一步分为X退化(X-degenerate,Xd)区域和Y扩增(Y-amp1iconic,Ya)区域。其中Xd区域是Y祖先染体Ancestral autosome的遗,有的Y基因Ya区域则是Y染体独立进化部分,含有大量的重复序列(序列间一致性大于50%)、回文序列(长达数Mb的反向亀序列,序列一致性大于99.9%)和多拷贝基因
2Y染体上的基因数量
与相对保守的X染体不同,Y染体在进化过程中98%的祖先染体序列都发生了退化或丢失,正因为这样,长期以来Y染体被认为是基因组中基因匮乏的遗传随着遗传分析的不断深入,人们逐渐意识到,Y染体不仅不是遗传荒漠而且属于基因和功能富集区。有研究表明,人的MSY有27个基因/基因家族,包含18个单拷贝基因和9个多拷贝基因家族,合计78个蛋白编码基因,基因密度(3.4基因/Mb)略低于X染体(7.1基因/Mb)和常染体(5.6基因/Mb)⑺;小鼠MSY的基因密度(7.5基因/Mb)高于人类,有9个单拷贝基因和8个多拷贝基因家族,共674个蛋白编码基因,仍略低于X染体(9基因/Mb)和常染体(11.5基因/Mb)叫牛的MSY包含12个单拷贝基因和16个多拷贝基因家族,共1274个蛋白编码基因,基因密度为31.2基因/Mb,显著高于X染体(9.4基因/Mb)和常染体(10.2基因/Mb)叫不管基因密度如何,人、鼠和牛的Y染体编码的蛋白质种类有近30个,而这近30个蛋白质又可以分为2类,即由单拷贝基因编码和多拷贝基因编码。单拷贝基因主要位于Xd区域,通过对多个哺乳动物的单拷贝基因对比分析表明,基因往往在体内广泛表达,参与包括转录、剪切、
翻译、泛素化、染质修饰等在内的调控过程,说明Y染体对于雄性动物 的整体生物过程均具有重要的调控作用。多个拷贝基因主要位于Ya区域,一般在睾丸组织和脑组织中表达,编码的蛋白大参与精子发生的调控,从而对于动物的繁殖非常重要4$0"。
3Y染体上的遗传变异
Y染体上的遗传变异主要包含4种类型,分别是 简单重复序列(Simple sequence repeat,SSR),也称微卫星序列;单核昔酸多态性(Single nucleotide polymorphism, SNP)和插入与缺失(insertions and deletions,InDels);拷贝数变异(Copy number variation,CNR以及染体结构变异(Structure variation,SV)。其中,Y染体Xd区域作为长期进化过程中保留下来的祖先染体遗迹,序列中的SNPs和InDels是研究动物性染体遗传进化的活化石。而Y染体上的Ya区域,由于其自身的多重复特征,拷贝数变异也是Y染体遗传变异的主要形式。拷贝数变异主要指染体大于1kb以上的DNA片段的缺失、插入、重复等。Y染体拷贝数变异,被证明与雄性不育、癌症、听力损伤、冠状动脉异常等种疾病都有关联。例如,Y染体上的无精子基因(Azoospermia factor,AZF)有3种常见的拷贝数变异,分别是AZFa、AZFb和AZFc微缺失,均能够导致无精子症。其中AZFc 是最常见的微缺失类型,在男性中的发生比例为1/4000,其能够导致大量畸形精子,并让精子发生在晚期停滞[15]o 在小鼠,微同与性不育,在Yp的一种微缺失能够导致早期精子发生的停滞,而发生在Yq的一种微缺失能够导致精子头部异常,同时微缺失还子代性别比例失衡[16]。除了微缺失,多拷贝基因
的拷贝数变异也是Y染体上常见的遗传变
异类型。Zhang等血通过分析Y染体热休克转录因子(Heat-shock transcription factor Y-linked,'SFY)、Y染体锌指蛋白280B(Zinc finger protein280B Y-linked, ZNF280BY):Y染体黑素瘤特异性抗原(Preferentially expressed antigen in melanoma Y-linked,PRAMEY)和Y 染体睾丸特异性蛋白(Testis-specific protein on Y chromosome,TSPY)等基因拷贝数的结果表明,VW TSPY拷贝数的异常增多可能也是雄性V牛不育的主要原因。Yue等[18啲研究结果表明,PRAMEY的拷贝数与荷斯坦牛的睾丸大小、正常精子比例呈负相关;他的另一项研究发现,ZNF280BY的拷贝数与授精后母牛受孕率呈正相关呵。Pei等顾的研究结果表明,ZNF280AY的拷贝数与荷斯坦牛的正常精子比例和精子密度呈负相关。4哺乳动物Y染体测序进展
4.1Sanger测序技术在Y染体测序中的应用
早期的Y染体是通过构建细菌人工染体(BACs)和Sanger测序来实现的,其中应用单倍体迭代组装与测序(Single-haplotype iterative mapping and sequencing,SHIMS)技术,完成了人、大猩猩、恒河猴和小的Y染体测序与组装。SHIMS方法虽然准确,也能基因,其和贵,限制了它的进一步应用[21]o
4.2二代测序技术在Y染体测序中的应用
相对于SHIMS,二代测序技术也称下代测序技术(Next generation sequencing,NGS),具有超高的测序通量,与一相比,NGS的代表平台有Roche454,Solexa/Illumina,ABI solid和Ion Torrent等相SHIMS,NGS的通,其,例,Illumina的一
小于300Rp,从而在组装重复序列时有天生的缺陷。为
多特的Y染体时遇到的困境,大量的细胞遗传学、计算生物学的手段被组合后,应用于Y染体的辅助组装,这些技术总体上可以分用生物技术富集Y染体样品和计算生物技术富集Y读长(Y reads)或Y重叠(Y contigs)两种思路。
4.2.1利用生物学技术富集Y染体样品通过在测序前富集Y染体DNA,大幅度降低测序成本,并降低后期组装难度,提高组装质量。
(1)染体显微切割。是在显微镜的辅助下,从单个 或多个分裂中期的细胞中,利用显微针或激光束分离出目标染体的方法!22"。获得目标染体后,经过进一步的扩增或克隆,然后进行测序。显微切割能够避免其他染体的污染,从而比较精确地获得目标染体,但缺点是效率较低,且后期的扩增步骤也会人为引入错误,从而让下游的组装变得更复杂。显微切割被用于沙氏变蜥和地中海粉螟性染体的分离。
(2)染体流式分离。是根据不同染体的大小和GC含量,利用流式细胞仪分离目标染体的方法凶。流式分离可以实现高通量自动化操作,分离效率较高,但是,不同染体如果有类似的大小和GC含量,往往会被混在一起,另外,小染体往往会与大染体的碎片混在一起,从而降低分离效率。流式分离被用于大猩猩和猪Y染体的分离,也被用于制备探针鉴定猫、狗和尤 金袋鼠Y染体的BACs。
(3)染体目标捕获。是利用近缘物种的一段Y染体片段作为探针,捕获目标样品中Y染体的方法!24"。目标捕获可以并行操作,从而同时分析大量的样本,但是,由于依赖近缘物种片段,因此应用受到限制,同试验操作复杂,成本较高。染体目标捕获被用和大的体研究
4.2.2利用计算生物学技术富集Y reads或Y contigs由于没有任何富集方法是100%精确的,因此利用生物学的方法进一步去除非Y染体,能够进一步降低组装的难度。或者在有些测序项目中,如果测序样本是异子基因,多质的Y contigs会作
项目的,鉴定Y contigs也要的
(1)基于参考物种序列。通过将测序reads与近缘物种的Y染体比对后,即可得到测序物种的Y染体reads。或者相反,使用近缘物种的已知序列与测序物种的contigs比对,从而筛选出测序物种的Y contigs[25]O本依赖近缘种,因会种分化的分已同子基因的种,通过将异子的reads比同子基因组后,
获得的剩余reads即为Y reads。或者将异配子样的contigs与同子基因比,的contigs即Y contigs^"单高效,但同样除了依赖已的基因
,还会丢失Y染体上与X或常染体的同源序列。
(2)基雄个体数据比同异子
样本和同配子样本,将同配子测序reads比对到异配子contigs上,理论上Y contigs上仅会有极低的同配子reads覆盖,从而可以将Y contigs鉴定出来[27]O本方法虽然不依赖已有的基因组信息,但是同样存在丢失Y染体上与X或常染体同源序列的风险。
(3)基于Y染体多重复特征。因为Y染体具有多重复特征,Y染体序列k-mers的频率会显著高于单拷贝序列。因此将测序数据转换为k-mers后,首先基于k-mers的频率鉴定Y来源的k-mers(Y-mers),然后利用Y-mers判别测序reads是否来源于Y染体凶。或者,将的contigs转换为k-mers,k-mers频率与常染体k-mers平均频率的关系,判别获得的contigs是否来源于Y染体!2&"。本方法要求测序样本提前集,否则会大量丢失Y染体上的单拷贝序列信息,同时也会将基因组中其他位置的多拷贝序列混入结中
4.3三代测序技术Y染体测序中的应用
怎么查看电脑配置信息
针对二代测序技术读长较短的缺点,以单分子测序技术为基础的三代测序技术(Third-generation sequenc­ing,TGS)在保证测序通量的基础上,显著提高了测序的读长。三代测序的代表平台有PacBio SMRT和Oxford Nanopore,其中,PacBio的平均读长可以达到10kH左右,最长的读长可达60kb,Oxford Nanopore的平均读长可达20kb,最大读长可达800kb!30+31"的TGS在组装基因组上具有天然优势,但是前TGS过高的测序错误率(PacBio约15%,Oxford Nanopore约40%),要求在组装之前首先要对测序数据[32]O
系列物学法的,,
纠三代,二代三代混合纠错等[33],以及基于组装法的,测序前已为基因组测序的
流技术!34"。TGS纠错步骤对于常染体的组装没有太大影响,但是对于Y染体这样的多重复序列仍存在一个重要有,会为重复序列的然异,而然异是组重复序列的心信息。因此,利用现有的三代测序技术仍不能完整组装具有重复特征的Y染体。
4.4其他基因组技术在Y染体测序中的应用
除了TGS的长读长能够显著地改进现有基因组组装效率外,也有一些其他技术或信息可以用于基因组辅助组装,例如,H i-ca」、光学图谱昭和遗传图谱阿等,其中遗传图谱对于单倍体特征的Y染体不
适用,Hi-C 和光学图谱在常染体的组装中均显示出巨大的优势,但是对于Y染体这样的多重复序列却提升有限。
5新技术有望解决目前的Y染体测序组装困境5.1更高效的染体分离技术
更高效的染体分离技术有望更精准地富集Y染体,核型分析一直是细胞遗传学的重要研究手段,通过与流式细胞技术相结合而创造的流式核型分析不仅能够在悬浮状态下分析染体,还能用于目标染体的分离。但是流式核型分析的分离效率会极大地受到染体大小和GC含量以及其他染体碎片的干扰。进一步将流式核型分析与分子荧光探针相结合而创造的流式荧光原位杂交技术(Flow-fluorescence in situ hybridiza­tion,flow-FISH)虽然能够更加精确地分析染体,但是在式荧光原位杂交操作过程中,染体需要经历甲醛固定和高温变性的步骤,因此难以保证所获染体的完整性!3%"。成簇的规律间隔短回文重复序列及其相关蛋白9(Clustered regularly interspaced short palindromic repeats-Cas9,CRISPR-Cas9)技术是近几年迅速发展的一项可以 对基因组精确编辑的生物技术,在CRISPR系统中,Cas9/sgRNAs与DNA靶点有很强且稳定的结合力,通过引入具有核酸酶活性缺陷的Cas9衍生物(Nuclease-de-ficient derivatives of Cas9,dCas9),CRISPR-dCas9技术还能够被用于染体片段可视化,而用于原位研究细胞染质空间结构和基因表达,而不需要对细胞进行甲醛固定和高温变性等步骤妙拠。针对早期CRISPR-dCas9染体可视化技术存在亮度低、荧光颜数量受限、操作复杂,前的方是,在体转的sgRNAs上标学荧光基,从而在活细胞中高多彩、高分辨率的染质
可视化刖。理论上,如果将流式核型分析与CRISPR-dCas9可视化系统相结合,也可以用于目标染体的分离,该方法将结合流式细胞的高通量和CRISPR系统精准结合的优点,同时避免荧光原位杂交技术中的退火和固定步骤,从而有望成为一种新型的染体精准分离技术。通过对Y染体的精准富集,能够显著降低后期的测序工作量和组装难度。
5.2更精准的三代测序技术
更精准的三代测序技术有望避开纠错步骤从而提升多重复序列的组率PacBio近单分子实时(Single molecule real-time,SMRT)测序技术,称
为环形一致性测序(Circular consensus sequencing, CCS),CCS获得的平均reads长度可达13.5kb,而准确度可达99.8%,显著高于之前的SMRT测序(约85%)阿。CCS技术在组装基因组的应用上具有显著的优势,包括降低测序最低深度要求、提高组装的连续性与速度等。对于多重复特征的Y染体,这种高精度、长读长的CCS有望避开纠错步骤,从而避免纠错步骤消除拷贝间的自然变异。针对CCS中仍然存在的0.2%的测序错误,理论上可以利用算法将其筛选出来,在剔除低频的测序错误后,基于保留的拷贝,有望大幅度提升多拷贝序列的组装效率。
6结语
因为Y染体的多重复特征,测序Y染体对于现有的测序技术一。基于期染体分离技术和测序技术的进步,未来应该进一步优化Y染体的,综用Y染体的多重复特征、
雄基因组信息、雌雄reads信息、二代三代reads信息和 等多种,从而实现Y染体的高组装。组装的Y染体对于揭示Y染体
拷贝、Y,Y基因、开,性、服务育种实践都具有重要意义。
参考文献
[1]Liu Wan Sheng.Mammalian sex chromosome structure,gene content,
and function in male fertility[j].Annu Rev Anim Biosci,2019,7:103—
124.
[2]Consortium The1000Genomes Project.A global reference for human
genetic variation[J[.Nature,2015,526(7571):68—74.
[3]Lewin Harris A,Robinson Gene E,Kress W J,et al.Earth BioGenome
Project:sequencing life for the future of life[J].P Natl Acad Sci USA,
2018,115(17):4325—4333.
系统软件卸载
[4]Chang Ti Cheng,Yang Yang,Retzel Ernest F,et al.Male—specific re—
gion of the bovine Y chromosome is gene rich with a high transcrip—
tomic activity in testis development[J].P Natl Acad Sci USA,2013,110
30)12373—12378.
[5]Tomaszkiewicz Marta, Medvedev Paul,Makova Kateryna D.Y and W
chromosome assemblies approaches and discoveries J.Trends Genet,
婚姻法离婚2017,334)266—282.
6Graves J A.Sex chromosome specialization and degeneration in mam—mals J.Cell,2006,1245)901—914.
7Skaletsky Helen,Kuroda—Kawaguchi Tomoko,Minx Patrick J,et al.
The male—specific region of the human Y chromosome is a mosaic of
discrete sequence classes[j].Nature,2003,423(6942):825—837.
[8]Soh Y Q Shirleen,Alfoldi Jessica,Pyntikova Tatyana,et al.Sequencing
the mouse Y chromosome reveals convergent gene acquisition and amp—lification on both sex chromosomes J.Cell,2014,1594)800—813.
9Bellott Daniel W,Hughes Jennifer F,Skaletsky Helen, et al.Mam—malian Y chromosomes retain widely expressed dosage—sensitive regu—
lators[J].Nature,2014,508(7497):494—499.
[10]Clark Andrew G.The vital Y chromosome[J[.Nature, 2014,508
7497)463—464.
[11]Charchar F J,Bloomer L D,Barnes T A,et al.Inheritance of coronary
artery disease in men an analysis of the role of the Y chromosome J.
Lancet,2012, 3799819)915—922.
12Dhanoa Jasdeep Kaur, Mukhopadhyay Chandra Sekhar,Arora Jaspreet Singh.Y—chromosomal genes affecting male fertility:a review[j].Vet World,2016,97)783—791.
13Kido Tatsuo,Lau Yun—Fai Chris.Roles of the Y chromosome genes in human cancers J.Asian Journal of Andrology,2015,173)373—380.
[14]Wang Qiuju,Xue Yali,Zhang Yujun,et al.Genetic basis of Y—linked
hearing impairment J.Am J Hum Genet,2013,922)301—306. [15]Sadeghi—Nejad Hossein,Oates Robert.The Y chromosome and male
infertility[J].Curr Opin Urol, 2008,18(6):628—632.
[16]Rives Nathalie.Y chromosome microdeletions and alterations of sper—
matogenesis,patient approach and genetic counseling J.Ann En—docrinol, 2014, 752)112—114.
17Zhang G W,Guan J Q,Luo Z G,et al.A tremendous expansion of copy number in crossbred bulls(Bos taurus n Bos grunniens)[J[.Journal of Animal Science,2016,9<4)1398—1407.
18Yue X P, Chang T C,DeJarnette J M,et al.Copy number variation of PRAMEY across breeds and its association with male fertility in Hol—stein sires J.J Dairy Sci,2013,9612)8024—8034.
19Yue Xiangpeng, Dechow Chad, Chang Ticheng,et al.Copy number variations of the extensively amplified Y—linked genes,HSFY and ZNF280BY,in cattle and their association with male reproductive traits in Holstein bulls J.BMC Genomics, 2014,151)113.
20Pei S W,Qin F,Li W H, et al.Copy number variation of ZNF280AY across21cattle breeds and its association with the reproductive traits of Holstein and Simmental bulls J.J Dairy Sci,2019,1028)7226—7236.
21Bellott Daniel W, Cho Ting—Jan,Hughes Jennifer F, et al.Cost—effec—tive high—throughput single—haplotype iterative mapping and se—quencing for complex genomic structures J.Nat Protoc,2018,134)
787—809.
22Zhou Ruonan,Hu Zanmin.The development of chromosome microdis—section and microcloning technique and its applications in genomic re—search J.Curr Genomics,2007,81)67—72.
[23]Dolezel Jaroslav,Vrana Jan,Safai Jan,et al.Chromosomes in the flow