湖南农业大学学报(自然科学版)2023,49(5):529–534.DOI:10.13331/jki.jhau.2023.05.005
Journal of Hunan Agricultural University(Natural Sciences)
引用格式:
张佳欣,高旭泽,陈梦君,宋宇轩,荆欣,刘治滩,冯佩林,陈大福,郭睿.意大利蜜蜂Hippo信号通路
相关基因及其全长转录本的鉴定与分析[J].湖南农业大学学报(自然科学版),2023,49(5):529–534.
ZHANG J X,GAO X Z,CHEN M J,SONG Y X,JING X,LIU Z T,FENG P L,CHEN D F,GUO R.Identification and investigation of genes and their full-length transcripts relative to Hippo signaling pathway in
Apis mellifera ligustica[J].Journal of Hunan Agricultural University(Natural Sciences),2023,49(5):529–534.
投稿网址:xb.hunau.edu
意大利蜜蜂Hippo信号通路相关基因
及其全长转录本的鉴定与分析
张佳欣1,高旭泽1,陈梦君1,宋宇轩1,荆欣1,刘治滩1,冯佩林1,陈大福1,2,郭睿1,2*
(1.福建农林大学动物科学学院(蜂学学院),福建福州350002;2.福建省蜂疗研究所,福建福州350002)
摘要:采用Blast工具将已鉴定到的意大利蜜蜂(Apis mellifera ligustica,简称意蜂)全长转录本比对Nr数据库,共鉴定到意蜂Hippo信号通路中相关的49个基因及其550条全长转录本。运用Gffcompare软件将鉴定到的Hippo 信号通路相关全长转录本与西方蜜蜂参考基因组(Amel_HAv3.1)上注释的转录本进行比较,分别延长西方蜜蜂参考基因组注释到Hippo信号通路的9个基因的5'UTR和7个基因的3'UTR。通过Astalavista软件鉴定到Hippo 信号通路相关的4个基因的7次可变剪切(AS)事件,包括2次外显子跳跃、2次内含子保留和3次可变5'端剪接。
通过PCR验证了1个基因的AS事件真实性。利用TAPIS pipeline鉴定到意蜂Hippo信号通路相关的24个基因含有1个及以上可变多聚腺苷酸化(APA)位点,其中含有1个APA位点的基因数量最多。通过TBtool软件鉴定APA位点上游motif的一致性序列HVNCCNBNDYVDVVHVNDBVDYCNBBDNNNHNNVNNVMNN。
关键词:西方蜜蜂;意大利蜜蜂;Hippo信号通路相关基因;全长转录本
中图分类号:Q969.557.7文献标志码:A文章编号:1007–1032(2023)05–0529–06
Identification and investigation of genes and their full-length transcripts relative to Hippo signaling pathway in Apis mellifera ligustica
ZHANG Jiaxin1,GAO Xuze1,CHEN Mengjun1,SONG Yuxuan1,JING Xin1,
LIU Zhitan1,FENG Peilin1,CHEN Dafu1,2,GUO Rui1,2*
(1.College of Animal Sciences (College of Bee Science), Fujian Agriculture and Forestry University, Fuzhou, Fujian
350002, China; 2.Apitherapy Research Institute of Fujian Province, Fuzhou, Fujian 350002, China)
Abstract: The previously identified full-length transcripts of Apis mellifera ligustica were aligned to the Nr database by Blast tool, a total of 49 genes and their 550 full-length transcripts relevant to the Hippo signaling pathway were identified. The identified 550 full-length transcripts relative to the Hippo signaling pathway were compared with the annotated transcripts in the Apis mellifera (A. mellifera) reference genome (Amel_HAv3.1) using the gffcompare software, the 5' UTRs of 9 genes and the 3' UTRs of 7 genes annotated to the Hippo signaling pathway in the A. mellifera reference genome were
respectively prolonged. Based on the Astalavista software, 7 alternative splicing (AS) events in 4 genes were identified, including two exon skipping, two intron retention and three alternative 5'splicing sites. The authenticity of AS events in 1 gene was verified by PCR. On basis of the TAPIS pipeline, 24 genes associated with the Hippo signaling pathway were identified to contain at least 1 alternative polyadenylation (APA) sites individually; among
收稿日期:2023–03–21修回日期:2023–08–25
基金项目:国家自然科学基金面上项目(32172792);国家现代农业产业技术体系专项资金项目(CARS–44–KXJ7);福建省自然科学基金面上项目(2022J01131334);福建农林大学科技创新专项基金项目(KFb22060XA)
作者简介:张佳欣(1998—),女,湖北十堰人,硕士研究生,主要从事蜜蜂分子生物学研究,**********************;*通信作者,郭睿,博士,副教授,主要从事昆虫–病原互作研究,*******************
530 湖南农业大学学报(自然科学版)xb.hunau.edu 2023年10月
them, the genes containing 1 APA site were the most abundant. By using the TBtool software, the cons
ensus sequence of HVNCCNBNDYVDVVHVNDBVDYCNBBDNNNHNNVNNVMNN was identified.
Keywords: Apis mellifera; Apis mellifera ligustica; Hippo signaling pathway-related genes; full-length transcript
西方蜜蜂(Apis mellifera) 在全球广泛分布,常用于农作物授粉、养蜂生产和科学研究,具有重要的生态和经济价值[1]。意大利蜜蜂(Apis mellifera ligustica,简称意蜂)是西方蜜蜂的四大亚种之一,具有优良的生产性能。W ALLBERG等[2]组装和注释了西方蜜蜂染体级别基因组(Amel_HAv3.1)。
Hippo信号通路在黑腹果蝇(Drosophila melanogaster)中被首次发现[3],作为一条进化较为保守的激酶级联反应链,在细胞增殖、组织生长、内环境稳态、免疫防御及病原侵染等诸多生物学过程中起关键作用[4]。陈庆等[5]在果蝇中鉴定到Hippo 通路上的4种主要激酶,即Hippo(Hpo)、Salvador(Sav)、Warts(Wts)和Mob肿瘤抑制因子(Mats),发现它们中的任何一种失活都会促进细胞生长和抑制细胞凋亡而导致细胞无限增殖。LI等[6]发现家蚕(Bombyx mori)中BmHpo、BmSav、BmWts、BmMats和BmYki基因的序列高度保守,在家蚕BmN–SWU1(NS)细胞系中上调和下调BmHpo后,BmHpo抑制细胞增殖,说明Hippo信号通路参与调控BmN–SWU1(NS)细胞的增殖。
目前,全长转录组研究仅在果蝇和家蚕等少数昆虫中见诸报道,多数昆虫的相关研究仍然缺失。蜜蜂的全长转录组研究迄今仅有2例报道:ZHENG 等[7]通过纳米孔测序,发现在西方蜜蜂蜂王和工蜂级型发育
过程中转录本的表达量发生动态变化,基因的可变多聚腺苷酸化(APA)和可变剪切(AS)导致转录本结构变得复杂;范小雪等[8]利用纳米孔测序技术对意蜂工蜂中肠组织RNA进行测序并获得了长读段数据。在范小雪等研究基础上,笔者运用生物信息学方法鉴定意蜂Hippo信号通路相关基因和全长转录本,进而对基因的AS事件和APA位点进行鉴定,以期展示意蜂Hippo信号通路相关基因和全长转录本的全面信息,为开展相关基因和剪接体的功能研究提供参考。1意蜂纳米孔测序长读段数据来源
范小雪等[8]制备意蜂7日龄和10日龄工蜂中肠样品,完成了RNA提取、cDNA建库、纳米孔测序及数据质控,获得了长读段测序数据,以此长读段测序数据作为本研究数据来源。
2研究方法
2.1意蜂Hippo信号通路相关基因和全长转录本
的鉴定
参照蔡宗兵等[9]的方法,使用Blast工具(采用默认参数)将鉴定到的意蜂全长转录本序列比对到Nr数据库(bi.v/blast/db/FAS TA/),根据注释信息筛选Hippo信号通路相关基因和全长转录本。
2.2西方蜜蜂参考基因组注释的Hippo信号通路
相关基因的结构优化
按照杜宇等[10]的方法,利用gffcompare( ccb.jhu.edu/software/stringtie/gffcompare.shtml)将鉴定到的Hippo信号通路相关全长转录本与西方蜜蜂参考基因组(Amel_HAv3.1)上已注释的转录本进行比较,优化已注释基因的结构,并鉴定未注释的新基因和新转录本。如果在已注释基因边界外区域有比对上的读段,则将基因的非翻译区(UTR)向上游或下游延伸,以修正边界。
2.3意蜂Hippo信号通路相关基因的AS事件鉴定
及PCR验证
参照陈华枝等[11]的方法,运用Astalavista软件鉴定意蜂工蜂Hippo信号通过相关基因的AS事件,采用默认参数。进一步统计内含子保留(IR)、外显子跳跃(ES)、可变5'端剪接(A5SS)等3种类型的AS 事件数量。
随机选择肌动蛋白克隆205样异构体X1基因(AS类型为ES)进行PCR验证,以验证Hippo信号通路中的AS事件准确性。根据核苷酸序列设计跨剪接位点的特异性引物(上游AACAAGAAACGGTG,
第49卷第5期张佳欣等意大利蜜蜂Hippo信号通路相关基因及其全长转录本的鉴定与分析531
下游TCA TCTCCGACCAACCAG)。以肌动蛋白基因actin(GeneBank ID LOC107999330)作为内参,并设计相应的特异性引物(上游TTATATGCCAACAC TGTCCTTT,下游AGAATTGATCCACCAATCCA)。委托上海生工生物工程有限公司合成引物。使用RNA抽提试剂盒(Promega)分别提取意蜂7日龄和10日龄工蜂中肠样品的总RNA,等量混合后作为模板进行反转录,得到的cDNA作为模板进行PCR 扩增。反应体系和程序按照范小雪等[10]的报道设置。PCR产物经3%的琼脂糖凝胶电泳检测后,使用核酸凝胶成像仪(Bio–red)观察和拍照。
2.4意蜂Hippo信号通路相关基因的APA位点鉴定
参照杜宇等[12]的方法,利用TAPIS pipeline[13]鉴定酚氧化酶及丝氨酸蛋白酶相关基因的APA位点,参数设置:–meme–minw 6,–meme– maxw 6,–norc,–fimo–skip,–spamo–skip。采用TBtools v1.046 软件分析所有APA位点的上游50 bp的序列特征,进而鉴定出motif。3结果与分析
3.1意蜂Hippo信号通路相关基因和全长转录本
的鉴定
采用Blast工具,将已鉴定到的意蜂全长转录本比对Nr数据库,共鉴定到意蜂Hippo信号通路中相关的49个基因及其550条全长转录本。由于鉴定到的相关基因和全长转录本数量较多,仅在表1中展示意蜂Hipp
o信号通路相关的15个基因及其全长转录本。注释到14–3–3蛋白ε全长转录本最多,为14条;注释到转录增强因子TEF–1亚型X4的全长转录本为13条;注释到支架蛋白,肌动蛋白、克隆205蛋白,肌动蛋白、肌肉,丝氨酸/苏氨酸蛋白激酶STE20,类RasGTP结合蛋白,未特征蛋白,G1/ s特异性周期蛋白EL,LIM结构域蛋白,类克隆403蛋白3,未特征蛋白、转录变体X3,蛋白Wnt–1,互作蛋白类RIP3–like和Ras关联结构域蛋白2的全长转录本均为1条(表1)。
表1意蜂Hippo信号通路相关基因和全长转录本的信息
Table 1Detailed information about genes and full-length transcripts relative to Hippo signaling pathway in Apis mellifera ligustica 基因ID 转录本ID Nr数据库注释
LOC408951 rna22499,rna22500,rna22501,rna22502,rna22505,rna22504,rna22503,
rna22506,rna22508,rna22507,rna22509,rna22511,rna22510,rna22512
14–3–3蛋白ε
LOC408616 rna613,rna614,rna615,rna616,rna617,rna618,rna619,rna620,
rna621,rna622,rna623,rna624,rna625
转录增强因子TEF–1亚型X4 LOC552413 rna10228 支架蛋白
LOC551176 rna11068 肌动蛋白,克隆205蛋白LOC725404 rna11069 肌动蛋白,肌肉
LOC551659 rna12505 丝氨酸/苏氨酸蛋白激酶STE20 LOC552419 rna12889 类RasGTP结合蛋白
LOC725708 rna13360 未特征蛋白
LOC411327 rna17403 G1/ s特异性周期蛋白EL LOC408431 rna23947 LIM结构域蛋白
LOC552637 rna27385 类克隆403蛋白3
LOC107964603rna11771 未特征蛋白,转录变体X3 LOC113218545 rna18892 互作蛋白类RIP3–like
LOC413502 rna2829 蛋白Wnt–1
LOC724888 rna8593 Ras关联结构域蛋白2
3.2西方蜜蜂参考基因组注释到Hippo信号通路
的基因结构优化
对西方蜜蜂参考基因组上注释到Hippo信号通路上的16个基因进行了结构优化。其中,正链和负链延长的基因分别为10个和6个;5'端延长的基因有9个,延长长度69 445~1 863 562 bp;3'端延长的基因有7个,延长长度1474~1 179 780 bp(表2)。
532 湖南农业大学学报(自然科学版)xb.hunau.edu 2023年10月
表2西方蜜蜂参考基因组上注释到Hippo信号通路的基因结构优化结果
Table 2The results of structural optimization of genes annotated to the Hippo signaling pathway in A. mellifera reference genome 基因ID 优化后的区域正负链优化后的末端原始位置优化后的位置LOC411327 NW_016019231.1:443246–444877 –5'443387 443246
LOC409286 NW_016017900.1:795882–799534 + 5'796182 795882
LOC552413 NW_016018566.1:2975098–2990710 + 5'2978716 2975098
LOC413669 NW_016018200.1:291402–294039 –3'293860 294039
LOC550710 NW_016019064.1:739924–743671 + 5'739945 739924
LOC550710 NW_016019064.1:739924–743671 + 3'743303 743671
NM_001185145.1 NW_016019108.1:1863259–1878104 –5'1863562 1863259
LOC726958 NW_016019208.1:22990–29197 + 3'28972 29197
LOC408292 NW_016019319.1:69445–71528 –5'69657 69445
LOC408292 NW_016019319.1:69445–71528 –3'71484 71528
LOC412617 NW_016019663.1:1175720–1179708 + 5'1175731 1175720
LOC412617 NW_016019663.1:1175720–1179708 + 3'1179171 1179708
LOC552637 NW_016019852.1:164382–167797 –5'165067 164382
LOC413502 NW_016017548.1:148–4067 + 3'1474 4067
LOC413440 NW_016018245.1:132423–165928 + 5'132500 132423
LOC413440 NW_016018245.1:132423–165928 + 3'164375 165928
3.3意蜂Hippo信号通路相关基因的AS事件及验
证结果
意蜂Hippo信号通路相关的49个基因中,鉴定到4个基因的7次AS事件,涉及外显子跳跃(ES)、内含子保留(IR)和可变5'端剪接(A5SS)等3种类型(表3),其中,肌动蛋白、克隆205蛋白编码基因(GeneBank登录号LOC551369)发生2次外显子跳跃,未表征蛋白编码基因(GeneBank登录号LOC107964603)发生2次内含子保留,丝氨酸苏氨酸蛋白磷酸酶2a催化亚基编码基因(GeneBank登录号LOC550710)和14–3–3蛋白ε编码基因(GeneBank 登录号LOC408951)分别发生2次和1次可变5'端剪接(表3)。
表3意蜂Hippo信号通路相关基因的AS事件信息
Table 3Detail information about AS events of genes related to Hippo signaling pathway in Apis mellifera ligustica
基因ID 转录本ID AS事件类型区域Nr数据库注释
LOC551369 ONT.2960.15/ONT.2960.21,ONT.2960.
16/ONT.2960.20 外显子跳跃NC_037642.1:1313313
3–13145381C
肌动蛋白,克隆205蛋白
LOC551369 ONT.2960.15/ONT.2960.19,ONT.2960.
泰国演员bee18/ONT.2960.20 外显子跳跃NC_037642.1:1313313
5–13145387C
肌动蛋白,克隆205蛋白
LOC107964603 ONT.3171.2,ONT.3171.1 内含子保留NC_037643.1:6522201
–6530388C
未特征蛋白
LOC107964603 ONT.3171.1/ONT.3171.2/ONT.3171.4/
ONT.3171.5/ONT.3171.8,ONT.3171.7 内含子保留NC_037643.1:6522199
–6530388C
未特征蛋白
LOC550710 ONT.3443.1/ONT.3443.4/ONT.3443.8/
rna12889,ONT.3443.10 可变5'端剪接NC_037643.1:1658785
5–16592972W
丝氨酸苏氨酸蛋白磷酸酶
2a催化亚基
LOC550710 ONT.3443.9,ONT.3443.1/ONT.3443.10
/ONT.3443.8/rna12889 可变5'端剪接NC_037643.1:1658782
2–16592974W
丝氨酸苏氨酸蛋白磷酸酶
2a催化亚基
LOC408951 ONT.3584.2/ONT.3584.3/ONT.3584.5/
ONT.3584.6/ONT.3584.9,ONT.3584.1/
ONT.3584.7 可变5'端剪接NC_037644.1:2330021
–2336448W
14–3–3蛋白ε
C和W分别代表负义链和正义链。
图1–A显示外显子跳跃类型。琼脂糖凝胶电泳结果显示,通过PCR扩增鉴定到肌动蛋白异构体X2基因的2个目的片段,大小分别约为659 bp和375 bp(图1–B),与基于Nanopore测序数据的预测结果(图1–C)一致,证实了该AS事件的真实性。
第49卷第5期 张佳欣等 意大利蜜蜂Hippo 信号通路相关基因及其全长转录本的鉴定与分析
533
A  外显子跳跃;
B  LOC551369扩增产物的琼脂糖凝胶电泳;
C  LOC551369经可变剪接形成的2条转录本的结构。
图1 意蜂肌动蛋白异构体X2基因的可变剪接事件验证
Fig. 1 Validation of variable splicing events in the actin  isoform X2 gene of  Apis mellifera ligustica
3.4 意蜂Hippo 信号通路相关基因的APA 位点鉴
定结果
在意蜂Hippo 信号通路相关的49个基因中,鉴定到24个基因含有1个及以上APA 位点(表4)。其中,含有1个APA 位点的基因数量最多,为4个;含有2和3个APA 位点的基因均为3个;含有4个APA 位点的基因有2个(图2–A)。由于鉴定到
的相关基因数量较多,仅在表4中展示意蜂Hippo 信号通路相关的5个基因及其全长转录本,其中含有1、2、3、4和5个APA 位点的相关基因分别展示1个。此外,在Hippo 信号通路相关基因的APA 位点上游鉴定到motif 的一致性序列为HVNCCNBNDYVDVVHVNDBVDYCNBBDNNN HNNVNNVMNN(图2–B)。
表4 意蜂Hippo 信号通路相关的5个基因的APA 位点信息
Table 4 Information about APA sites in five genes associated with the Hippo signaling pathway in Apis mellifera ligustica
基因ID 正负链 比对上的读段
APA 位点数
APA 位点
LOC409286 +  74    5 1633356,1633111,1633390,1634215,1624172 LOC725404
+  2    1 967
LOC408951 –  25    3 517460,526295,526000 LOC552419 + 129    4 743655,743427,74123 LOC552545
+
232
2
13154403,13154067
1    2    3    4  5        1  2  3  4  5  6  7  8  9  1011 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 APA 位点数量                                                    motif 的位置/nt
A  含不同数量APA 位点的基因数统计;
B  APA 位点上游40 nt 鉴定到的motif 。
图2 意蜂Hippo 信号通路相关基因所含的APA 位点及其上游的motif
Fig.2 APA sites included in genes relevant to the Hippo signaling pathway in Apis mellifera ligustica  and motifs located at upstream of APA sites
4 结论与讨论
基于前期获得的纳米孔长读段数据,本研究共鉴定到意蜂Hippo 信号通路相关的49个基因及其550条全长转录本,并对西方蜜蜂参考基因组上注释到Hippo 信号通路的9个基因的5'UTR 和7个基因的3'UTR 分别进行了延长。共鉴定到意蜂Hippo 信号通路相关的3个基因的7次AS 事件,涉及ES 、
IR 和A5SS 等3种类型。推测上述3个基因通过发生ES 、IR 和A5SS 影响意蜂Hippo 信号通路,进而调节器官大小及个体发育等过程。
本研究共鉴定到意蜂Hippo 信号通路相关的24个基因含有1个及以上APA 位点,基因占比约为49%,说明意蜂Hippo 信号通路相关基因普遍发生APA 且存在丰富的APA 位点,与白蝇(Trialeurodes vaporariorum )[14]、草地贪夜蛾(Spodoptera frugiperda )[15]
A
B  20 15 10 5 0
基因数量
4
3
2 1 0
频率