欢迎来到冰豆网! | 帮助中心 分享价值,成长自我!
冰豆网
全部分类
  • IT计算机>
  • 经管营销>
  • 医药卫生>
  • 自然科学>
  • 农林牧渔>
  • 人文社科>
  • 工程科技>
  • PPT模板>
  • 求职职场>
  • 解决方案>
  • 总结汇报>
  • 党团工作>
  • ImageVerifierCode 换一换
    首页 冰豆网 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    谷子ARF基因家族的鉴定与生物信息学分析.docx

    • 资源ID:12033987       资源大小:612.83KB        全文页数:20页
    • 资源格式: DOCX        下载积分:10金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    二维码
    微信扫一扫登录
    下载资源需要10金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    谷子ARF基因家族的鉴定与生物信息学分析.docx

    1、谷子ARF基因家族的鉴定与生物信息学分析谷子ARF基因家族的鉴定与生物信息学分析赵艳1 翁巧云1 马海莲1 宋晋辉1 袁进成1 王凌云1 董志平2 刘颖慧1*1 河北北方学院 河北张家口 0750002 河北省农林科学院谷子研究所河北石家庄 050001摘要:生长素应答因子(auxin response factors,ARF)是一类可以结合在生长素应答基因启动子部位的转录因子,在植物的生长发育中起至关重要作用。本研究以谷子为材料,从谷子中鉴定出24个ARF基因并命名为SiARFs。利用生物信息学对谷子SiARFs基因的结构、染色体分布、基因倍增模式、系统进化以及基因的表达模式进行分析。结果表

    2、明,SiARF基因家族在染色体上不均匀的分布,在除2号染色体外的其它染色体上都有该家族基因,基因的扩增模式为分散复制与片段复制。SiARFs基因家族具有相对保守的结构,即包含一个保守的B3 DNA结构域,ARF结构域和Aux/IAA结构域,ARF蛋白的3D结构含有3个螺旋和7个折叠结构。进化树分析表明谷子ARF蛋白和物种相近的高粱、玉米聚在一起。大多数ARF基因在谷子根、茎、叶和穗中都有表达不同基因表达量有较大差异。关键词:谷子;ARF;生物信息学分析;蛋白结构Genome-Wide Identification and Bioinformatics Analysis of ARF Gene

    3、Family in Setaria ItalicaAbstract: Auxin response factors (ARF) are important transcription factors that can regulate the expression of auxin genes and influence the plant growth. ARFs regulate the transcription of auxin-responsive genes through binding to their promoters. In this study, a total of

    4、24 ARF genes are identified and analyzed and named SiARF. A comprehensive overview of the SiARFs is undertaken, including phylogenetic analysis, gene structures analysis, chromosome locations, conserved motifs of proteins and gene expression pattern analysis.Twenty-four setaria italica ARF genes are

    5、 distributed in all setaria italica chromosomes except chromosome. Setaria italica ARF proteins share one B3 DNA binding domain, which consists of threehelixes and sevensheets. And some of these proteins have an Aux/IAA domain and ARF domain. In addition, setaria italica ARF proteins are compared wi

    6、th the proteins in other species in order to discover the evolution of ARF genes. Our results also show that the expression of SiARF genes is diverse in different tissues. Keywords: setaria italica; ARF; information analysis; protein structure通讯作者:刘颖慧,教授,研究方向为植物基因工程,email:leely519资助项目:国家科技重大专项转“2014

    7、ZX0800909B”,十二五农村领域国家科技计划项目“2011BAD06B01”,河北北方学院重大项目“ZD201305” 生长素(Auxin)是发现最早、研究最多、在植物体内普遍存在的植物激素。生长素在植物的顶端优势、微管的分化、胚胎的分化、根和茎的形态建成等植物的生长和发育各个阶段都起重要的作用。从分子水平上看,生长素在调节植物生长、发育过程需要一些生长素相关基因的表达和调控,这些基因包括Aux/IAA家族、GH3家族和小的受生长素调控的RNA家族(SAUR),以上的基因家族具有一个共性,即在它们的启动子区都含有被称为生长素应答元件的顺式作用元件(TGTCTC )1。生长素应答因子(au

    8、xin response factors,ARF)就是一些可以结合顺式应答元件介导生长素信号反应的转录因子家族。作为生长素信号转导相关的主要蛋白组分之一,ARF蛋白主要在植物生长的初期或早期发挥作用,它可与生长素应答元件(AuxRE)结合,发挥催化和刺激作用,ARF也可与生长素结合,从而抑制与AuxRE的结合而发挥抑制作用2。 ARF蛋白包括3个保守的结构域,在N-端有植物特异的 B3 DNA-结合结构域 (DBD) ,通常DBD不能结合生长素应答基因,该结构域是植物特有的而且保守性强;在中间具有激活结构域 (AD) 和抑制结构域(RD),如果ARF结合生长素应答元件就起到激活作用,如果结合生

    9、长素就起到抑制作用,中间的结构域决定ARF是发挥激活作用还是抑制作用,具有激活作用的结构域含有丰富的谷氨酰胺,抑制作用的结构域富含丝氨酸、脯氨酸、甘氨酸和色氨酸。C-端是保守的结构域(CTD),CTD结构域负责ARF蛋白之间的同源聚集或者ARF蛋白和生长素应答基因的异源聚集,决定ARF的聚集状态3。 谷子(setaria italica)在中国具有悠久的栽培历史,是中国北方的主要粮食之一。谷子基因组小且为二倍体,与水稻、高粱、玉米共线性高,使其正成为禾本科基因组研究的模式植物之一,也成为研究C4植物的模式植物4。目前谷子的全基因组测序已经完成,这为谷子分子生物学研究奠定了良好的基础5。本研究利

    10、用生物信息学相关技术鉴定谷子的ARF基因家族并对该家族基因结构进行分析,通过对其序列和蛋白的比较分析以期为谷子生长素相关基因的研究提供一定的参考。1.材料与方法1.1谷子ARF基因的鉴定及序列分析首先从Pfam数据库(http:/pfam.xfam.org/)中下载ARF家族的隐马氏模型文件(Pfam号码:PF06507)6,从Gramene(http:/www.gramene.org/)中通过Pfam号码进行相似性搜索,找到与谷子相关的基因ID 及相关蛋白序列,除去冗余,得到所需的无重复的基因、转录本及蛋白ID、蛋白序列和外显子数量。然后使用SMART(http:/smart.embl-he

    11、idelberg.de/)和CDD(http:/www.ncbi.nlm.nih.gov/Structure/cdd /wrpsb.cgi)检测蛋白结构域7,8。最后,使用ProtParam(http:/web.expasy.org/protparam/)找到与谷子ARF蛋白相关的其他信息,包括氨基酸数量、分子量以及等电点9。1.2染色体定位分析根据已经得到的基因信息,从Ensemble Plants中查询谷子染色体的长度(http:/plants. ensembl.org/Setaria_italica/Info/Index),使用adobe illustrator CS5软件绘制染色体与基

    12、因位置。1.3 系统分析ARF蛋白与进化树的绘制使用在线ProSite(http:/prosite.expasy.org/)分析24个ARF蛋白序列,得出每个蛋白相应的B3结合结构域,ARF结构域和AUX/IAA结构域的位置10。利用Clustal X在线分析所得到的ARF蛋白序列,下载得到分析结果11,然后使用Sequence Format Converter(http:/genome.nci.nih.gov/tools/reformat.html)转换结构格式,最后使用MEGA6.0软件用邻接法绘制进化树,bootstrap设置为1000。不同物种ARF蛋白进化树的绘制:采用玉米(39个)

    13、、水稻(26个)、二穗短柄草(24个)、小立碗藓(14个)、葡萄(20个)、拟南芥(23个)和谷子(24个)的共170个ARF蛋白进行综合分析,用上述方法绘制ARF蛋白的进化树。1.4 Motif的获取和ARF蛋白的3D结构预测得到ARF蛋白序列后,使用MEME工具( DNA结合结构域的motif,得到的序列使用SWISS-MODEL(http:/swissmodel.expasy.org/ workspace/index.php? func=modelling_simple1)预测其三维结构13。用上述方法绘制水稻、二穗短柄草、高粱、葡萄、小立碗藓、苜蓿、黄豆、玉米和拟南芥的B3 DNA结合

    14、结构域3D结构,与谷子进行对比分析。1.5 谷子ARF基因的表达使用GSCS2.0(2. 结果分析2.1谷子ARF基因家族的鉴定从Pfam数据库中下载ARF家族的隐马氏模型文件(Pfam号码:PF06507),查找ARF蛋白Pfam号码用以查询相似序列,总结物种蛋白保守序列,搜索谷子基因组数据库,共获得近100个ARF类似基因,使用SMART和CDD检测蛋白序列结构域,检查缺失并除去冗余,得到确定含有ARF结构域的基因,最终获得24个谷子ARF基因序列,分别命名为SiARF1SiARF24(表1)。分析谷子24个ARF蛋白序列发现不同蛋白差异很大:编码ARF蛋白的氨基酸长度范围从502 AA(

    15、SiARF5)到1133 AA(SiARF2),开放阅读框从7774bp(SiARF6)到2650bp(SiARF22),分子量范围从54.44kDa(SiARF5)到125.42kDa(SiARF2),等电点范围从5.45(SiARF1)到9.14(SiARF8),蛋白含2个(SiARF4)到16个(SiARF6)内含子。从蛋白的基本特点可见ARF蛋白无论从序列的长度还是蛋白的特性变化都很大,表示该基因家族蛋白具有不同特性。值得注意的是大多数ARF蛋白的等电点都小于7,表示多数ARF可能编码弱酸性的蛋白,在酸性的亚细胞环境中发挥作用。表1 谷子ARF基因家族的鉴定及特性Table 1. Th

    16、e characteristics of identified ARF gene family in setaria italica基因名Genename转录名Genomicaccession No.染色体Chromosomedistribution位置Location外显子数No. ofextronORF 长度Open reading fragment length推测蛋白质氨基酸(aa)Amino acid分子量 (kDa)Molecularmass等电点(pI)IsoelectricpointSiARF1Si016262m16988236-699408914585390799.70 5.

    17、45 SiARF2Si016147m18014441-80216641472231133125.42 5.90 SiARF3Si016563m127687425-2769341714599267374.92 5.76 SiARF4Si016559m131927912-319306082269667472.31 6.86 SiARF5Si021833m3165527-1681813265450254.44 5.75 SiARF6Si021223m31163363-117113716777483592.76 6.30 SiARF7Si021121m31711800-1716887135087937

    18、103.13 5.79 SiARF8Si021613m310559853-105642529439956963.30 9.14 SiARF9Si021589m313481509-134853208381157964.25 8.33 SiARF10Si021216m340156796-4016306915627384192.74 6.25 SiARF11Si021157m349528177-4953410114592489798.86 5.66 SiARF12Si005753m42680870-26870921362221054116.39 6.09 SiARF13Si005741m436454

    19、277-364614511371741084120.73 6.12 SiARF14Si005991m437696443-377000493360668674.70 7.05 SiARF15Si005802m438058036-38064273156237931102.78 5.95 SiARF16Si000540m5322788-32673812395068776.88 5.59 SiARF17Si004598m532737893-327422849439166773.75 6.42 SiARF18Si000555m537047017-3705275410573768274.57 6.84 S

    20、iARF19Si000415m545466094-4547167011557675484.62 7.60 SiARF20Si013158m632960517-329676261371091096121.32 6.13 SiARF21Si009558m720883443-2088847314503066373.42 5.59 SiARF22Si009541m725115125-251177753265067772.67 8.05 SiARF23Si025990m826264617-2727055015593381089.91 6.60 SiARF24Si034525m916301638-1630

    21、55193388168474.71 6.71 2.2 谷子ARF蛋白的结构域分析利用ProSite软件分析每个ARF蛋白的结构域(图1),结果表明,所有谷子ARF蛋白都含有植物特异的B3 DNA结合结构域和ARF结构域,且大部分序列都含有Aux/IAA结构域,但SiARF5、SiARF8、SiARF9、SiARF17、SiARF18、SiARF19和SiARF22含有2个结构域,即只含有B3 DNA结合结构域和ARF结构域,没有Aux/IAA结构域。利用MEME软件进一步分析谷子的24个ARF蛋白的结构域,研究表明三个结构域又可以细分为6个基序,B3 DNA结合结构域含有1个基序,ARF结构域

    22、含有3个基序,Aux/IAA结构域含有2个基序。B3 DNA结合结构域的氨基酸组成较稳定,而ARF结构域和Aux/IAA结构域的序列变化较大,B3 DNA结合结构域为植物特异性。图1 谷子ARF蛋白的组织示意图。B3 DNA结合结构域和AUX/IAA结构域分别用蓝色和橙色表示,ARF结构域位于中间部位,用绿色表示 Fig.1 The domain structure of ARF proteins, blue boxes represented B3 domain, green boxes represented ARF domain and orange boxes represented

    23、AUX/IAA domain.2.3 谷子ARF基因家族染色体定位和基因扩增方式谷子共含有9条染色体,除2号染色体外,其余染色体上均含有ARF基因。图2可见ARF基因分布并不均匀,6号、8号和9号染色体上各只有1个ARF基因,7号染色体上有2个ARF基因,1号、4号和5号染色体上有4个ARF基因,3号染色体上的ARF基因最多为7个(图2)。在 Phytozome 数据库中通过 Gbrowse 查看成簇分布的ARF基因家族成员与侧翼蛋白质编码基因的位置关系,同一家族的不同成员如果位于同一个或相邻的基因间区域,则这些成员为串联重复关系,按照此标准,谷子ARF基因家族的扩增不是通过串联重复来扩增。谷

    24、子ARF基因的扩增分为两种模式:分散复制与片段复制。分散复制的基因有:SiARF1,SiARF5,SiARF6,SiARF7,SiARF9,SiARF10,SiARF11,SiARF12,SiARF14,SiARF16,SiARF19,SiARF20,SiARF23;片段复制的基因有:SiARF2,SiARF3,SiARF4,SiARF8,SiARF13,SiARF15,SiARF17,SiARF18,SiARF21,SiARF22,SiARF24。图2谷子ARF基因的染色体分布及扩增模式,箭头表示基因的方向Fig. 2 Chromosome distribution of ARF genes

    25、 in setaria italica was identified, and gene duplication analysis of ARFs was also represented direction of transcription2.4 谷子ARF基因家族分子进化树的构建通过对ARF蛋白序列的对比,绘制出24个谷子ARF蛋白的进化树(图3a)。根据进化树的分支,可以将这些蛋白分为三组,其中,组可以进一步被分为两组,即组a和组b,组a的ARF蛋白具有3个保守的结构域,组b蛋白具有2个结构域。组占ARF蛋白多数,约42%的ARF蛋白位于组中(图3a)。从进化树的聚类分析可见蛋白结构域相

    26、同的以及同一个基因的扩增或者复制的蛋白聚在一起,如SiARF3和SiARF21是片段复制的聚在一起,SiARF10和SiARF23为分散复制也聚在了一起,具有相同结构域的聚为一组。为进一步研究ARF基因的特征,使用GSDS2.0软件分析已获得的DNA和RNA序列,得到谷子ARF基因的内含子-外显子结构(图3b)。结果表明所有的ARF基因都具有内含子,内含子从2个(SiARF4)到16个(SiARF6),大多数基因的内含子在10个以上,从基因的结构特征可以初步分析基因的复制和扩增方式。为了揭示谷子ARF基因家族的进化关系,将模式植物拟南芥ARF基因家族(23个)和玉米(39个)、水稻(26个)、

    27、二穗短柄草(24个)、小立碗藓(14个)、葡萄(20个)和谷子(24个)共170个ARF蛋白一起构建系统发育树,绘制ARF蛋白的进化树(图4)。通过绘制的进化树可以看出,170个ARF蛋白可以聚为12个组,主要按进化的时间和亲缘关系聚类,按照进化分支可以分成8个不同的分支簇,单子叶植物、双子叶植物和苔藓类植物中的ARF蛋白呈现家族性聚集,不同纲目的植物间ARF蛋白也具有较高的同源性。图3 谷子ARF家族的系统发育和基因结构图a谷子ARF蛋白的系统发育进化树。24个基因可被分为3组,组可进一步分为两组。图b谷子ARF基因结构图。黄色表示编码区,蓝色表示上下游序列,黑线表示内含子区。Fig.3 P

    28、hylogenetic relationships among setaria italica ARF proteins were generated by neighbor-joining method. The 24 SiARF proteins were classified into three classes: I, II, III, and class I was further divided into twosub-classes Ia and Ib. b Gene structure of SiARF genes. The coding sequences were repr

    29、esented in yellow. The upstream and downstream were represented in blue.The introns were represented by black gray lines.图4 ARF蛋白进化树。单子叶(绿色)、双子叶(红色)、苔藓(黑色)Fig.4 Phylogenetic tree of ARF proteins in setaria italica, Arabidopsis,Zea mays,Oryza sativa, Brachypodium distachyon, Physcomitrella patens and

    30、 Vitis vinifera. The 170 ARF proteins were classified into four classes: monocot-specific group (green), moss-specific group (black) .2.5 谷子ARF蛋白的3D结构和保守序列分析 使用SWISS-MODEL软件构建ARF蛋白的3D结构。结果显示,具有B3 DNA结合结构域的ARF蛋白含有3个螺旋结构域和7个折叠结构域。3个螺旋分别位于1和2折叠、2和3折叠、5和6折叠之间(图5)。第2个-折叠片和连接环形成扳手状的结构,在此处可以为DNA的大沟结合留下大的空隙, 在DNA识别和结合的位点处具有两个“DNA识别臂”可以和不同的位点识别,在蛋白的N-末端第2个-折叠和2


    注意事项

    本文(谷子ARF基因家族的鉴定与生物信息学分析.docx)为本站会员主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2022 冰点文档网站版权所有

    经营许可证编号:鄂ICP备2022015515号-1

    收起
    展开