Polyphen2和SIFT教程_精品文档.ppt
- 文档编号:2561424
- 上传时间:2022-11-01
- 格式:PPT
- 页数:22
- 大小:2.14MB
Polyphen2和SIFT教程_精品文档.ppt
《Polyphen2和SIFT教程_精品文档.ppt》由会员分享,可在线阅读,更多相关《Polyphen2和SIFT教程_精品文档.ppt(22页珍藏版)》请在冰豆网上搜索。
用用Polyphen2Polyphen2和和SIFTSIFT进行突变进行突变/SNP/SNP功能预测功能预测三个网址三个网址Polyphen2:
http:
/genetics.bwh.harvard.edu/pph2/SIFT:
http:
/sift.jcvi.org/以上两个在线应用的软件,主要对以上两个在线应用的软件,主要对以上两个在线应用的软件,主要对以上两个在线应用的软件,主要对SNPSNPSNPSNP以及点突以及点突以及点突以及点突变进行功能预测,但预测限于错义突变,其他无变进行功能预测,但预测限于错义突变,其他无变进行功能预测,但预测限于错义突变,其他无变进行功能预测,但预测限于错义突变,其他无义突变(突变为终止密码)、碱基缺失、插入所义突变(突变为终止密码)、碱基缺失、插入所义突变(突变为终止密码)、碱基缺失、插入所义突变(突变为终止密码)、碱基缺失、插入所造成的框移突变,以及起始密码子的突变均不可造成的框移突变,以及起始密码子的突变均不可造成的框移突变,以及起始密码子的突变均不可造成的框移突变,以及起始密码子的突变均不可以预测!
以预测!
以预测!
以预测!
Uniportdatabase:
http:
/www.uniprot.org/这个网址用于查找蛋白质序列和获取这个网址用于查找蛋白质序列和获取FASTAFASTA格式格式数据准备数据准备两个网站均为在线提交数据,提交的数据文件格式可有以下两种:
第一种为蛋白质的氨基酸序列,按照FASTAFASTAFASTAFASTA格式编写第二种为蛋白质在Uniportdatabase中的ID获取蛋白质序列或获取蛋白质序列或ID可以在NCBI中查找,也可以直接在Uniportdatabase中查找此处填写蛋白质名称此处填写蛋白质名称此处填写蛋白质名称此处填写蛋白质名称查询结果仔细核对以上数据,ID就是所在polyphen2中需要号码,以humanDAX-1为例,ID为P51843IDID蛋白质名称蛋白质名称种属种属点击所需要的蛋白质ID链接,在出现的页面中可以详细查看DAX-1的信息,再次核对是否正确,注意右上角的几列标签,如图点击,获取点击,获取FASTAFASTA格式数据,此数据可能会被下载,格式数据,此数据可能会被下载,下载后可以用记事本程序打开,或者有时会在浏览器下载后可以用记事本程序打开,或者有时会在浏览器中直接打开,可以将其中数据全部复制备用,下方即中直接打开,可以将其中数据全部复制备用,下方即是打开的是打开的FASTAFASTA数据,最上面是蛋白质的信息(含数据,最上面是蛋白质的信息(含IDID、名称、种属),下方是氨基酸序列名称、种属),下方是氨基酸序列sp|P51843|NR0B1_HUMANNuclearreceptorsubfamily0groupBmember1OS=HomosapiensGN=NR0B1PE=1SV=2MAGENHQWQGSILYNMLMSAKQTRAAPEAPETRLVDQCWGCSCGDEPGVGREGLLGGRNVALLYRCCFCGKDHPRQGSILYSMLTSAKQTYAAPKAPEATLGPCWGCSCGSDPGVGRAGLPGGRPVALLYRCCFCGEDHPRQGSILYSLLTSSKQTHVAPAAPEARPGGAWWDRSYFAQRPGGKEALPGGRATALLYRCCFCGEDHPQQGSTLYCVPTSTNQAQAAPEERPRAPWWDTSSGALRPVALKSPQVVCEAASAGLLKTLRFVKYLPCFQVLPLDQQLVLVRNCWASLLMLELAQDRLQFETVEVSEPSMLQKILTTRRRETGGNEPLPVPTLQHHLAPPAEARKVPSASQVQAIKCFLSKCWSLNISTKEYAYLKGTVLFNPDVPGLQCVKYIQGLQWGTQQILSEHTRMTHQGPHDRFIELNSTLFLLRFINANVIAELFFRPIIGTVSMDDMMLEMLCTKIPolyphen2应用进入网站:
http:
/genetics.bwh.harvard.edu/pph2/在这里以我们以前在这里以我们以前发现的发现的DAX-1DAX-1L262PL262P这个突变举这个突变举例,在红框出填入例,在红框出填入已经查到的已经查到的IDID,下,下方方FASTAFASTA数据可以数据可以不用输;绿框中输不用输;绿框中输入突变氨基酸位置;入突变氨基酸位置;在在AA1AA1中选择中选择LL,AA2AA2中选择突变后中选择突变后的的PP,最后点,最后点SubmitSubmit运行画面每隔每隔5-105-10秒点秒点refreshrefresh刷新页刷新页面,直至面,直至ResultsResults中出现中出现ViewView,然后点击,然后点击ViewView结果一般突变预测一般突变预测看第二条图看第二条图HumVarHumVar的结果,的结果,分数越接近分数越接近1.01.0,损害可能越,损害可能越大,越接近大,越接近00,损害可能性越损害可能性越小:
结果分为小:
结果分为benignbenign,possiblypossiblydamagingdamaging以及以及probablyprobablydamagingdamaging注:
注:
possiblypossibly为为有可能,有可能,probablyprobably为很可为很可能能练习小常所发现的SF-1基因一处SNP:
G146A,请用Polyphen2进行预测,蛋白质功能是否受到影响?
最后结果SIFT进入网站:
http:
/sift.jcvi.org/在singleproteintools中找到SIFTsequence,点击打开进入数据提交新页面填入自己填入自己emailemail,SIFTSIFT运算时间在运算时间在20min20min左右,你左右,你可以等,也可以让他把邮件发送过来可以等,也可以让他把邮件发送过来蛋白质蛋白质FASTAFASTA数据,将下载好的蛋白质数据,将下载好的蛋白质FastaFasta数据上传即可数据上传即可或者将用记事本或浏览器打开的或者将用记事本或浏览器打开的FastaFasta数数据据copycopy至此数据框中,蛋白质序列可以至此数据框中,蛋白质序列可以截选,但必须有截选,但必须有第一行的第一行的蛋白质信息数蛋白质信息数据据此处填蛋白质突变或此处填蛋白质突变或SNPSNP位点信息,位点信息,如如S578NS578N,L262PL262P,G146AG146A等等SIFT预测ARS578N功能变化在Uniport中搜索AndrogenReceptor,下载FASTA数据,如下图为浏览器打开后的结果sp|P10275|ANDR_HUMANAndrogenreceptorOS=HomosapiensGN=ARPE=1SV=2MEVQLGLGRVYPRPPSKTYRGAFQNLFQSVREVIQNPGPRHPEAASAAPPGASLLLLQQQQQQQQQQQQQQQQQQQQQETSPRQQQQQQGEDGSPQAHRRGPTGYLVLDEEQQPSQPQSALECHPERGCVPEPGAAVAASKGLPQQLPAPPDEDDSAAPSTLSLLGPTFPGLSSCSADLKDILSEASTMQLLQQQQQEAVSEGSSSGRAREASGAPTSSKDNYLGGTSTISDNAKELCKAVSVSMGLGVEALEHLSPGEQLRGDCMYAPLLGVPPAVRPTPCAPLAECKGSLLDDSAGKSTEDTAEYSPFKGGYTKGLEGESLGCSGSAAAGSSGTLELPSTLSLYKSGALDEAAAYQSRDYYNFPLALAGPPPPPPPPHPHARIKLENPLDYGSAWAAAAAQCRYGDLASLHGAGAAGPGSGSPSAAASSSWHTLFTAEEGQLYGPCGGGGGGGGGGGGGGGGGGGGGGGGEAGAVAPYGYTRPPQGLAGQESDFTAPDVWYPGGMVSRVPYPSPTCVKSEMGPWMDSYSGPYGDMRLETARDHVLPIDYYFPPQKTCLICGDEASGCHYGALTCGSCKVFFKRAAEGKQKYLCASRNDCTIDKFRRKNCPSCRLRKCYEAGMTLGARKLKKLGNLKLQEEGEASSTTSPTEETTQKLTVSHIEGYECQPIFLNVLEAIEPGVVCAGHDNNQPDSFAALLSSLNELGERQLVHVVKWAKALPGFRNLHVDDQMAVIQYSWMGLMVFAMGWRSFTNVNSRMLYFAPDLVFNEYRMHKSRMYSQCVRMRHLSQEFGWLQITPQEFLCMKALLLFSIIPVDGLKNQKFFDELRMNYIKELDRIIACKRKNPTSCSRRFYQLTKLLDSVQPIARELHQFTFDLLIKSHMVSVDFPEMMAEIISVQVPKILSGKVKPIYFHTQ此为第一行蛋白质信息,如果采用此为第一行蛋白质信息,如果采用copycopy至数据输入框,而不是采用文件上传方法,至数据输入框,而不是采用文件上传方法,红框中数据必须黏贴进输入框,而后面的蛋白质序列只需黏贴需要部分红框中数据必须黏贴进输入框,而后面的蛋白质序列只需黏贴需要部分注意:
一般来说用文件上传方法注意:
一般来说用文件上传方法比较简单,但比较简单,但SIFTSIFT对氨基酸序列对氨基酸序列有要求,大于有要求,大于500500的氨基酸序列的氨基酸序列不能分析,故像不能分析,故像ARAR这种有这种有919919个个AAAA的就不能采用直接上传模式,的就不能采用直接上传模式,而要将氨基酸序列裁剪过后按而要将氨基酸序列裁剪过后按FastaFasta格式黏贴至数据框中格式黏贴至数据框中sp|P10275|ANDR_HUMANAndrogenreceptorOS=HomosapiensGN=ARPE=1SV=2MEVQLGLGRVYPRPPSKTYRGAFQNLFQSVREVIQNPGPRHPEAASAAPPGASLLLLQQQQQQQQQQQQQQQQQQQQQETSPRQQQQQQGEDGSPQAHRRGPTGYLVLDEEQQPSQPQSALECHPERGCVPEPGAAVAASKGLPQQLPAPPDEDDSAAPSTLSLLGPTFPGLSSCSADLKDILSEASTMQLLQQQQQEAVSEGSSSGRAREASGAPTSSKDNYLGGTSTISDNAKELCKAVSVSMGLGVEALEHLSPGEQLRGDCMYAPLLGVPPAVRPTPCAPLAECKGSLLDDSAGKSTEDTAEYSPFKGGYTKGLEGESLGCSGSAAAGSSGTLELPSTLSLYKSGALDEAAAYQSRDYYNFPLALAGPPPPPPPPHPHARIKLENPLDYGSAWAAAAAQCRYGDLASLHGAGAAGPGSGSPSAAASSSWHTLFTAEEGQLYGPCGGGGGGGGGGGGGGGGGGGGGGGGEAGAVAPYGYTRPPQGLAGQESDFTAPDVWYPGGMVSRVPYPSPTCVKSEMGPWMDSYSGPYGDMRLETARDHVLPIDYYFPPQKTCLICGDEASGCHYGALTCGSSCKVFFKRAAEGKQKYLCASRNDCTIDKFRRKNCPSCRLRKCYEAGMTLGARKLKKLGNLKLQEEGEASSTTSPTEETTQKLTVSHIEGYECQPIFLNVLEAIEPGVVCAGHDNNQPDSFAALLSSLNELGERQLVHVVKWAKALPGFRNLHVDDQMAVIQYSWMGLMVFAMGWRSFTNV
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Polyphen2 SIFT 教程 精品 文档