基因组大作业文档格式.docx
- 文档编号:22534155
- 上传时间:2023-02-04
- 格式:DOCX
- 页数:15
- 大小:244.87KB
基因组大作业文档格式.docx
《基因组大作业文档格式.docx》由会员分享,可在线阅读,更多相关《基因组大作业文档格式.docx(15页珍藏版)》请在冰豆网上搜索。
PopSet
Goto:
LOCUSFJ8397274230bpDNAlinearBCT14-SEP-2009
DEFINITIONEscherichiacolistrainNE037RhsA(rhsA)gene,completecds.
ACCESSIONFJ839727
VERSIONFJ839727.1GI:
239877791
KEYWORDS.
SOURCEEscherichiacoli
ORGANISMEscherichiacoli
Bacteria;
Proteobacteria;
Gammaproteobacteria;
Enterobacteriales;
Enterobacteriaceae;
Escherichia.
REFERENCE1(bases1to4230)
AUTHORSLiu,K.,Knabel,S.J.andDudley,E.G.
TITLErhsgenesarepotentialmarkersformultilocussequencetypingof
EscherichiacoliO157:
H7strains
JOURNALAppl.Environ.Microbiol.75(18),5853-5862(2009)
PUBMED19633111
REFERENCE2(bases1to4230)
TITLEDirectSubmission
JOURNALSubmitted(18-MAR-2009)FoodScience,ThePennsylvaniaState
University,326FoodScienceBuilding,UniversityPark,PA16802,
USA
FEATURESLocation/Qualifiers
source1..4230
/organism="
Escherichiacoli"
/mol_type="
genomicDNA"
/strain="
NE037"
/db_xref="
taxon:
562"
gene1..4230
/gene="
rhsA"
CDS1..4230
/note="
similartoECs4470ofEscherichiacoliO157:
H7str.
Sakai"
/codon_start=1
/transl_table=11
/product="
RhsA"
/protein_id="
ACS32247.1"
GI:
239877792"
/translation="
MSGKPAARQGDMTQYGGSIVQGSAGVRIGAPTGVACSVCPGGVT
SGHPVNPLLGAKVLPGETDIALPGPLPFILSRTYSSYRTKTPAPVGSLGPGWKMPADI
RLQLRDNTLILSDNGGRSLYFEHLFPGEDGYSRSESLWLVRGGVAKLDEGHRLAALWQ
ALPEELRLSPHRYLATNSPQGPWWLLGWCERVPEADEVLPAPLPPYRVLTGLVDRFGR
TQTFHREAAGEFSGEITGVTDGAGRHFRLVLTTQAQRAEEARQQAISGGTEPSAFPDT
LPGYTEYGRDNGIRLSAVWLTHDPEYPENLPAAPLVRYGWTPRGELAVVYDRSGKQVR
SFTYDDKYRGRMVAHRHTGRPEIRYRYDSDGRVTEQLNPAGLSYTYQYEKDRITITDS
LNRREVLHTQGEGGLKRVVKKEHADGSVTQSQFDAVGRLRAQTDAAGRTTEYSPDVVT
GLITRITTPDGRASAFYYNHHSQLTSATGPDGLEIRREYDEWGRLIQETAPDGDITRY
RYDNPHSDLPCATEDATGSRKTMTWSRYGQLLSFTDCSGYVTRYDHDRFGQMTAVHRE
EGLSQYRAYDSRGQLIAVKDTQGHETRYEYNAAGDLTTVIAPDGSRNGTQYDAWGKAI
CTTQGGLTRSMEYDAAGRVIRLTSENGSHTTFRYDVLDRLIQETGFDGRTQRYHHDLT
GKLIRSEDEGLVTHWHYDEADRLTHRTVKGETAERWQYDERGWLTDISHISEGHRVTV
HYGYDEKGRLTGERQTVHHPQTEALLWQHETRHAYNAQGLANRCIPDSLPAVEWLTYG
SGWLAGMKLGDTPLVDFTRDRLHRKTLRRFGRYELTTAYTPAGQLQSQHLNSLQYDRD
YTWNDNGELIRISSPRQTRSYSYSDSGRLTGVHTTAANLDIRIPYATDPAGNRLPDPE
LHPDSTLSMWPDNRIARDAHYLYWYDRHGRLTEKTDLIPEGVIRTDDERTHRYHYDSQ
HRLVHYTRTQYEEPLVESRYLYDPLGRRVAKRVWRRERDLTGWMSLSRKPQVTWYGWD
GDRLTTIQNDRTRIQTIYQPGSFTPLIRVETATGELAKTQRRSLADALQQSGGEDGGS
VVFPPVLVQMLDRLESEILADRVSEESRRWLASCGLTVAQMQSQMDPVYTPARKIHLY
HCDHRGLPLALISAEGATEWCAEYDEWGNLLNEENPHQLQQLIRLPGQQYDEESGLYY
NRHRYYDPLHGRYITQDPIGLKGGWNFYQYPLNPVINVDPQGLVDINLYPESDLIHSV
ADEINIPGVFTIGGHGTPTSIESATRSIMTAKDLAYLIKFDGNYKDGMTVWLFSCNTG
KGQNSFASQLAKELHTNVIGPDTLWTWWGRGTNGKLKMDTVLTAPTNLNSNKDLMAIT
TKDLGNWITYGPSGHPISNMQGTPEKPSDIR"
ORIGIN
起始密码子
1atgagcggaaaaccggcggcgcgtcagggcgacatgacgcagtatggcggtagcattgtt
61cagggttcagccggggtgcgcattggtgcccccaccggcgtggcctgttcggtgtgcccc
121ggcggagtgacgtccggccatccggtcaatcccctgctcggtgcaaaggtccttcccggt
181gaaaccgacatcgccctgcccggcccgctgccgttcatcctctcccgcacctacagcagt
241taccggacaaaaacgcccgcgccggtggggagcctcggccccggctggaaaatgcctgcg
301gatatccgcttacagctgcgcgataacacactgatactcagtgataacggcggcagaagc
361ctgtattttgagcacctgtttcccggtgaggacggttacagccgcagcgagtcactctgg
421ctggtgcgcggcggcgtggcgaaactggatgaaggtcaccggctggccgcactctggcag
481gcgctgccggaagaactccgcttaagtccgcatcgttatctggcgacaaacagtccgcag
541gggccgtggtggctgctcggctggtgtgagcgggtgccggaagcggatgaggtgctgcct
601gcgccgctgccgccgtaccgggtactgaccgggctggtggaccgcttcgggcgcacacag
661acgttccaccgcgaagccgccggtgaattcagcggcgaaatcaccggcgtgacggatggt
721gccgggcgtcacttccggctggtactgaccacgcaggcgcagcgggcagaagaagcccgg
781cagcaggccatttccggcgggacggaaccgtccgcttttcctgataccctgccgggttac
841accgaatatggccgggacaacggcatccgtctgtctgccgtgtggctgacgcacgacccg
901gaatacccggagaatttacctgccgcgccgctggtgcgctatggctggacgccgcgcggc
961gaactggcggtggtgtatgaccgtagtggcaaacaggtgcgcagctttacttacgatgat
1021aaataccggggccggatggtggcgcaccgtcacacgggccggccggaaatccgttaccgt
1081tacgacagcgacgggcgggtgacagaacagctaaacccggcaggcttaagctacacgtat
1141cagtatgagaaagaccgcatcaccatcaccgacagcctgaaccgccgtgaagtcctgcac
1201acgcagggtgaaggcgggctgaagcgggtggtgaaaaaggaacacgcggacggcagcgtc
1261acgcagagtcagtttgacgcggtgggcaggctcagggcacagacggatgccgcaggcagg
1321acaacagaatacagcccggatgtggtgacgggcctcatcacgcgcatcaccacgccggat
1381ggcagggcatcggcgttttactataaccaccacagccagttaacgtcagccaccgggcct
1441gacgggctggaaatacgccgggaatatgatgaatggggccgtctgattcaggaaactgcc
1501cctgacggcgatatcacccgctaccgttatgataatccacacagtgacttaccctgcgca
1561acggaagatgccaccggcagccggaaaaccatgacgtggagccgttacggtcagttgctg
1621agcttcaccgactgttccggttatgtaacccgttatgaccatgaccgcttcgggcagatg
1681acggcggtgcaccgcgaggaagggctgagtcagtaccgcgcatacgacagccgtggacag
1741ttaattgccgtgaaagacacgcagggccatgaaacgcggtatgaatacaacgccgccggt
1801gacctgaccaccgtcattgccccggacggcagcagaaacgggacacagtacgatgcgtgg
1861ggaaaagccatctgtaccacgcagggcggtctgacgcgcagtatggaatacgatgctgcc
1921ggacgggtcatccgcctgaccagtgaaaacggcagccacaccaccttccgttacgatgta
1981ctcgaccggctgatacaggaaaccggctttgacggccgcacacagcgttatcaccacgac
2041ctgaccggcaaacttatccgcagcgaggatgaggggctggtcacccactggcactatgac
2101gaagcagaccgcctcacgcaccgcaccgtgaagggtgaaaccgcagagcgctggcagtat
2161gacgaacgcggctggctgacagacatcagccatatcagcgaagggcaccgggtgacggtg
2221cattacgggtatgatgagaaaggccggctgaccggtgagcgtcagacggtgcatcacccg
2281cagacggaagcactgctctggcagcatgagaccagacacgcttacaacgcgcaggggctg
2341gcgaaccgctgtataccggacagcctgcccgccgtggaatggctgacctatggcagcggc
2401tggctggcaggcatgaagctcggcgacacaccgctggtggatttcacccgcgaccgcctg
2461caccggaaaacgctgcgcagattcggccgttatgaactcaccaccgcttatacccctgcc
2521gggcagttacagagccagcacctgaacagcctgcagtatgaccgcgattacacctggaac
2581gacaacggcgaactcatccgcatcagcagcccgcgccagacccggagttacagctacagc
2641gactccggcaggctgaccggcgttcacaccaccgcagcgaatctggatatccgcatcccg
2701tatgccacggacccggcaggtaaccgcctgcccgacccggagctgcacccggacagcacc
2761ctcagcatgtggccggataaccgtatcgcccgtgacgcgcactatctttactggtatgac
2821cgtcacggcaggctgacagagaaaaccgacctcatcccggaaggggttatccgcacggat
2881gatgagcggactcaccggtaccattacgacagtcagcaccggctggtgcactacacgcgg
2941acacaatatgaagagccgctggtcgaaagccgctatctttacgacccgctgggccgcagg
3001gtggcaaaacgggtgtggcgacgtgaacgggacctgacgggctggatgtcgctgtcacgg
3061aaaccgcaagtgacctggtacggctgggacggcgaccggctgaccacaatacagaacgac
3121agaacccgcatccagacgatttatcagccggggagcttcacgccactcatcagggttgaa
3181accgccaccggtgagctggcgaaaacgcagcgccgcagcctggcggatgcgcttcagcag
3241tccggcggcgaagacggtggcagtgtggtgttcccgccggtgctggtgcagatgctcgac
3301cggctggaaagtgaaatcctggctgaccgggtgagtgaggaaagccgccgctggctggca
3361tcgtgcggcctgactgtggcgcagatgcaaagccagatggacccggtatacacgccggcg
3421cgaaaaatccacctgtaccactgcgaccatcgcggcctgccgctggcgcttatcagtgcg
3481gaaggggcaacagaatggtgcgcagaatacgatgaatggggcaacctgctgaatgaagag
3541aacccgcatcagctgcagcagcttatccgcctgccggggcagcagtatgatgaggagtcc
3601ggcctgtattacaaccgccaccgctattatgacccgctgcacgggcgatatatcactcag
3661gatccgattggactgaaggggggatggaatttttatcagtatccgttgaatccggtcata
3721aatgtagatccgcaaggtttggttgatataaatttataccccgaaagtgatcttatccat
3781tctgtagctgatgagattaatatcccaggcgttttcacaatcggggggcatggtaccccc
3841acatctattgaatccgcaacgcgcagtatcatgacagctaaagatctagcatatctaatt
3901aaatttgatgggaattataaagatgggatgacagtttggttattttcttgtaatacaggt
3961aaaggacaaaattcatttgctagccaattagctaaagagttacatacaaatgtaatagga
4021cctgacacgctatggacgtggtgggggcgaggaactaatggtaagttaaaaatggataca
4081gtgctaacagcaccaacgaaccttaattcaaataaggatctaatggctataacaacaaaa
4141gaccttggtaattggataacatatgggccatctgggcaccccatttctaatatgcaaggt
4201acgccagaaaaacccagtgatataagatag
//
终止密码子
2、表达载体的选择
出品公司:
Invitrogen
载体名称:
pPIC9K,pPIC9K
质粒类型:
毕赤酵母蛋白表达载体
表达水平:
高拷贝
启动子:
AOX1
克隆方法:
多克隆位点,限制性内切酶
载体大小:
9276bp
5'
测序引物及序列:
5´
AOX1:
-GACTGGTTCCAATTGACAAGC-3´
;
alpha-Factor-F:
5´
-TACTATTGCCAGCATTGCTGC-3´
3'
3´
-GCAAATGGCATTCTGACATCC-3´
载体标签:
N-alphafactor
载体抗性:
氨苄和卡那
筛选标记:
HIS4
备注:
利用alpha分泌因子,分泌表达蛋白。
产品目录号:
V175-20
稳定性:
稳定Stable
组成型:
组成型Constitutive
病毒/非病毒:
非病毒
pPIC9K载体详细信息如下:
•pPIC9载体大小9276bp,是融合表达载体。
•载体构建过程中,可供使用的单一限制性内切酶位点为SnaBI,EcoRI,AvrII,NotI.
•利用alpha因子分泌信号肽,分泌表达蛋白基因。
•在载体构建过程中,你的基因必须保证与信号肽的起始密码子的读码框一致。
•毕赤酵母中利用HIS4进行筛选。
•为了将基因插入GS115或KM71的AOX区,使用SacI限制性内切酶线性化质粒(GS115中产生His+Mut+基因型,KM71中产生His+MutS基因型)
•为了将基因插入GS115或KM71的His4区,使用SalI或者StuI限制性内切酶线性化质粒(GS115中产生His+Mut+基因型,KM71中产生His+MutS基因型)
•将基因插入GS115的AOX1区域,需要使用BglII线性化质粒(产生His+MutS基因型)。
载体序列
3、宿主细胞的选择
巴斯德毕赤酵母表达体系是近十年发展起来的真核表达体系。
作为一种成功的表达体系,有好几种因素促进了它的快速推广。
主要包括如下几方面:
(1)利用受甲醇诱导的醇氧化酶(alcoholoxidaseI,AOX1)启动子,可严格控制外源基因的表达。
(2)毕赤酵母属于单细胞微生物,保留了细菌的特点,营养要求简单,生长快速,适合高密度培养,发酵后每升培养液中细胞干重可达100克以上,有利于提高目的蛋白产量;
发酵技术也比较成熟,具有大规模生产基因工程产品的潜力。
(3)酵母是低等真核生物,很少产生有毒物质,毒性比细菌小。
(4)毕赤酵母作为一种真核细胞生物,具有真核生物的亚细胞结构,可进行很多典型的高等真核生物的蛋白翻译后加工修饰,如糖基化、脂酞化、磷酸化以及蛋白裂解、折叠、二硫键的形成等。
(5)毕赤酵母分子生物学操作技术与酿酒酵母非常相似,而后者的遗传背景和生理特性研究得比较透彻,是现代生物学中了解较清楚、应用很广泛的表达系统之一,因而可为前者提供很多借鉴;
另外,毕赤酵母也已有20多年的研究开发历史,有多种受体菌和表达载体可供选择,可以进行胞内表达或分泌表达。
(6)产物易于纯化,特别是高分泌性的外源蛋白占所有被分泌蛋白的30%以上,容易分离。
4、引物设计:
PCR引物设计原理:
PCR引物设计的目的是为了找到一对合适的核苷酸片段,使其能有效地扩增模板DNA序列。
PCR引物设计原则:
1.引物的长度一般为15-30bp,常用的是18-27bp,但不应大于38,因为过长会导致其延伸温度大于74℃,不适于TaqDNA聚合酶进行反应。
2.引物序列在模板内应当没有相似性较高,尤其是3’端相似性较高的序列,否则容易导致错配。
引物3’端出现3个以上的连续碱基,如GGG或CCC,也会使错误引发机率增加。
3.引物序列的GC含量一般为40-60%,过高或过低都不利于引发反应。
上下游引物的GC含量不能相差太大。
SnaBI:
5'
...T↓ACGTA...3'
...ATGCA↑T...5'
AvrII5'
...CCTAG↓G...3'
3'
...G↑GATCC...5'
SacL:
...GAGCT↓
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基因组 作业