协和考博分子生物学笔记Word格式文档下载.docx
- 文档编号:16420129
- 上传时间:2022-11-23
- 格式:DOCX
- 页数:49
- 大小:65.44KB
协和考博分子生物学笔记Word格式文档下载.docx
《协和考博分子生物学笔记Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《协和考博分子生物学笔记Word格式文档下载.docx(49页珍藏版)》请在冰豆网上搜索。
基因组学(genomics),结构基因组学(structuralgenomics)和功能基因组学(functionalgenomics)。
蛋白质组(proteome)和蛋白质组学(proteomics)
第二节真核生物基因组
一、真核生物基因组的特点:
①真核基因组DNA在细胞核内处于以核小体为基本单位的染色体结构中。
②真核基因组中,编码序列只占整个基因组的很小部分(2~3%)。
二、真核基因组中DNA序列的分类
(一)、高度重复序列(重复次数>
105)卫星DNA(SatelliteDNA)
(二)、中度重复序列
1.中度重复序列的特点
①重复单位序列相似,但不完全一样,
②散在分布于基因组中,
③序列的长度和拷贝数非常不均一,
④中度重复序列一般具有种属特异性,可作为DNA标记,
⑤中度重复序列可能是转座元件(返座子)。
2.中度重复序列的分类
①长散在重复序列(longinterspersedrepeatedsegments)LINES
②短散在重复序列(Shortinterspersedrepeatedsegments)SINES
SINES:
长度<
500bp,拷贝数>
105,如人Alu序列。
LINEs:
长度>
1000bp(可达7Kb),拷贝数104~105,如人LINEl。
(三)、单拷贝序列(UniqueSequence)包括大多数编码蛋白质的结构基因和基因间间隔序列。
三、基因家族(genefamily)
一组功能相似且核苷酸序列具有同源性的基因。
可能由某一共同祖先基因(ancestralgene)经重复(duplication)和突变产生。
基因家族的特点:
1基因家族的成员可以串联排列在一起,形成基因簇(genecluster)或串联重复基因(tandemlyrepeatedgenes),如rRNA、tRNA和组蛋白的基因;
基因簇:
基因家族中各成员紧密成簇排列成大串的重复单位,定位于染色体的特定区域。
它们属于同一个祖先的基因扩增产物。
也有一些基因家族成员在染色体上排列并不紧密,中间还含有一些无关序列,但总体是分布在染色体上相对集中的区域。
基因簇中也常常包括一些没有生物功能的假基因。
同源基因(homologousgenes):
来自不同生物,但编码着同样蛋白质产物的基因称同源基因。
它们的核苷酸序列往往相类似,因此可作为DNA杂交探针使用。
②有些基因家族的成员也可位于不同的染色体上,如珠蛋白基因;
③有些成员不产生有功能的基因产物,这种基因称为假基因(Pseudogene),Ψa1表示与a1相似的假基因。
假基因分类。
加工过的假基因(processedpseudogene)。
典型的基因家族
1.tRNA基因单倍体人基因组中1300个tRNA基因,tRNA基因簇。
2.rRNA基因>
l00copy。
rRNA基因簇(重复单元28S、18S、5.8s-rRNA)
3.组蛋白基因30~40copy。
定位:
7q32~q36
组蛋白基因簇(重复单位:
H1,H2A,H2B,H3、H4)特点:
无intron,Poly(A)-RNA。
4.珠蛋白基因
α类:
16p13,基因簇(24Kb):
5’—ζ—Ψζ—Ψα1—α2—α1—3’
β类:
11p15,基因簇(60Kb):
5’—ζ—Gr—Ar—Ψβ—δ—β—3’
四、超基因家族(Supergenefamily,Superfamily)
由基因家族和单基因组成的大基因家族,结构上有程度不等的同源性,但功能不同。
五、人类基因组中的重复序列标记
1.A1u序列
单倍体人基因组50万~100万拷贝,平均每隔3~6Kb就有一个Alu序列,人A1u序列长300bp:
2X130bp重复序列;
+31bp间隔序列(中间);
两侧7~21bp正向重复(directrepeats),返座子?
Alu序列广泛散布于人基因组,约90%已克隆的人基因含有Alu序列,Alu序列标志。
2.可变数串联重复(Variablenumbertamdemrepeat,VNTR),又称小卫星DNA(minisatelliteDNA)。
由短重复单位(6~40bp)串联重复(6~100次以上)而成,多位于基因的非编码区,广泛分布。
VNTR多态性——分子标记——DNA指纹图(fingerprint)。
因为小卫星DNA长度上的变化,容易落入方便的Southernblotting方法所能检测的范围内,不同个体的小卫星DNA的细微差别可被检测,从而形象地提供了每个人的DNA指纹(fingerprint)。
小卫星DNA突变与肿瘤,H-Ras。
3.短串联重复(shorttandemrepeat,STR),又称微卫星DNA(microstalliteDNA)
2~6个核苷酸组成的重复单位串联重复(10~60次),两侧为特异的单拷贝序列,人基因组中每l0kbDNA序列至少一个STR序列。
(CA)n,50,000~100,000拷贝。
新一代遗传标记,人类基因组研究,肿瘤,遗传病。
第三节线粒体基因组
人线粒体基因组的特点:
1.人线粒体基因组为16,569bp的双链闭环分子,一条链为重链(H链),一条链为轻链(L链),两条链均有编码功能,每个mtDNA分于编码13种蛋白质和24种结构RNA(22rRNA,2tRNA)。
2.线粒体DNA为母系遗传。
3.结构基因不含内含子,部分区域有基因重叠,因此病理性mtDNA突变更易发生。
4.mtDNA突变频率更高。
5.线粒体DNA突变的表型表达与核DNA不同。
第四节细菌和病毒基因组
一、细菌基因组的特点。
1.功能相关的几个结构基因往往串联在—起,受它们上游的共同调控区控制,形成操纵子结构,
2.结构基因中没有内含子,也无重叠现象。
3.细菌DNA大部分为编码序列。
二、病毒基因组的特点
1.每种病毒只有一种核酸,或者DNA,或者RNA;
2.病毒核酸大小差别很大,3X103~3X106bp;
3.除逆病毒外,所有病毒基因都是单拷贝的。
4.大部份病毒核酸是由一条双链或单链分子(RNA或DNA),仅少数RNA病毒由几个核酸片段组成。
5.真核病毒基因有内含子,而噬菌体(感染细菌的病毒)基因中无内含子。
6.有重叠基因。
第五节染色质和染色体
细胞分裂间期——染色质(chromatin),分裂期——染色体(chromosome)
一、染色质的基本单位—核小体
(一)、核小体(nucleosome)结构
DNA绕在组蛋白八聚体(H2A、H2B、H3、H4各一对)核心外1.8周(146bp),形成核小体核心颗粒。
两个核小体核心颗粒之间有LinkerDNA(0~80bp),核小体核心颗粒+Linker=核小体(长180~210bp),核小体DNALadder。
(二)、组蛋白(histone):
一类小的带有丰富正电荷(富含Lys,Arg)的核蛋白,与DNA有高亲和力。
组蛋白分类:
1.核小体核心组蛋白,H2A,H2B,H3,H4。
分子量较小(102~135aa)
作用:
盘绕DNA形成核小体。
2.H1组蛋白:
较大(220aa),作用:
与LinkerDNA结合后利于核小体稳定和更高级结构的形成。
二、染色质的高级结构
1.30nm染色质纤丝,
2.袢环结构(loopeddomain)。
3.细胞分裂期染色体
分裂期染色体=一对姐妹染色单体(Chromatid)
有丝分裂中期46条染色体按大小和形状排列的的光学显微镜图像称为人的染色体核型(Karyotype)。
三、染色体的结构要素。
(一)、着丝粒(centromere):
细胞分裂时染色体与仿锤丝相连结的部位,为染色体的正常分离所必需。
(二)、端粒(telomere):
真核生物线状染色体分子末端的DNA区域。
端粒DNA的特点:
1.由富含G的简单串联重复序列组成(长达数kb)。
人的端粒DNA重复序列:
TTAGGC。
2.端粒的末端都有一条12~16碱基的单链3’端突出。
端粒的作用:
防止DNA末端降解,保证染色体的稳定性和功能
第二章DNA的复制、修复和重组
第一节DNA的复制(DNAReplication)
一、DNA复制的基本特性
1.半保留性(Semi-Conservative)Meselson-Stahl实验
2.双向复制(一般)复制起始点(origin)+两侧复制叉=复制单位(复制子,Replicon)
3.半不连续性(Semi-discontinuous)前导链(leadingstrand)-连续合成
随从链(LaggingStrand)-不连续,由岗崎片段(okazakifragment)连接而成。
二、DNA复制必需的成份(真核生物)
1.染色体DNA复制必需三种核苷酸序列①复制起点②着丝粒③端粒。
2.RNA引物(RNAPrimer),一般8~14nt,带游离3'
-OH形成磷酸二酯键。
3.DNA解链酶(DNAHelicase),打开DNA双链。
4.增殖细胞核抗原(Proliferatingcellnuclearantigen,PCNA),辅助催化前导链合成。
5.端粒酶(Telomerase),末端复制问题。
端粒酶负责染色体末端(端粒)复制,是由RNA和蛋白质组成的核糖核蛋白,其中的RNA成分是端粒复制的模板(因此端粒是逆转录酶)。
作用:
维持端粒长度。
端粒酶活性可用基于PCR的“TRAP”(Telomeraserepeatamplificationprotocol)法测定(Kim,Netal.,science,266,2011~2014(1994))。
端粒与细胞寿命。
端粒、端粒酶与肿瘤的关系:
绝大多数恶性肿瘤具有端粒酶活性但端粒缩短,但也有约5%的肿瘤无端粒酶活性且端粒较长。
端粒酶作为新的肿瘤标志和肿瘤治疗靶点。
第二节DNA修复(DNArepair)
DNA修复是维持基因组完整性的重要机制,在保护基因组避免发生可能导致肿瘤或遗传疾病的突变中起关键的作用。
引起DNA损伤的因素:
1.细胞内源性损伤因素:
DNA复制错误;
自发损伤包括碱基互变异构、碱基脱氨(C→U、A→I)和碱基丢失等;
氧化代谢副产物如活性氧物质(Reactiveoxygenspecies,ROS)的攻击等。
2.环境中的损伤因素:
辐射(含紫外线、X射线)产生胸腺嘧啶二聚体;
化学致癌物(氧化脱氨,烷化剂或代谢活化物如苯并芘、黄曲霉素等产生碱基加合物)
一、碱基切除修复(Baseexcisionrepair、BER)
该途径中最关键的是必须通过一种糖苷酶(glycosylase)先除去变异碱基(如被氧化、烷基化或脱氨的碱基),该糖苷酶催化连接损伤碱基与脱氧核糖之间的糖苷键水解,释放游离碱基并在DNA中产生一个去碱基位点,然后由去嘌呤/去嘧啶(AP)核酸内切酶、DNA聚合酶和DNA连接酶等利用相对的一条正常链为模板进行修补合成。
(T等于5-甲基U,C脱氨基生产U,5-甲基胞嘧啶脱氨基生成T。
)
BER途径中的重要糖苷酶:
(1)尿嘧啶DNA糖苷酶(UDG),从DNA中除去尿嘧啶碱基;
(2)3-甲基腺嘌吟(3MeA)DNA糖苷酶,可修复烷化剂产生的损伤;
(3)负责修复DNA氧化损伤的糖苷酶(如Fpg/MutMDNA糖苷酶)
BER是修复内源性DNA损伤(自发水解、烷基化和活性氧攻击)的主要途径,因此对于降低自发突变的频率、防止肿瘤发生有重要作用。
二、核苷酸切除修复(Nucleotideexcisionrepair,NER)
首先由多聚体复合物识别损伤,再在损伤的两侧进行切除。
随着DNA链被解开,包含损伤的单链片段释放出来,留下的缺口由DNA聚合酶填补,DNA连接酶封闭。
该途径包括20种以上蛋白,可以修复紫外辐射诱导的环丁烷嘧啶二聚体(CPD)和(6-4)光产物((6-4)PPs),以及一些化学物质产生的大加合物。
人的NER系统有关基因及其蛋白质产物功能。
NER系统缺陷与着色性干皮病(Xerodermapigmentosum,XP)
NER可再分为二条子途径:
(1)全基因组修复(GlobalGenomicrepair,GGR)途径:
修复整个基因组内的损伤,其效率取决于损伤的化学特性、损伤部位的DNA序列和染色质结构。
(2)转录藕联修复(Trancsription-coupledrepair,TCR,):
特异地修复基因组中具有转录活性(即表达)的基因的被转录DNA链上的损伤,该途径的特点是依赖RNA聚合酶II催化的转录,其中的一些蛋白是普通转录因子TFIIH的亚基。
三、错配修复(Mismatchrepair)
DNA在复制过程中发生错配,如果新合成链被校正,基因编码信息可得到恢复,如模板链被校正,突变就被固定。
而细胞错配修复系统能够区分“旧”链和“新”链。
Dam甲基化酶可使DNA的GATC中腺嘌呤N6位甲基化。
复制后短时间(数分钟)内DNA为半甲基化的GATC序列,一旦发现错配碱基,即将未甲基化的链切除,并以甲基化的链为模板进行修复合成。
负责修复DNA复制过程中由于错误掺入而产生的错配。
STR序列复制-模板链的滑动产生小的环状突出(loop)。
重复序列扩张(expansion)或丢失:
微卫星不稳定性(microsatelliteinstability)。
E.coli中的MMR途径需要mutS,mutH,mutL和uvrD基因产物和特异性核酸外切酶、DNA聚合酶和DNA连接酶等。
在酵母和人类已鉴定了mutS,mutH的多种同源物。
遗传性非息肉性结肠癌(HNPCC)基因缺陷。
微卫星不稳定与肿瘤。
新的肿瘤基因诊断标志。
四、重组修复(Recombinantrepair)
修复DNA的两条链均受损伤的部位的双链断裂或链间交连。
第三节重组(recombination)
重组的本质是基因的重排或交换,即2个DNA分子间或一个DNA分子的不同部位间,通过断裂和重接,交换DNA片段从而改变基因的组合和序列。
一、同源重组(Homologousrecombination)
指DNA同源序列间的重组,常发生于两个较长的同源DNA片段或同源染色体之间。
可通过同源重组将外源基因定位整合到细胞基因组中。
二、转座(transposition)
可移动的DNA元件(mobileDNAelements)——转座元件(Transposableelement),它是指那些可在DNA分子内或DNA分子间转移的DNA片段。
转座元件的转移过程——转座。
转座的特点:
1.转座后原来位置的转座元件序列仍然保留,但同时又把新合成的DNA复本插入到另外一个位点。
2.转座过程需要转座酶(transposase),它催化断裂和重接两步连续的过程(需要M2+)
3.转座元件插入位置的两端有3~12bp的正向重复序列(靶序列),它是由于转座酶错位切割DNA造成的,这种短正向重复序列是存在转座元件的特征。
转座元件的分类
①转座子(transposon),通过DNA复制而转移的转座元件。
②逆转座子(retroposon)或返座子,通过RNA阶段实现转移的转座元件(DNA→RNA→DNA→插入新位点)逆转座子例:
Alu,LINE1,逆假基因(retro-pseudogene)转座的遗传效应—导致基因重排、插入、缺失。
第三章基因表达的调控
基因表达:
DNA→mRNA→蛋白质的遗传信息传递过程。
基因表达的调控。
转录单位(transcriptionunit):
位于转录起点和终止信号之间的DNA区段,它可以被RNA聚合酶转录成一条连续的RNA链。
在真核生物中,一个转录单位都只编码一个基因,由此转录的mRNA叫单顺反子mRNA,而在原核生物中,一个转录单位往往含数个基因,由此转录的mRNA叫多顺反子mRNA。
第一节基因的活化
基因的“开关”—染色质的活化
一、活性染色质的结构
间期核染色质:
异染色质(heterochromatin),高度压缩(不转录);
常染色质(euchromatin),较为松散,
常染色质中约10%为活性染色质(更开放疏松)。
活性染色质→←非活性染色质
二、活性染色质的结构特点
(一)、DNaseI敏感性
转录活性(或有潜在转录活性)的染色质对DNaseI更敏感。
DNaseI超敏感位点(DnaseIHyperSensitiveSites,DHSS)
(二)、组蛋白H3的CyS110上巯基暴露,
三、活性染色质结构的形成
(一)、核小体位相(Phasedpositioning)
1.核小体的旋转定位(rotationalpositioning)
指核小体核心与DNA双螺旋在空间结构中的相互关系,主要包括DNA双螺旋的大沟是面向还是背向核心结构。
2.核小体的平移定位(translationalpositioning)
指核小体与特定DNA序列的结合位置和方式,特别是转录活性相关的DNA调控元件(启动子、增强子等)序列与核小体的相互位置关系。
(二)、组蛋白修饰
1.H1组蛋白磷酸化促进染色体包装,影响转录活性,
2.核心组蛋白修饰乙酰化:
常发生在组蛋白的Lys,一般活性染色质是高度乙酰化的。
(三)、HMG蛋白结合
HMG(highmobilitygroup)蛋白—高迁移率蛋白,如HMG14/HMG17,与核小体核心颗粒结合,有利转录。
四、DNA甲基化与基因表达。
(一)、真核生物基因组DNA的甲基化(Methylation)
哺乳动物基因组中5%的C为甲基化(mC),mC主要存在于CpG二核苷酸中。
CpG二核苷酸序列常成簇聚集并零散地分布于人基因组中,形成CpG岛(CpGislands)。
人基因组中约每10Kb就有一个CpG岛。
CpG岛常与基因相连(可作为寻找基因的标记)。
(二)、DNA甲基化的转录抑制作用。
基因表达与甲基化呈负相关
基因甲基化状态:
1.高度甲基化:
基因为持续失活(如女性的一条X染色体);
2.诱导去甲基化:
如组织或发育阶段特异性表达基因;
3.持续低水平甲基化:
具有转录活性(如持家基因)。
持家基因(housekeepinggene):
是指对所有类型组织细胞在任何时候都需要其表达的基因,通常都是维持细胞基本生存所必须的基因,其表达常保持在固定的水平。
又称为组成性基因(Constitutivegene)。
(三)、甲基化与基因组印迹
基因组印迹(genomicimprinting):
指基因表达活性只局限于来自双亲之一的基因版本。
被印迹(imprinted)的基因。
基因组印迹的机制—DNA高度甲基化
基因组印记与肿瘤。
第二节转录水平的调控
转录水平的调控是基因表达调控中最重要的环节。
一、真核基因转录基本条件:
特异性基因转录的基本条件包括:
①启动子(特别是核心启动子)
②转录模板(转录起始点(+1)---终止点)
③RNAPolⅡ
④普通转录因子(GTFs)
(一)、启动子(promoter)
与基因转录启动有关的一组DNA序列,一般位于RNApoII转录起始点上游100~200bp以内,其功能是决定转录的起始点和调控转录频率。
启动子区域包括核心启动子和启动子上游近侧序列:
1.核心启动子(corepromoter)
是决定转录起始位置的关键序列,也是普通转录因子TFⅡD的结合位点,
1TATA盒(TATAbox)位于转录起始点上游-25~-30bp。
Goldberg-hognessbox:
是许多真核生物基因的启动区中都存在的一种序列,类似于原核生物的Pribnowbox,由于该序列富含A-T碱基对,故也称TATA盒。
RNA聚合酶是结合在这段序列上,并从通常是位于下游约30nt的帽位点开始基因的转录。
②起始子(initiator,Inr)Inr是与转录起始位点重叠的短的较保守序列。
注:
①不是所有基因都含有TATA盒或Inr序列。
有的只有其中之一,有的两者都无。
②这些核心启动子的序列和它们之间的间隔多变
2.上游启动子元件(UpstreamPromoterelement,UPE)
位于较上游(-30~-110bp),能较强影响转录起始的频率,如CAAT盒和GC盒。
其中GC盒是转录因子SPl的结合位点。
(二)、RNA聚合酶Ⅱ
负责真核生物蛋白编码基因的转录(产物mRNA),有7~10个亚基,最大亚基的羧基末端结构域(CTD,CarboxylTerminalDomain)具有7个氨基酸(Tyr-Ser-Pro-Thr-Ser-Pro-Set)的重复序列,其中有多个磷酸化位点。
CTD磷酸化对调控基因转录有重要作用。
(三)、基础转录因子(basaltranscriptionfactor)
真核基因转录除RNA聚合酶外还需要许多蛋白因子—转录因子参加,其中一些转录因子是RNA聚合酶Ⅱ转录起始必需的,并且可以维持基础水平的转录,因此称为基础转录因子或普通转录因子(general
Transcriptionfactor)
1.RNA聚合酶II的普通转录因子(TFII)
包括TFIID,TFⅡB,TFIIF,TFIIE,TFIIH,TFIIA等。
TFIID是由TATA盒结合蛋白(TATAbindingprotein,TBP)和8种TBP协同因子(TBPassoc
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 协和 分子生物学 笔记
![提示](https://static.bdocx.com/images/bang_tan.gif)