人类基因组计划_第1页
人类基因组计划_第2页
人类基因组计划_第3页
人类基因组计划_第4页
人类基因组计划_第5页
已阅读5页,还剩104页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人类基因组计划生命科技学院李友勇第一部分:问题的提出一、问题的提出

人类在改造自然界、改造动植物的同时,也需要改造人类本身。优生遗传学(eugenics)从定性的角度和经验的积累提出提高人的质量的方法,从遗传学角度,来说这是一种无奈的方式,即,只能用现有的显性基因去遮盖有害的隐性基因。这种作法一点也不会减少人的群体内的不良位点频率。要真正对人的遗传物质进行改良,必须首先弄清人的遗传结构,即人的46条染色体,应该有24个连锁群,其上的DNA到底是怎样的序列,人的基因在哪个位置上?有多少?功能是什么?这个问题搞清楚了,对人的遗传改良不是可以着手了吗?最初的设想首先提出测定人的全部DNA序列的是美国一个科学家,叫Dulbecco,他在1984年提出该设想,但那时候人们计算了一下,这项工作几乎是一个不可能事件。他们初步测知人的24个连锁群,DNA长度约1m,碱基对有30亿对(3×109)对,人的基因平均长度为50kbp(当外显子占3—5%的话),约有6万个基因。30亿对的核甘酸,每人年可测15000个,那末,需20万人年工作量,即2000人预计工作100年。实际要测量约15个以上复本,可见工作量之浩瀚。。问题的重新提出1986年3月7日在Science上发表一篇短文“肿瘤研究的一个转折点:人类基因组的全序列分析”。因为肿瘤研究的深入,认为是基因表达的结果,那么,肿瘤基因在哪?它们什么时候表达?怎样表达?解决这些问题需要弄清人的基因组。此时,人类基因组研究又提到科学家面前。技术进步事实上,1985年,PCR技术诞生,给基因组计划带来重大技术支撑,计算机技术的突飞猛进,使测序的片段衔接更准确,更快速,原来估计的2000人100年(也有人估计为1000人25年)过于保守了。二、人类基因组计划开始1989年1月(January)NortonZinderofRockefellerUniversitychairsthefirstprogramadvisorycommitteemeetingfortheHGP.

(主持了第一个HGP计划会议)

启动人类基因组计划叫(Humangenomeproject)简称HGP,是1990年开始启动的,共有美、英、日、德、法、中六国科学家参与,其进度远比预期的要快,但遇到的困难和工作量比原先想象的要大得多。好在现在测序能力大大增加了,每年达到300亿~3万亿碱基,相当于一年可测8个人的基因组的工作量,再加上计算机(大型的)的应用和方法的改进,DNA测序已变得更简单和更适用了。HGP与中国1998年8月11日,中科院遗传所“人类基因组中心”成立。

1999年2月,中心决定进行大规模基因组测序,以创造加入“国际测序俱乐部”的条件。同年7月7日,中国在国际人类基因组测序协作组登记,申请加入“国际测序俱乐部”。中国是第六个参与国

1999年9月1日,伦敦,第五次人类基因组测序战略会议上,北京中心(中科院遗传所人类基因组中心)作为新的会员加入,负责测定全部序列的1%,即3号染色体上的3000万个碱基对。中国成为继美、英、日、德、法之后第六个国际人类基因组计划参与国,也是参与这一计划的唯一的发展中家。

2000年4月,中国科学家提前完成人类基因组计划百分之一的测序任务,使得这一伟大的科学工程于6月26日如期完成。三、HGP技术的回顾四、HGP的目标1.遗传图谱2.物理图谱结构基因组学3.DNA序列4.转录图谱功能基因组学5.基因的功能第二部分:结构基因组学一、DNA文库的取材:选取的原始个体不同,DNA文库的基因序列,DNA序列肯定不同。白种人、黄种人、黑种人、不同地区的人,选什么人,研究者有他们的想法,可能是科学家,也可能是他们自己,更可能是随机取样;二、测序方法的遴选对文库中的各片段逐一测序,这是一个工作量很大的课题。目前有两种思路:第一种是全基因组散弹法(wholegenomeshut-gun):即从文库中随机取,然后分析,分析后再根据碱基序列进行拼接,由Celera提出。步骤:取全基因组DNA—→

纯化酶切或超声波打断—→电泳—→回收DNA片段—→构建质粒文库—→转化宿主菌—→扩增培养—→提质粒DNA为模板进行PCR测序—→上测序仪—→处理测序数据—→补缺—→完整基因组序列。1.shutgun法全基因组DNA随机酶切成小片段拼接补缺完整基因组序列缺点该方法对总DNA较少的细菌或噬菌体来说是适合的,但对像人、高等动植物来说,DNA片段那么多,怎么用最少的克隆数,来保证每一个片段都有一次机会被分析,难度很大。因此,对人类全基因组A来说,要建立新的方法。2.层次散弹(hierarchicalshutgun)第二种是层次散弹(hierarchicalshutgun)。即把大的基因组先进行分层,如染色体编号、染色体下片段编号、小片段上作物理标记,然后再对小片段测序,这样使最后“拼接”变得容易得多。①染色体编号先将各个染色体分离,编号:1#,1’#,2#,2’#……以染色体为单位甚至更小的单位用shut-gun方法再进行测序。测序的两种思路(图)②路标技术在不能切割成小片段进而编号时,一条染色体上要设计几个标志,相当于编号,称路标技术(Landmark),这个路标是有顺序的,路标愈多,之间的距离愈近,路标图谱愈精密。,目前的路标有:iSTS标志iiEST标志iiiSNP标志ivRFLP、FLAP标志(酶切点标志)VSSR标记I:STSSTS路标:STS(SequenceTaggedSite)是物理路标,如用激光切的染色体上DNA段。当人的染色体片段在鼠的细胞中,其标记是STS。STS可以较粗(长),也可以更细(短)。ii:EST路标EST标签:EST(expressedsequencetag)叫表达序列标签,实际上是遗传图谱,即已知的某一基因序列。用cDNA短片测序后,可做为EST标签。显带法和其他基因定位法鉴别的可表达基因位点也是EST。iii:RFLP标志

RFLP(RestricfionFrafmentlengthpolymophism)叫限制性片段长度多态性。由于多态性,同一种酶对同一区DNA(不同个体)进行处理,会得到不同的长段的区带,这个酶切位点一般是一定的,因此,其片段也是相同的。不同的内切酶处理,可得到不同限制性片段,因此有不同长度的文库。可用来进行测序结果的比较。不同的RFLP酶A

酶B电泳图iv:SNP路标SNP(singlenucleotidepolymorphism)叫单核苷酸多态性。指基因组中核苷酸水平上的变异引起的DNA序列多态性。包括单碱基转换、颠换、插入/缺失等。SNP位点极其丰富,在人的基因组中,每1000bp就会有1个SNP,这样人的基因组中有300万个SNP。SNPSNP类型从DNA成份上分析,SNP应有两类,一类是在基因内,即编码区(codingregion),叫cSNP,第二类是非编码区,仍称SNP。SNP的作用可根据它的位置而推断。①作为遗传图谱,即此处有一个特异点;②进化多样性,肯定是分子进化的多态性根源之一;③疾病基因定位及分子原因;三、建立DNA文库创造人的46个染色的DNA文库,该DNA是工作的材料。测序可能要做若干次重复,因此,要有一定数量材料做原料DNA文库,即,可克隆的DNA片段(clonableFragmant)。DNA文库有cDNA(complementaryDNA)文库和gDNA(genomeDNA)文库两种。DNA文库技术RH(RadiationHybrid)YAC(yeastArtificidchromosome)BAC(BacferialArtificialchromosome)PAC,cosmid,fosmid等.RH(RadiationHybrid)方法将人的细胞(染色体)用X-光照射打断染色体,该细胞与鼠细胞融合,使DNA片段能插入到鼠的染色体上,,扩增的细胞株中的人DNA片段(5-10Mb)得到克隆(也有STS出现),用作分析。YAC(YeastArtificialchromosome)方法利用酵母染色体结构和复制系统(着丝点、端粒、复制子)来复制人的DNA分子;可克隆200~2000kb的DNA;特点:克隆片段大,可达Mb级别,用作自动分析材料。BAC(BacterialArtificialChromosome):把人的染色体片段嵌入细菌的质粒(F质粒)中,可运载扩增100~300kbDNA。特点:较小,便于普通测序。但自动测序时显得小。PAC文库PAC(P1-derivedArtificialchromosome)是P1噬菌体为载体的DNA文库。可以看出,PAC肯定较小,携带90-150kb的DNA。Loannou将PAC用于人基因组,构建了12万个插入片段,长度为110-120kb,容量是人基因组的3倍。120000×110×1000=1.32×1010/(3×109))=4.4倍,保守即约为3倍。TAC文库TAC(Transformation-competentArtificialchromosome)叫可转化人工染色体。载体是pYLTAC7(p1质粒和Ri质粒),可用于植物。HAC文库HAC(HumanArtificialchromosome)叫人类人工染色体。基因文库所需的克隆数理论上,一个细胞的全套染色体分割的好,就是一个完整的人的基因文库。克隆数=3×109/片段长若片段平均长1000kb,有3×109/1000kb=3000个克隆即够了。若我们说,要有99%的把握保证每一个片段都存在,需多少个克隆?Clarke-Carbon公式

ln(1-p)N—克隆数N=————p—把握概率

ln(1-f)f—片段平均长度/基因组DNA总长度人的克隆数N=ln(1-0.99)/ln(1-1000000/(3*109)=-4.6/-0.0003333=13800个是3000个的4.6倍。四、DNA序列测定将DNA片段用荧光等分析仪,测出DNA序列碱基排列顺序。DNA序列测定方法:1.化学降解法:G反应;G+T反应;T+C反应和C反应;2.Sanger的双脱氧法:A/T/G/C四个反应。测序电泳图3.定向测序法首先用一轮测序所得的核苷酸序列,设计一寡核苷酸,充当下一轮测序时的引物,这样可逐步分析全部靶DNA的序列。

一轮随机引物

二轮测出的序列作为二轮的引物三轮测出的序列作为三轮的引物五、组装与补缺到2001年的9月份,据报道有6%的DNA序列非常难测,找不到规律。目前已完成达99.9%,但还有约400个缝隙有待填补。Celera公司的负责人说,这些缝隙,主要是染色体的中央和尾部(即着丝点和端粒。附:随机测序法i用内切酶及电泳方法,把靶DNA从载体上分离出来(在基因文库中,成段DNA一般与某一种载体结合着),电泳后纯化靶DNA;ii把纯化的DNA用连接酶连接起来,叫环化(100p):(目的,确保靶DNA所有区段再一次被打断的机会相等);iii在Mn+1存在下,用DNA酶消化(或用超声波)打断DNA;iv电泳方式分离大小适中的DNA片段(500~800bp);v用T4噬菌体DNA聚合酶修补末端,然后连接于预先制备好的(序列已清楚)载体(如M13MP18,M13、MP19)上。vi将该载体一靶DNA复合体转染到大肠杆菌中,经过一种叫空斑纯化现象分离噬菌体,并获得单链DNA。vii用sanger法和其它方法分析各片段DNA序列;viii,比较或用计算机排序,测出靶DNA序列。DNA序列1,1’2,2’3,3’4,4’……是碱基相同的,因此应是连接处,这就是著名的YAC(YeastArtificialchromosome)方法原理,用该方法美国首先将人的第22染色体,第13染色体测序完成。组装分析出各个片段的DNA序列,最后装配到一个染色体上。结构基因组学上述方法我们把染色体分离,制备cDNA或gDNA文库,再从库中取出DNA片段,制备出标签,建立物理图谱,再将各段DNA测序,最后确定出整个染色体的DNA序列,这就是结构基因组学(structureGenomics)的研究内容。人的基因组图2000年6月26日公布。人的染色体HGP实验室(图)HGP实验室(图注)1999年9月,中国获准加入人类基因组计划,负责测定全部序列的1%。坐落在北京顺义空港工业园B区的中科院遗传所人类基因组中心承担了"1%"主要测序任务。图为技术人员正在准备从细菌中分离出DNAHGP实验室(图)HGP实验室(图注)1999年9月,中国获准加入人类基因组计划,负责测定全部序列的1%。坐落在北京顺义空港工业园B区的中科院遗传所人类基因组中心承担了"1%"主要测序任务。图为每天实验室消耗的大量实验枪头,据介绍,完成国际人类基因组计划"1%"工作用了1200万个枪头。HGP实验室(图)HGP实验室(图注)1999年9月,中国获准加入人类基因组计划,负责测定全部序列的1%。坐落在北京顺义空港工业园B区的中科院遗传所人类基因组中心承担了"1%"主要测序任务。图为实验室工作人员在无菌的状态下进行操作。我国的工作人员正在测序HGP实验室(图)HGP实验室(图注)1999年9月,中国获准加入人类基因组计划,负责测定全部序列的1%。坐落在北京顺义空港工业园B区的中科院遗传所人类基因组中心承担了"1%"主要测序任务。图为科研人员正在基因测序仪上进行测序,实验室的墙上贴着向国际组织递交的数据图。中国的HGP实验室(图)中国的HGP实验室(图注)1999年9月,中国获准加入人类基因组计划,负责测定全部序列的1%。坐落在北京顺义空港工业园B区的中科院遗传所人类基因组中心承担了"1%"主要测序任务。1999年4月至今,被实验人员成为“元老”的中心的第一台计算机仍在24小时运行。图为这台计算机上摆放着三根玉米棒,旁边有一行字:穷棒子精神永远光芒。HGP实验室(图)图注:基因测序1999年9月,中国获准加入人类基因组计划,负责测定全部序列的1%。坐落在北京顺义空港工业园B区的中科院遗传所人类基因组中心承担了"1%"主要测序任务。图为科研人员正在基因测序仪上进行测序。HGP实验室:基因测序1999年9月,中国获准加入人类基因组计划,负责测定全部序列的1%。坐落在北京顺义空港工业园B区的中科院遗传所人类基因组中心承担了“1%”主要测序任务。图为2001年5月,他们从美国引进的三十台世界上最先进的基因测序仪。这使中国的基因测序能力提高了五倍,超过了原来领先于中国的德国和法国,仅次于美国、英国和日本。公布人类基因组草图德国教育和科技部长在公布基因草图测序结果2001.2.13德国教育和科技部长在公布人的基因组草图测序结果2001.2.13国家主席江泽民2001.08.28在北京会见来华参加“人类基因组测序第十次战略会议”的科学家人类基因组计划“中国卷”完成通过有关专家的验收2001年8月26日,人类基因组计划“中国卷”完成,其基因组图在北京通过了国家科学技术部等部门有关专家的验收。中国承担的任务

中国作为参加人类基因组计划六个成员国中惟一的发展中国家,承担了1%的测序任务,承担区域:3号染色体短臂端粒至D3S3397(37CM)。(D-DNA;3-片段的位置,第三染色体;S-代表这是一条独一无二的DNA片段;397—编号).DNA片段的命名1DNA片段的命名一般由四部分组成。第一部分用D表示DNA;第二部分用0、1、2、…、22;X、Y:XY表示DNA片段所在的染色体位置,其中0代表还不知染色体位置,而XY表示片段在X和Y染色体上都有该片段;第三部分表示用探针检测到的DNA片段的复杂程度,S代表这是一条独一无二的DNA片段,Z代表在染色体一个单一位置重复出现的DNA片段,F代表在多条染色体上都存在同源序列但还没有定义家族的DNA片段;

DNA片段的命名2第四部分为区分不同的DNA片段加上一个数字编号,比如微卫星DNA标签(microsatelliteDNAmarker)DXS990表示在X染色体上独一无二的编号990的DNA片段。如果DNA片段是一个表达序列,可在上述四部分后加一个后缀E。完成情况

1、

经过作图、大规模测序(工作框架图阶段和完成图阶段)后,最终获得精确度达99.99%(相当于错误率低于万分之一)的完成图序列17.4Mb,所有BAC序列都经过指纹图谱的验证。2、在端粒位置目前尚存在一段约40-50Kb的技术性空缺(根据含有端粒序列的半YAC序列与已测序列的重叠度推断)。

3、除上述区域外,还完成了包括3号染色体其他区域以及其他染色体部分区域的序列14.2Mb,共完成31.6Mb的序列测定,有效总读长为384.2Mb。4、经过序列分析,在3P端粒至D3S3397区域,共识别122个基因,其中86个是已知基因(55个为功能明确的基因,8个为疾病相关基因);在31个基因中找到了75种不同的剪切方式;发现了1760个新的SNP(dbSNP中未报道);还进行了完成图中重复序列、CpG岛、GC含量的分析。意义

1%测序工作的完成将中国已有的测序队伍完善成具有基因组文库建立与筛选能力、大规模测序能力、生物信息处理能力的生力军。我国基因组测序能力的建立将使我国能在小鼠、水稻等模式动、植物基因组的国际测序计划中发挥更大作用,也能使我国有足够的技术力量启动具有中国资源特色的其他基因组研究。同时,该项目实施过程中所建立的研究基地和队伍,可与生物产业界合作,开展以获取自主知识产权为主的基因组研究项目。

第三部分:功能基因组学人类基因组学完成后,到2000年3月,有13种古细菌、58种细菌、7种真核生物的基因组DNA序列分析完成,下一步的工作就是解析其上的各个基因,这就是功能基因组学。功能基因组学(functionalgenomics)又叫后基因组学(post-genomics),即,研究DNA序列上的基因及位置的学科。当DNA测序完成后,需要确定出基因及所在位置,这是GHP的后5年的工作任务,如何对基因进行定位,有以下几种方法:1.测定序列时的遗传标志,即为基因所在位置如用mRNA探针,实际上,性状→分析出其蛋白质氨基酸序列→mRNA序列→与DNA对应的序列,已知的蛋白质能很快地将其基因定位。2.未知位点的基因测定及其定位——反求法遗传学作图目前预测人类中有6万个以上基因,用分析的方法测出的不超过一半,另外的几万个基因在哪?功能是什么?这成为功能基因组学研究的重大课题。传统方法是根据性状,推断基因存在。用连锁方法作图。反求法是用突变序列,观察性状变化,即可认定基因在此。①功能丧失法(loss-of-function)第一步,用一个正常性状的个体,标志其DNA序列,认定为正常基因;第二步,创造一个突变的DNA序列(测知与正常序列的差别);第三步,让突变的序列代替正常序列;微生物中是用不同品系杂交,使之产生重组,可把突变区段转到正常个体中。其它生物用点突变方法。第四步,观察正常个体性状发生了什么变化,变化后的性状,即为该基因的性状。②转座子标签法转座子,又叫跳跃基因(Jumppinggene),一段DNA,400—800对碱基,当它插入到哪个部位后,该旁的基因往往丧失功能,因而出现性状变异。转座子目前已用的转座子,如玉米中,Ac/Ds系统,En/Epm系统.果蝇中,Copia,FB,P

酵母中:δ,Tr1T—DNA原理转座子上可带有标志基因(remarkergene),也可以是其它标志如放射性标记32P,(生物素标志)等,当转座子插入到受体染色体中后,观察性状变异,再分析转座子的位置。转座子转化

转座子转化

Cccc

有色无色分析转座子位置的方法①探针,→Southernblot②PCR→与基因组比较法根据转座子或T—DNA的标志基因,分离出这一段DNA→把DNA克隆(PCR)→测序→与基因组比较,重复的序列即为基因的位置。③MegaclonTM技术MegaclorleTM技术是通过将DNA固定于微粒(Micro—beads)上来进行DNA文库构建的一种技术。用该技术可以进行基因表达的差异显示,并进一步分离新的基因。利用Mega—cloneTM技术,可以将约100万种的DNA一次性地固定到Micro—beads上,一个Micro—beads上含有104~105个相同序列的DNA分子。在此过程中,先将欲固定的DNA与约1670万种不同的Tag相连接,然后通过Tag与固定于Micro—beads上的Anti—Tag(序列与Tag互补)进行杂交,将DNA固定到特定的Micro—beads上。Anti—Tag就如“Micro—beads”这个“家”中的门牌号,而Tag犹如“邮包”上书写的“邮寄地址”。一个Micro—beads上只固定一种来源于mRNA的cDNA,在固定各种mRNA的cDNA时,不需要了解被固定的mRNA的任何信息,即使是没有任何信息来源的生物物种,其mRNA来源的cDNA也可以固定于Micro—beads上。

sstagcDNA文库的构建首先,需要准备带有1670万种Tag的DNA载体。Tag是一种32个碱基的短链DNA,通过对这32个碱基的排列组合(),可能合成Tm值相近的1670万条OligoDNA。

把细胞中的mRNA反转录成cDNA后,克隆至带有1670万种Tag的DNA载体库中,形成TagadaptedcDNALibrary。在此cDNALibrary中,使每种Tag只对应一种cDNA。使用PCR法扩增带有各种Tag的cDNA片段,然后在T4DNA聚合酶的作用下,使其产生单链Tag的ssTagadaptedcDNA文库。1.2cDNA和Micro—beads的结合

Micro—beads的直径约为5μm,每颗Micro—beads上固定有一种Anti—Tag(32个碱基),约有1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论