(遗传学专业论文)基于生物芯片全基因组测序的酶切分析平台开发及应用.pdf_第1页
(遗传学专业论文)基于生物芯片全基因组测序的酶切分析平台开发及应用.pdf_第2页
(遗传学专业论文)基于生物芯片全基因组测序的酶切分析平台开发及应用.pdf_第3页
(遗传学专业论文)基于生物芯片全基因组测序的酶切分析平台开发及应用.pdf_第4页
(遗传学专业论文)基于生物芯片全基因组测序的酶切分析平台开发及应用.pdf_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

东南大学硕士论文 摘要 论文题目:基于生物芯片全基因组测序的酶切分析平台开发及应用 研究生姓名:张群 导师姓名:陆祖宏( 教授) 学校名称:东南大学 研究人类基因组的个体差异进而了解个体疾病易感性及对药物敏感度,对个体基因组的再 测序势在必行。目前实用的基因组测序方法费时费力,于是发展快速低成本的基因组测序方 法正成为国际学术界研究热点。本实验室正在开发的快速低成本全基因组测序技术,旨在利 用生物芯片快速高通量的特点解决这个问题。我们知道测序前需把d n a 序列打断成小片段, 利用限制性内切酶是常用打断方法之一在芯片测序中,d n a 序列也需被切成均匀合适的 片段,如用限制性内切酶处理,那么酶的选取就显得很重要。通过实验尝试选择内切酶的方 法不经济且费力,而通过生物信息学的方法能为这个问题的解决提供极大便利。本文正是从 生物信息学的角度出发,构建了服务于生物芯片基因组再测序技术的酶切分析平台,并基于 此平台初步提出了内切酶选择策略。 该平台由三部分组成:基于w e b 的查询系统,酶切工具,数据分析程序。通过w e b 查 询系统,用户不仅可以获得酶的相关参数,而且可以了解两个酶能否共消化同一目标序列。 我们的酶切工具相比于之前类似的软件具有更大的数据处理能力,而且允许多个酶共同处理 同一序列,还能显示酶切后片段的位置、长度,更具特点的是能显示片段的序列及它们的末 端信息,并可显示片段模拟电泳图。数据分析程序通过计算一定长度范围内的片段在待测基 因组上的覆盖度,来判断能否利用这些片段进行全基因组的再测序。 通过对该工具的应用,我们提出了测序时限制性内切酶的选择策略。分别使用单个酶及可 同时使用的两两组合去切割t 7 噬菌体基因组,通过比较酶切结果,发现使用组合酶得到的 酶切片段更均一,对全基因组的覆盖度也更高。在今后生物芯片再测序工作中,可以更多考 虑使用组合酶来切割序列。利用该平台,我们用酶f b ki 切割了跟p 5 3 基因有关联的9 8 个 基因,提取得到的5 0 0 - 6 0 0 b p 长度片段,预测了片段上潜在的甲基化位点,为那些基因进一 步甲基化研究提供了帮助。此外通过该工具使用,发现酶切片段的数日和该序列上三联碱基 频率之间存在某种相关性,当然要作为一种结论它还需要未来更多数据和实验来说明。 关键词:全基因组再测序,酶切分析,生物信息学,组合酶,酶切片段,粘端信息,覆盖 度,v c 软件,密码子序列特征量 东南大学硕士论文 a b s t r a c t t i t “e :d e v e l o p m e n ta n da p p l i c a t i o no fr e s t r i c t i o ne n z y m ea n a l y s i sp l a t f o r mf o rb i o c h i p - b a s e d w h o l eg e n o m es e q u e n c i n g g r a d u a t es t u d e n tn a m e :z h a n gq u n s u p e r v i s o rn a m e :l uz u h o n g u n i v e r s i t y :s o u t h e a s tu n i v e r s i t y i no r d e rt of i n do u tt h es u s c e p t i b i l i t yt ot h ed i s e a s ea n dt h er e a c t i o nt od r u g s ,i t s q u i t e n e c e s s a r yt od or e - s e q u e n c et ot h ei n d i v i d u a la n di d e n t i 白i n d i v i d u a lg e n o m ed i f f e r e n c e s n o w , t h a tw o r kn e e d sl o t so f t i m ea n dm o n e y , s od e v e l o p i n gaf a s ta n dl o w - c o s ts e q u e n c i n gm e t h o dw i l l b eh o ti ni n t e r n a t i o n a lf i e l d o u rl a b o r a t o r yi sd o i n gr e s e a r c ho nt h ef a s ta n dl o w - c o s tg e n o m e s e q u e n c i n gt e c h n o l o g yb yt a k i n gu o ft h eb i o c h i pp l a t f o r m b e f o r es e q u e n c i n g t h ed n a s e q u e n c es h o u l db ec u ti n t of r a g m e n t s w ep l a n e dt ou s er e s t r i c t i o ne n z y m et od oi t i t si m p o r t a n t t oc h o o s ef i g h te n z y m e st oc u ts e q u e n c ei n t of r a g m e n t si i lr e l a t i v ee q u a ll e n g t h e s w h i c hs h o u l db e s i m u l a t e db yc o m p u t e rb e f o r ep r a c t i c e t h i st h e s i sd e s i g n e dr e s t r i c t i o ne n z y m ea n a l y s i sp l a t f o r m f o rg e n o m es e q u e n c i n gi l l u m i n e db yb i o i n f o r m a t i c s ,p u tt h ep l a t f o r mi n t oi n i t i a l p r a c t i c e , d e v e l o p e dt h ee n z y m ec h o o s i n gs t r a t e g y ,a n dg o ts a t i s f i e dc o n c l u s i o n t h ep l a t f o r mc a nb ed i v i d e di n t ot h r e ep a r t s :i n q u i r y , e n z y m ec u t t i n gs o f l w m e ,a n d c o n s e q u e n c ea n a l y s i sp r o g r a m i n q u i r yi sas y s t e mb a s e do nw e b c o m p a r e dw j 1t h es o f t w a r e a l r e a d ym a d e , o a rt o o lh a st h ea b i l i t yt od e a lw i t hl a r g e rd a t a i tc o u l db ea l l o w e dt oi n p u t m u l t i e n z y m ea n ds h o w st h el e n g t ha n dp o s i t i o no f t h er e s t r i c t i o nf r a g m e n t s i tc a r ls h o wt h ee n d s i n f o r m a t i o na n dt h es e q u e n c eo f e a c hf r a g m e n t , o rs h o wt h ei n f o r m a t i o nb yc h o s i n gi n t e r v a l ,a n d c o u l ds h o wt h ee l c c t r o p h o r e s i sm a po f t h ef r a g m e n t c o n s e q u e n c ea n a l y s i sp r o g r a mc a nc a l c u l a t e f i a g m e n t sc o v e r a g er a t et ot h ew h o l eg e n o m e ,a n dt h e nj u d g ew h c t h e rt h o s ef r a g m e n t sc a nb e u s e dt os e q u e n c et h ew h o l eg e n o m e a t t e rm a d et h ep l a t f o r m ,w ed e v e l o p e das t r a t e g yt oc h o o s e 则u s e di i ls e q u e n c i n g w e t o o ku s eo ft 7p h a g eg e n o m e c o m p a r e dt h er e s u l to fs i n g l ee n z y m ec u t t i n gw i t ht w oc o m b i n e d 9 1 1 z y m a 3c u t t i n g , w ef o u n dt h a tt h ef r a g m e n t sa g ei d e a la n dt h ec o v e r a g er a t et ot h eg e n o m ei s h i 曲e r , w h i c hp r o v et h ec o m b i n i n ge n z y i l l es t r a t e g yp r a c t i c a b l e i na d d i t i o n , w eu s a dt h ep l a t f o r m t of o r e c a s tp o t e n t i a lm c t h y l a t i o ns t a t u so n5 0 0 6 0 0 b pf r a g m e n ta f t e rt h ef o kie 1 1 z y m ed i g e s t i n g t h es e q u e n c eo f 9 8g e n e sr e l a t e dt op 5 3 i tw i l lb eu s e dt od ob i o c h i p - b a s e dm e t h y l a t i o nr e s e a r c h w ef o u n dt h er e l a t i o nb c t m e a nt h en u m b e ro f f r a g m e n t sa n dt h ea p p e a r a n c er a t eo f t r i p l e - b a s e si n t h es e q u e n c e a n di tn e e dt ob ec o n f i r m e db ym u c hm o r ed a t aa n dp r a c t i c e si l lt h ef u t u r e k e yw o r d s :w h o l eg e n o m er e - s e q u e n c i n g ,e n z y m ec u t t i n ga n a l y s i s ,b i o i n f o r m a t i c s ,e n z y m e s e t , r e s t r i c t i o nf r a g m e n t ,e n di n f o r m a t i o n ,c o v e rr a t e ,v cs o f t w a r e ,s e q u e n c ec o d o nc h a r a c t e r i i 东南大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得 的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含 其他人已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构 的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均 已在论文中作了明确的说明并表示了谢意。 丛堡矽 东南大学学位论文使用授权声明 东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位 论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人 电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论 文被查阅和借阅,可以公布( 包括刊登) 论文的全部或部分内容。论文的公布( 包 括刊登) 授权东南大学研究生院办理。 研究生签名:芗跃刃备 导师签名: g 7 - q 、砷 东南大学硕士论文 1 1 课题研究背景 1 1 1 生物信息学的兴起 第一章绪论 开始与1 9 9 0 年的人类基因组计划【1 】近年来取得了一系列里程碑式的成果,2 0 0 1 年国际人 类基因组测序联盟( i n t e r n a t i o n a lh u m a ng e n o m es e q u e n c i n gc o n s o r t i u mi h g s c ) 宣布完成了 人类基因组序列草图【2 】。这份人类基因组计划草图覆盖了人类全基因组的9 4 的区域,其 中覆盖了常染色质的9 6 ,同时预测人的编码基因有3 0 0 0 0 , 4 0 0 0 0 个。2 0 0 4 年i h g s c 公布 了人类基因组常染色质的完成图【3 】。这份完成图覆盖了人类基因组常染色质的9 9 并且只 留有3 4 1 个g a p ,同时预测人的编码基因只有2 0 0 0 0 2 5 0 0 0 个。可以看出人类对自我的认识 是越发深入。而随着这些研究的进行,产生了大量的数据,虽说数据是信息和知识的源泉, 但它并不等同于知识,关键在于如何去挖掘,在这些海量数据中去寻找内在联系、探究本质 的工作必须依靠生物信息学的方法。生物信息学正是在这种生物信息量急剧膨胀的背景下诞 生的【4 ,5 】。作为一门新兴的交叉科学,它的研究领域在不段拓展,从传统的生物分子数据 的收集和管理,到序列结构比较,到对整个基因组的分析,再到各个分子生物学专门领域都 有它的身影f 6 】,可以说现在的分子生物学家不了解生物信息的知识去做研究的已经很少。 本课题正是以生物信息学为指导思想去开展的。 1 1 2 人类基因组再测序计划【7 1 3 】 当人类基因组计划完成以后,科学家一方面对产生的数据进行分析,另一方面开始了其他 大型的国际合作计划,如h a p m a p 计划,蛋白质组计划等,标志着后基因组时代的到来。人 们花费大量的物力和人力去做这些工作到底是为什么目的呢? 这一切的动力和出发点是对 自身健康和潜能的关心。人们往往憧憬着这样一个时代,一个人来到世界后,清晰的知道自 己的遗传背景,具有哪些疾病的易感性,从而进行积极预防,医疗事业正式进入预防为主的 时代,人们享受健康。这一切的实现必须以快速低成本的个体化测序为基础。有了它才可能 实现个体化的预防,治疗,才能充分发掘人类潜能。暂时不讨论其中可能涉及的伦理问题, 单从科学的角度考虑,我们有必要尽快实现这一造福人类的设想。 下面谈谈测序的技术发展。1 9 9 0 开始,科学家用了1 2 年的时间完成了3 0 亿对碱基序列 的测定,测序仪器的研发在这其中起了关键的作用。毛细管阵列电泳仪的发明,自动化测序 仪的出现,使1 9 9 5 年时每一个碱基的测序成本己降为l 美元,测序速度提高到1 0 0 ,0 0 0b p 天。随着a b ip r i s m ? 3 7 0 0d n a 测序仪的推出,到1 9 9 8 年,每一个碱基的测序成本降低到 o 1 美元,测序速度达到9 0 0 ,0 0 0b p 天。那么现在昵? 目前国际上要完成一个哺乳动物全基 因组的测序需要上千万美元。如果工作是以当前最为先进的a b ip r i s m ? 3 7 3 0d n a 测序仪 东南大学硕士论文 开展的,那么平均每个碱基的成本是o 0 0 8 美元。要完成一个3 0 亿碱基的测序,需要1 5 0 台a b ip d s m ? 3 7 3 0d n a 测序仪运转一年,测序成本达到二千四百万美元。高通量毛细管 阵列测序技术测出个体的基因组d n a 需要如此高的代价,而在提高d n a 测序速度和降低 成本方面的改进空间又十分有限,已经不能满足要求了,因此急需发展一种新的快速、廉价 的测序技术来满足“个体测序”,“个体医疗”的需要。要进一步降低测序成本,必须发展一代 创新的测序方法和技术。现在,国际上特别是美国的科学家,已经发展了一批新的技术,有 可能大幅度的降低d n a 测序的成本。 美国国家人类基因组研究所( n h g r i ) 一直致力于发展通量更高、速度更快、成本更低 的基因组测序新技术,2 0 0 4 年l o 月,他们启动了新一轮的三千八百万美元的资助计划,来 发展大幅度降低d n a 测序成本的新技术。n h g r i 资助的短期目标为:在5 年内实现十万 美元的全基因组测序技术,并实现产业化;n h g r i 资助的长期目标为实现一千美元的全基 因组测序目标,但是在该资助计划中没有给出实现该目标明确的时间表。美国文特尔科学基 金( j c r a i g v e n t e r ,s c i e n c e f o u n d a t i o n ) 悬赏5 0 万美元,用于奖励任何在d n a 自动测序中 取得显著进展的组织或个人,这一进展必须满足在1 0 0 0 美元以内测出人类全基因序列这一 要求。 资金的奖励是其次,研究人的动力是看到了技术革新可能带来的新的革命,快速经济的个 体化测序技术的发明必将推动新一轮的社会进步。人类一直在探索中不断前行,谁能率先成 功并对人类文明进步作出贡献,我们拭目以待1 1 2 生物芯片在个体化测序中的应用 目前国际上正在开发的d n a 测序技术大体上可以分为两类:第一类被称为“e v o l u t i o n a r y i m p r o v e m e n t ”,即进一步发展与完善目前广泛采用的以凝胶电泳分离为基础的d n a 序列分 析技术,如毛细管凝胶电泳法、阵列毛细管凝胶电泳法、超薄层板凝胶板电泳法,这些方法 都是以传统的化学降解法和双脱氧链终止法为基础发展而来;第二类被称为 r e v o l u t i o n a r y m e t h o d s ,即抛弃传统的凝胶电泳分离步骤直接进行测序的方法,如质谱法、杂交法、原子 探针显微镜法、流动式单分子荧光检测法等【1 4 - 17 】。 制约测序技术的发展主要有三个方面:通量、阅读长度及成本u s 。目前创新性的测序技 术也是围绕解决这三个问题而努力的,人们所期盼的个体化测序方法是希望达到快速高通量 低成本的目标。 生物芯片的方法有助于这个目标的实现。生物芯片技术是高效地大规模获取相关生物信息 的主要手段。目前,该技术应用领域主要有基因表达谱分析、新基因发现、基因突变及多态 性分析、基因组文库作图、疾病诊断和预测、药物筛选、基因测序等【1 9 】。从八十年代初s b i t ( s e q u e n c i n gb yh y b r i d i z a t i o n ) 概念的提出,到九十年代初以美国为主开始进行的各种生物 芯片的研制,不到十年的功夫,芯片技术得以迅速发展,并呈现发展高峰。国外的多家大公 司及政府机构对此研究表现出极大兴趣,并投入相当大的财力和人力。我们实验室是国内最 2 东南大学硕士论文 早进行生物芯片研究的单位之一,在芯片的理论研究和创新应用上积累了大量经验。研制了 多个实用型芯片并且发展了多个研究平台,开展甲基化检测,s n p 分型等服务。在此基础上, 实验室更是提出了“快速低成本d n a 测序技术”,旨在依托实验室的芯片平台,用四年左右 时间开发出一套快速高通量的d i q a 再测序技术,成本控制在1 0 0 0 0 元人民币以下。这是一个 艰巨的任务,但不是i m p o s s i b l em i s s i o n 。实验室已经有了一套完整的方案。 其基本的技术路线如下图,1 ) 基因组d n a 的预处理和在芯片上固定:2 ) 基因组d n a 的高并行在片延伸和单分子荧光的在片检测;3 ) 芯片上扩增片段在基因组上的定位和序列 拼接。研究目标是:发展一种基于在片延伸的高通量全基因组测序技术,对于已知基因组的 物种,再测序成本在1 0 ,0 0 0 人民币以下;实现对于1 0 例人类全基因组序列实现个体化测 序,再测序的覆盖度达到8 0 以上;发展r n a 片断的测序技术,以线虫为对象,检测不同 时期线虫的可转录r n a 。 匝巫围匦匦圃 寻 图1 - 1 芯片再测序流程图 可以看出生物信息学在整个过程中担负着头和尾的任务,而本课题正是一个开头的工作 为样品处理提供支持。下一节主要讲述本课题的任务并概括一下已经进行的研究工作。 1 3 本课题的任务和主要研究成果 本课题核心研究任务是:对酶切后的片断进行分析,提供关于片段的相关信息,由此作出 判断,为用于测序前消化序列的酶的选择提供帮助。 以图1 2 例,简单的,我们的任务就是找来一个酶n l ai i i 对待处理的序列进行模拟酶切, 获得片段的个数,每个片段在序列中的位置,片段序列信息,如果切出的片段是粘端的,我 们要知道是3 还是5 粘端并保留粘端序列信息,以n l ai i i 为例它切出的粘端序列信息为 3 东南大学硕士论文 c a t g ,是3 粘端。然后我们可以看看在2 0 0 - 3 0 0 b p 范围内的片段的个数,并计算出他们对整 个序列的覆盖程度。最后判定n l ai i i 这个酶是否可以用来处理序列。 置接一 切位 嬲酬f 羞盏a 4 麒麟雕: 图1 2 内切酶n i l i l l 切割序示意图 我们的最终日标是提供用户在实验时可以使用的酶。所以首先是选择一些酶,然后是分析 酶切片段,最后是根据片段来决定使用哪些酶做预处理。 要达成这样的目标显然用传统的方法实现是困难的,我们需要开发实用的工具去达成愿 望。目前在网络上可以找到很多现成酶切软件,他们能输出切出了多少个片段,位置在哪。 但一般它们允许输入的数据量较少,只有少量输出信息,不能提供粘端信息、切后片段的序 列情况,多酶切的效率很低等等,所以必须开发适用于测序的酶切软件。其实我们的工作不 仅是切割,更重要的是对酶的选择,切割出的片段信息是我们用来判断的一个重要信息。所 以本课题最终开发的酶切平台包括三个部分:查询系统,酶切软件,数据分析程序。当然酶 切软件是其中的重要部分。 我们开展的一系列的工作将在接下来的章节中一一叙述,第2 章将主要介绍限制性内切酶 查询系统r e s p l n f o ,第3 章我们介绍酶切分析平台软件的构建,第4 章是探讨选择酶的策略, 用t 7 噬菌体对策略进行验证以及利用平台去预测基因的潜在甲基化位点,第5 章是讨论了 酶切片段个数和序列特征的可能关系。第6 章是对工作的总结和展望。 参考文献 1 c a n t o rc o r c h e s t r a t i n gt h eh u m a ng e n o m ep r o j e c t s c i e n c e ,1 9 9 02 4 8 ( 4 9 5 1 ) :4 9 - - 5 i 2 i n t e r n a t i o n a lh u m a ng e n o m es e q u e n c i n gc o n s o r t i u m i n i t i a ls e q u e n c i n ga n d a n a l y s i so f t h e h u m a n g e n o m e n a t u r e , 2 0 0 1 v o l 4 0 9 ( 8 6 0 - 9 2 1 ) 3 i n t e r n a t i o n a lh u m a ng e n o m es e q u e n c i n gc o n s o r t i u mf i n i s h i n gt h ee u c h r o m a t i c s e q u e n c eo f t h eh u m a ng e n o m e n a t u r e ,2 0 0 4 v o l4 3 1 ( 9 3 1 - 9 4 5 ) 4 陈润生生物信息学川生物物理学报,1 9 9 9 ,1 5 ( 1 ) :5 - 1 2 5 降润生当前生物信息学的重要研究任务 j 】生物工程进展,1 9 9 9 ,1 9 ( 4 ) :1 1 1 4 6 孙啸,陆祖宏,谢建明生物信息学基础 m 】北京,清华大学出版社,2 0 0 5 1 - 3 5 7 j c v e n t e r , e ta 1 ,t h es e q u e n c eo f t h eh u m a ng e n o m e :阴,s c i e n c e ,2 9 1 ( 2 0 0 1 ) 1 3 0 4 - 1 3 5 1 8 e s c o l l i n s 。e d g 胤a e g u t l m a c h e r , m s g u y c r , av i s i o nf o rt h ef u b a o f 4 东南大学硕士论文 g e n o m i c sr e s e a r c h j ,n a t w e ,4 2 2 ( 2 0 0 3 ) 8 3 5 - 8 4 7 9 s a n g e resm i c k l e na n da rc o u l s o n d n as e q u e n c i n gw i t hc h a i n - t e r m i n a t i n g i n h i b i t o r s 叨p r o c n a t l a c a d s c i ,7 4 ( 1 9 7 7 ) 5 4 6 3 5 4 6 7 1 0 s m i t h , l m ,e ta f l u o r e s c e n c ed e t e c t i o ni na u t o m a t e dd n as e q u e n c ea n a l y s i s 叨 n a a a e3 2 1 ( 1 9 8 6 ) 6 7 4 - - 6 7 9 1 1 l i p s h u t zr ,f o d o rs ,g - i n g e r a sl e ta 1 h i g hd e n s i t ys y n t h e t i co l i g o n u c l e o t i d ea r r a y s 阴n a t u r eg e n e t i c ss u p p l e m e n t , 2 1 ( 1 9 9 9 ) 2 0 - 2 4 1 2 d r m a n a c r c r k v e n j a k o v r m e i l l o d o fs e q u e n c i n g o f g e n o m e s b y h y b r i d i z a t i o n w i t h o l i g o n u c l e o t i d e p r o b e s 暇u s p a t e n t , 5 2 0 2 2 3 1 1 9 9 3 1 3 s m i t h ,l m ,f u n g sh u n k a p i l l e r , m w ,h u n k a p i l l e r , t j ,a n dh o o d ,l t h es y n t h e s i s o f o l i g o n u c l e o t i d e sc o n t a i n i n gal i p h a t i ca m i n og r o u pa tt h e5t e r m i n u s :s y n t h e s i so f f l u o r e s c e n td n a p r i m e r sf o ru s ei nd n as e q u e n c ea n a l y s i s n u c l e i c a c i d sr e s 1 3 ( 1 9 8 5 坦3 9 9 - 2 4 1 2 1 4 l u c k e yj a e ta 1 h i g h s p e e dd n a s e q u e n c i n gb yc a p i l l a r ye l e c t r o p h o r e s i s n u c l e i c a c i d sr e s 1 8 ( 1 9 9 0 ) 4 4 1 7 - 4 4 2 1 1 5 g u t t m a n ac o h e n ,a sh e i g e r , d n ,a n dk a r g e r ,b l a n a l y t i c a la n d m i c r o p r e p a r a t i v eu l t r a h i g hr e s o l u t i o no f o l i g o n u c l e o t i d e sb yp o l y a c r y l a m i d eg e l h i 曲一p e r f o r m a n c ec a p i l l a r ye l e c t r o p h o r e s i s a n a l c h e m 6 2 ( 1 9 9 0 ) 1 3 7 - 1 4 1 1 6 s w e r d l o w , h ,w u ,s lh a r k e ha n dd o v i c h i n j c a p i l l a r yg e le l e e t r o p h o r e s i sf o r d n a s e q u e n c i n g l a s e ri n d u c e df l u o r e s c e n c ed e t e c t i o nw i t ht h es h e a t hf l o we u v e t t e 1 c h r o m a t o g r 5 1 6 ( 1 9 9 0 ) 6 1 6 7 1 7 h u a n gx c ,q u e s a d am a ,m a t h i e sr a d n as e q u e n c i n gu s i n gc a p i l l a r ya r r a y e l e c t r o p h o r e s i s a n a l c h e m , 6 4 ( 1 9 9 2 ) 2 1 4 9 - 5 4 1 8 w o o l l e ya t a n dm a t h i e sr a u l t r a h i g h s p e e dd n as e q u e n c i n gu s i n gc a p i l l a r y e l e c t r o p h o r e s i sc h i p s a n a lc h e m 6 7 ( 1 9 9 5 ) 3 6 7 6 - 8 0 1 9 马立入主编生物芯片,北京:化学工业出版社,2 0 0 3 东南大学硕士论文 第二章酶切平台限制性内切酶检索系统 r e s p l n f o 使用限制性内切酶消化基因组前,需要对它们的反应条件很了解,特别是进行双酶共操作 时,两个酶需要有相同的反应条件,这点在酶切的顺利、完全进行上很重要。为此我们设计 了这个限制性内切酶检索系统r e s p l n f o ,通过w e b 查询页面用户可以直观的了解到自己所 将选择的酶的反应条件。这个系统最大特点是通过组合酶查询可以反馈用户能够同时使用的 酶的信息,方便用户进行进一步选择。整个r e s p l n f o 系统使用a s p + h t m l 编写。 2 1 限制性内切酶相关生物学基础 这一小节介绍限制性内切酶的相关知识,特别是限制性内切酶的使用条件,因为它将在 实验选择中起到重要作用,并且也是查询系统设计参考的要素。 2 i 1 限制性内切酶综述 在生物体内有一类酶,它们能将外来的d n a 切断,即能够限制异源d n a 的侵入并使之 失去活力,但对自己的d n a 却无损害作用,这样可以保护细胞原有的遗传信息。这种切割 作用是在d n a 分子内部进行的,所以命名为限制性内切酶( 简称限制酶r e s t r i c t i o n e n d o n u c l e a s e so rr e s t r i e t i o n ) 【l 】。在3 0 多年前人们在对噬菌体的宿主特异性的限制修饰现 象进行研究时,首次发现了它。细菌可以抵御新病毒的入侵,而这种”限制”病毒生存的办法 则可归功于细胞内部可摧毁外源d n a 的限制性内切酶。首批被发现的限制性内切酶包括来 源于大肠杆菌的e c o ri 和e c o ri i ,以及来源于h e a m o p h i l u si n f l u e n z a e 的h i n dl i 和h i n di i i 。 限制性内切酶的主要功能是保护细菌不受噬菌体的感染,如今这一观点己被人们广泛接 受。它们作为微生物免疫机制的一部分行使其功能。当一个没有限制性内切酶的细菌被病毒 感染时,大部分病毒颗粒都能成功地进行感染。然而一个有限制性内切酶的同种细菌被成功 感染的比率显著下降。出现更多的限制性内切酶将会起到多重保护作用,而一个拥有4 到5 种各自独立的限制性内切酶似乎将会使细胞坚不可摧【2 】。 研究者很快发现这些酶可以用于分子生物学操作,因为它可在特定位点切开d n a ,产生 可体外连接的基因片段,是研究基因组成、功能及表达非常有用的工具。它的出现使分子生 物学研究向前跨了一大步,可以说没有它要想进行基因重组,测序是不可能的。于是很多研 究团体和公司加入到发现和克隆限制性内切酶的队伍中来,而其中以n e b 公司傲的最为出 色,目前有3 0 的酶都是他们发现和克隆纯化的【3 】。 3 0 多年来被发现的限制性内切酶的形式多样,从大小上来说,它们可以小到如p v ui i ( 1 5 7 6 东南大学硕士论文 个氨基酸) ,也可以比1 2 5 0 个氨基酸的c j ei 更大。在已纯化分类的3 0 0 0 种限制性内切酶中, 已发现了超过2 5 0 种的特异识别序列。尽管很多新发现的酶的识别序列与已有的重复( 即同 裂酶) ,仍然有识别新位点的酶不断被发现。 2 1 2 三类限制性内切酶【4 1 0 】 研究者将限制性内切酶按照亚基组成、酶切位置、识别位点、辅助因子等因素划分为三大 类。然而从蛋白测序的结果或者分子水平上分类,则他们的变化多种多样,远远不止这三种。 l 型限制性内切酶是一类兼有限制性内切酶和修饰酶活性的多个亚基的蛋白复合体。它们 在识别位点很远的地方任意切割d n a 链。以前人们认为i 型限制性内切酶很稀有,但现在 通过对基因组测序的结果发现这一类酶其实很常见;尽管i 型酶在生化研究中很有意义,但 由于不产生确定的限制片段和明确的跑胶条带,因而不具备实用性。 i i 型酶在其识别位点之中或临近的确定位点特异地切开d n a 链。它们产生确定的限制片 段和跑胶条带,因此是三类限制性内切酶中唯一用于d n a 分析和克隆的一类。i i 型限制性 内切酶由一群性状和来源都不尽相同的蛋白组成,因而任意一种限制性内切酶的氨基酸序列 可能与另一种限制性内切酶的氨基酸序列截然不同。实际上,从已知的情况上看,这些酶很 可能是在进化过程中各自独立产生的,而非来源于同一个祖先。 i i 型限制性内切酶中最普遍的是象h h al 、h i n di i i 和n o ti 这样在识别序列中进行切割的 酶。这一类酶是构成商业化酶的主要部分。大部分这类酶都以同二聚体的形式结合到d n a 上,因而识别的是对称序列;但有极少的酶作为单聚体结合到d n a 上,识别非对称序列。 一些酶识别连续的序列( 如e c o ri 识别g a a t t c ) ;而另一些识别不连续的序列( 如b g li 识别g c c h r 卜r 卜附n g g c ) 。限制性内切酶的切割后产生一个3 羟基端和一个5 磷酸基团。它 们的活性要求镁离子,而相应的修饰酶则需要s 甲硫氨酸腺苷的存在。这些酶一般都比较 小,亚基一般都在2 0 0 3 0 0 个氨基酸左右。另一种比较常见的酶是i i s 型酶,比如f o kl 和 a 1 wi ,它们在识别位点之外切开d n a 。这些酶的大小居中,约为4 0 0 6 5 0 个氨基酸左右; 它们识别连续的非对称序列,有一个结合识别位点的域和一个专门切割d n a 的功能域。一 般认为这些酶主要以单体的形式结合到d n a 上,但与临近的酶结合成二聚体,协同切开 d n a 链。因此一些i i s 型的酶在切割有多个识别位点的d n a 分子时,活性可能更高。第三 种i i 型限制性内切酶( 有时也被称为i v 型限制性内切酶) 是一类较大的、集限制和修饰功 能于一体的酶,通常由8 5 0 - 1 2 5 0 个碱基组成,在同一条多肽链上同时具有限制和修饰酶活 性。有些酶识别连续序列,并在识别位点的一端切开d n a 链;而另一些酶识别不连续的序 列( 如b e gi :c g a n n n n n n t g c ) ,并在识别位点的两端切开d n a 链,产生一小段含识别 序列的片段。这些酶的氨基酸序列各不相同,但其结构组成是一致的。他们在n 端由一个 负责切开d n a 的功能域,这个域又与d n a 修饰域连接;此外还有一到两个识别特异d n a 序列的功能域构成c 端,或以独立的亚基形式存在。当这些酶与底物结合时,它们或行使 限制性内切酶的功能切开底物,或作为修饰酶将其甲基化。 i i i 型限制性内切酶也是兼有限制修饰两种功能的酶。它们在识别位点之外切开d n a 链, 7 东南大学硕士论文 并且要求识别位点是反向重复序列;它们很少能产生完全切割的片段,因而不具备实用价值, 也没有人将其商业化。 目前我们一般选用型中有确定识别位点的酶作为分子生物学研究使用的酶,本酶切平台 也基于了这个前提而构建。 2 1 3 影响限制性内切酶活性的因素 2 1 3 1 星号活性 酶识别特异性的改变是受酶本身的性质及可能引起星号活性的反应条件影响。常见的引起 酶识别改变的条件有:单碱基替换、识别序列外侧碱基缩短以及单链切刻。p o l i s k y 等对e c o r l 的早期研究表明,在低盐浓度、高p h 值条件下,e e o ri 可能切割n a a t t n 序列;而g a r d n e r 等的研究表明,只要识别中心的四碱基序列( a a l - r ) 不出现a t 替换,e c o ri 可以切割其 它任何单碱基替代序列】。 目前对酶的切割效率影响比较大的是所谓的星号活性。什么叫星号活性,是制在非理想的 条件下,内切酶切割了与识别位点相似但不完全相同的序列。有研究者提出,这种”星号” 活性可能是内切酶的一种普遍特性,如果提供给相应反应条件,所有内切酶都会出现非特异 性切割。而n e b 公司已证实下列酶存在星号活性:a p oi ( 2 ) 、a s ei ( 2 ) 、b a m hi ( 3 ) 、 b s s h l l ( 2 ) 、e c o r i ( 4 ) 、e c o r v ( 5 ) 、h i n d l l l ( 1 ) 、h i n f l ( 6 ,7 ) 、p s t i ( 8 ) ,p v u i i ( 9 ) 、 s a li ( 8 ) 、s e ai ( 2 ) 、t a qi ( 1 0 ) 、x m ni ( 2 ) 。括号里的数字表示可能切割的位置 1 2 ,1 3 1 。 导致星号活性的因素: 较高的甘油浓度( 5 v v ) : 酶与底物d n a 比例过高( 不同的酶情况不同,通常为 1 0 0u ,磺) : 低盐浓度( 电5m m ) ; 高o h 值( p h8 0 ) ; 存在有机溶剂( 如d m s o 、乙醇、乙烯乙二醇、二甲基乙酰胺、二甲基甲酰胺、s u l p h a l a n e ) 用其他二价离子替代镁离子( 如m n + + ,c u + + ,c o + + ,历+ + 等) 以上因素的影响程度因酶的不同而有所不同。例如e c o ri 比p s ti 对甘油浓度更敏感,而 后者则对高p h 值更敏感一些。 抑制星号活性的方法: 尽量用较少的酶进行完全消化反应。这样可以避免过度消化以及过高的甘油浓度。 尽量避免有机溶剂( 如制备d n a 时引入的乙醇) 的污染。 将离子浓度提高到1 0 0 - 1 5 0m m ( 若酶活性不受离子强度影响) 。 将反应缓冲液的p h 值降到7 0 。 二价离子用m 簖+ 。 虽然有星号活性的存在,但我们在设计酶切系统时只是考虑了理想状态,因为大多数星号 活性是可以控制的,只要在正常条件,使用随酶提供的n e

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论