中南民族大学研究生生物信息学05第五课多序列联配.ppt_第1页
中南民族大学研究生生物信息学05第五课多序列联配.ppt_第2页
中南民族大学研究生生物信息学05第五课多序列联配.ppt_第3页
中南民族大学研究生生物信息学05第五课多序列联配.ppt_第4页
中南民族大学研究生生物信息学05第五课多序列联配.ppt_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

F 多序列联配:基因和蛋白质家族,思考题: 多序列比对的作用 一致序列、权重矩阵的定义,多序列比对可以阐明家族性蛋白质和核苷酸序列中的内在关系。 与两序列联配相比,多序列联配更富含进化保守关系的信息,因此通常能告诉我们更多的信息。例如,两个同样的氨基酸残基可以在两条蛋白序列间联配;但事实上这些残基没有发生突变的原因可能是偶然的;另一方面,如果一个残基在一个家族所有序列中都是保守的,而该家族的序列相互间又不同时,就意味着该残基可能起着关键的结构或功能作用。 能表明两条或两条以上序列之间的关系。当所考察的序列不同时,保守的残基往往是维持稳定结构或生物学功能的关键残基。多序列联配可以揭示关于蛋白质结构和功能的许多线索。,Internet 上的许多网站具有ClustalW分析软件 可以免费下载,对要分析的序列的输入格式有要求,FASTA(Pearson)格式,sequence 1 ATTGCAGTTCGCA sequence 2 ATAGCACATCGCA,可修改分析参数,在ClustalW 网页的 “Parameters”修改参数,点击“align”重新排列序列,部分参数定义,Gap opening penalty:增大数值使 gap 数目减少 Gap extention penalty:增大数值使 gap 长度变短 Weight transition:AG 转换或 CT 转换(multiple DNA sequence alignment) Hydrophilic gap:选择“ on” 将增加形成 gap 的机会(multiple protein sequence alignment) Residue-specific gap penalties:选择“ on” 将增加在某些氨基酸残基处形成 gap 的机会,而减少在另一些氨基酸残基处形成 gap 的机会(multiple protein sequence alignment),可进一步对排列好的序列进行修饰(2),在EBI的ClustaW分析网页(http:/www.ebi.ac.uk/ clustalw/index.html)输入序列,“ClustalW Results”网页展示多序列对位排列结果,点击“Show Colors”用不同颜色的字母展示对位排列结果,颜色修饰 功能,突出相同或相似位点,蛋白质家族和模式数据库,一致序列: 这些序列把多序列联配的信息压缩至单条序列。主要的缺点是除了在特定位置最常见的残基之外,它们不能表示任何概率信息。一致序列的产生说明了任何蛋白家族的表示都是有偏向的,这主要是由于来源的序列集是有偏向的。,以凝血酶(THRB)和因子9(FA9)序列为例,从多序列联配中产生一致序列。 一致序列中每个位点对应于联配的一列。如果某残基为60以上的序列所共有,则设其为一致残基,否则记为X。60这个阈值通常是可变的。,PROSITE序列模式数据库, ,PROSITE模式有很多缺点:首先,它们长度较短使得不相关序列中有假阳性的存在。且这种效应不仅仅局限于与翻译后 修饰有关的较短模式。其次,虽然它们允许描述特定位置的变化,但无法计算该变化的概率。,PRINTS和BLOCKS PRINTS和BLOCKS是密切相关的。它们分别通过来自一组蛋白或蛋 白家族中最高度保守区域的多序列联配无空位片段的形式采表示蛋白质 家族。这种多序列联配无空位片段分别定义为blocks(在BLOCKS中)或 motifs(在PRINTS中)。PRINTS中这种motif集代表一种称为finger-print的 家族。PRINTS数据库质量非常高,它由 大量的人工工作创造,包含 关于蛋白质家族和功能的详尽注释和描述。 最初的BLOCKS版本由自动的方法产生,但现在许多数据库(包括 PRINTS)都以BLOCKS的格式存在。下图显示了SH3结构域的PRINTS 条目的例子。PRINTS通过覆盖SH3区域多序列联配中最保守区域的4个 motifs来表示这个区域。 这些数据库中的motifs要比PROSITE模式覆盖更大的序列区域。 PRINTS和BLOCKS模式的匹配比PROSITE模式的匹配更为敏感 (可以找到更多远距离关系)和更加特异(更少的假阳性出现)。,序列轮廓:(又称为权重矩阵) 它们表示完全结构域序列,多序列联配中每个位 点的氨基酸都有分值,并且特定位置插入或缺失的 可能性均有一定的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论