核酸与蛋白质序列分析_第1页
核酸与蛋白质序列分析_第2页
核酸与蛋白质序列分析_第3页
核酸与蛋白质序列分析_第4页
核酸与蛋白质序列分析_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

核酸与蛋白质序列分析第1页/共69页2023/4/142生物信息学第六章、核酸和蛋白质序列分析第六章、核酸和蛋白质序列分析第2页/共69页2023/4/143生物信息学第六章、核酸和蛋白质序列分析第二节蛋白质序列分析一、蛋白质的基本结构和功能二、蛋白质的组成及基本性质分析三、蛋白质结构预测四、蛋白质特殊结构或结构特征的分析第3页/共69页2023/4/144生物信息学第六章、核酸和蛋白质序列分析一、蛋白质的基本结构和功能1、蛋白质的功能酶的催化作用物质运载和贮存作用营养存贮作用

运动协调作用机械支持作用免疫保护作用信号接受与传导作用

生长和分化控制作用第4页/共69页2023/4/145生物信息学第六章、核酸和蛋白质序列分析2、氨基酸氨基酸(aminoacid)是蛋白质的基本结构单位

NH2

H—C—COOH R

氨基酸通式第5页/共69页2023/4/146生物信息学第六章、核酸和蛋白质序列分析氨基酸名称英文缩写简写氨基酸名称英文缩写简写甘氨酸GlyG丝氨酸SerS丙氨酸AlaA苏氨酸ThrT缬氨酸ValV天冬酰胺AsnN异亮氨酸IleI谷酰胺GlnQ亮氨酸LeuL酪氨酸TyrY苯丙氨酸PheF组氨酸HisH脯氨酸ProP天冬氨酸AspD甲硫氨酸MetM谷氨酸GluE色氨酸TrpW赖氨酸LysK半胱氨酸CysC精氨酸ArgR20种标准氨基酸的英文简写第6页/共69页2023/4/147生物信息学第六章、核酸和蛋白质序列分析对于20种标准的氨基酸,按照侧链化学性质不同,可以分为以下三组:极性氨基酸(容易与水分子形成氢键)Ser、Thr、Cys、Asn、Gln、His、Tyr、Trp

带电氨基酸Arg、Lys(+)和Asp、Glu(-)疏水性的氨基酸Ala、Val、Leu、Ile、Phe、Pro和Met第7页/共69页2023/4/148生物信息学第六章、核酸和蛋白质序列分析甘氨酸(Gly)的侧链只有一个氢原子,是最简单的氨基酸,具有独特的性质,可以单作为第四类,也可以归于第一类。含有芳香性侧链

Phe、Tyr、Trp、His侧链为醇或酚的氨基酸有

Ser、Thr、Tyr可以形成氢键

Arg、Lys、Asp、Glu、Ser、Thr、Asn、Gln、His、

Tyr及Trp

第8页/共69页2023/4/149生物信息学第六章、核酸和蛋白质序列分析3、蛋白质的结构层次(1)蛋白质的一级结构(primarystructure)蛋白质的一级结构是指多肽链中氨基酸的序列第9页/共69页2023/4/1410生物信息学第六章、核酸和蛋白质序列分析第10页/共69页2023/4/1411生物信息学第六章、核酸和蛋白质序列分析肽键的形成第11页/共69页2023/4/1412生物信息学第六章、核酸和蛋白质序列分析蛋白质一级结构还包括二硫键的位置第12页/共69页2023/4/1413生物信息学指蛋白质多肽链本身的折叠和盘绕的方式。

第六章、核酸和蛋白质序列分析二级结构主要有以下几种形式:(i)螺旋(ii)折叠

–平行折叠反平行折叠(iii)-转角–连接作用(iv)无规卷曲-没有确定规律性的肽链构象,但仍然是紧密有序的稳定结构(v)无序结构(2)蛋白质的二级结构(secondarystructure)第13页/共69页2023/4/1414生物信息学第六章、核酸和蛋白质序列分析蛋白质的螺旋结构第14页/共69页2023/4/1415生物信息学第六章、核酸和蛋白质序列分析第15页/共69页2023/4/1416生物信息学第六章、核酸和蛋白质序列分析蛋白质的折叠结构第16页/共69页2023/4/1417生物信息学第六章、核酸和蛋白质序列分析平行β-折叠反平行β-折叠第17页/共69页2023/4/1418生物信息学第六章、核酸和蛋白质序列分析(3)蛋白质的超二级结构

是介于蛋白质二级结构和三级结构之间的空间结构,指相邻的二级结构单元组合在一起,彼此相互作用,排列形成规则的、在空间结构上能够辨认的二级结构组合体,并充当三级结构的构件(blockbuilding)。其基本形式有aa型、bb型和bab型等。(supersecondarystructure)

第18页/共69页2023/4/1419生物信息学第六章、核酸和蛋白质序列分析蛋白质超二级结构第19页/共69页2023/4/1420生物信息学第六章、核酸和蛋白质序列分析(4)蛋白质的三级结构

(tertiarystructure)在二级结构基础上的肽链再折叠形成的构象。第20页/共69页2023/4/1421生物信息学第六章、核酸和蛋白质序列分析(5)蛋白质的四级结构(quarternarystructure)具有二条或二条以上独立三级结构的多肽链组成的蛋白质,其多肽链间通过次级键相互组合而形成的空间结构称为蛋白质的四级结构。其中,每个具有独立三级结构的多肽链单位称为亚基(subunit)。

第21页/共69页2023/4/1422生物信息学第六章、核酸和蛋白质序列分析(6)蛋白质各级结构及功能的关系一级结构是决定高级结构-一级结构是高级结构的基础氨基酸序列决定蛋白质中任一氨基酸相邻的氨基酸,也就决定了各氨基酸影响最大的环境条件蛋白质折叠类型与氨基酸组成有关蛋白质空间结构是其行驶生物功能所必需的系统归纳蛋白质序列与结构及功能的关系,是当前生物信息学的重要任务,也是蛋白质结构和功能预测的基础。第22页/共69页2023/4/1423生物信息学第六章、核酸和蛋白质序列分析(7)蛋白质三维结构分类

按模体(motif)分为家族、超家族和亚家族模体(motif)的概念

-属于蛋白质的超二级结构,

-由2个或2个以上具有二级结构的的肽段,

-在空间上相互接近,形成特殊的空间构象,

-发挥专一的生物功能,

-一种类型的模体总有其特征性的氨基酸序列。利用序列模体和结构模体数据库查询蛋白质家族关系,可以推断新序列的结构和功能PROSITE:功能性模体数据库http://www.expasy.ch/prosite/第23页/共69页2023/4/1424生物信息学第六章、核酸和蛋白质序列分析(7)蛋白质三维结构分类具有相似氨基酸序列的蛋白质,可能起源于共同的祖先,具有共同的或近似的功能按序列近似程度划分

-亚家族:几乎完全相同的序列,其中每一对匹配好的氨基酸序列含有90%或更多相同氨基酸

-家族:一组功能上非常相似的蛋白质,其中每一对蛋白质含有50%以上相同氨基酸

-超家族:一组进化上相关的蛋白质第24页/共69页2023/4/1425生物信息学第六章、核酸和蛋白质序列分析二、蛋白质的组成及基本性质预测1、分子量及等电点(1)网上计算(2)软件计算第25页/共69页2023/4/1426生物信息学第六章、核酸和蛋白质序列分析(1)、分子量及等电点网上计算

选择ComputepI/Mwtool,进入分析页面,将蛋白质序列以FASTA格式输入分析框内,进行计算/tools/ExPASy(ExpertProteinAnalysisSystem):

蛋白质分析专家系统

ComputepI/MW:是ExPASy工具包中的程序,计算输入序列等电点和分子量的工具。第26页/共69页2023/4/1427生物信息学第六章、核酸和蛋白质序列分析第27页/共69页2023/4/1428生物信息学第六章、核酸和蛋白质序列分析第28页/共69页2023/4/1429生物信息学第六章、核酸和蛋白质序列分析第29页/共69页2023/4/1430生物信息学第六章、核酸和蛋白质序列分析(2)、分子量及等电点软件计算可以进行分子量及等电点软件计算的一些软件OMIGADNAMANBIOEDITANTHEPROT5.0

第30页/共69页2023/4/1431生物信息学第六章、核酸和蛋白质序列分析2、蛋白质辩识根据蛋白氨基酸组成

AAcompIdent:利用未知蛋白的氨基酸组成确认具有相同组成的已知蛋白

/tools/aacomp/

二维凝胶电泳数据库

SWISS-2DPAGE/ch2d/

质谱分析

PEPMAPPERhttp://wolf.bms.umist.ac.uk/mapper/第31页/共69页2023/4/1432生物信息学第六章、核酸和蛋白质序列分析3、蛋白质酶切分析PeptideCutter:

-预测一个给定的蛋白质序列的蛋白质水解或裂解位点以及化学切割位点

/tools/peptidecutter/PeptideMass-针对肽段谱图分析实验分析蛋白质在各种蛋白酶或化学试剂作用下的内切产物。/tools/peptide-mass.html第32页/共69页2023/4/1433生物信息学第六章、核酸和蛋白质序列分析PeptideCutter第33页/共69页2023/4/1434生物信息学第六章、核酸和蛋白质序列分析第34页/共69页2023/4/1435生物信息学第六章、核酸和蛋白质序列分析4、蛋白质疏水性分析ProtScale/tools/protscale.html软件分析-BioEdit-DNAMAN第35页/共69页2023/4/1436生物信息学第六章、核酸和蛋白质序列分析蛋白质疏水性图谱第36页/共69页2023/4/1437生物信息学第六章、核酸和蛋白质序列分析三、蛋白质的结构预测第37页/共69页2023/4/1438生物信息学第六章、核酸和蛋白质序列分析蛋白质结构预测问题 序列——结构——功能第38页/共69页2023/4/1439生物信息学第六章、核酸和蛋白质序列分析….-Gly-Ala-Glu-Phe-….FUNCTION!解决方法第39页/共69页2023/4/1440生物信息学第六章、核酸和蛋白质序列分析寻找一种从蛋白质的氨基酸线性序列到蛋白质所有原子三维坐标的一种映射第40页/共69页2023/4/1441生物信息学第六章、核酸和蛋白质序列分析蛋白质结构预测主要有两大类方法:(1)理论分析方法通过理论计算(如分子力学、分子动力学计算)进行结构预测。(2)统计的方法

-对已知结构的蛋白质进行统计分析,建立序列到结构的映射模型,进而对未知结构的蛋白质根据映射模型直接从氨基酸序列预测结构。

-包括:经验性方法结构规律提取方法同源模型化方法第41页/共69页2023/4/1442生物信息学第六章、核酸和蛋白质序列分析1.蛋白质二级结构预测

蛋白质序列↓二级结构第42页/共69页2023/4/1443生物信息学第六章、核酸和蛋白质序列分析蛋白质的二级结构预测的基本依据是:

每一段相邻的氨基酸残基具有形成一定二级结构的倾向。二级结构预测问题是模式分类问题二级结构预测的目标:判断每一段中心的残基是否处于螺旋、折叠、转角(或其它状态)之一的二级结构态,即三态。

第43页/共69页2023/4/1444生物信息学第六章、核酸和蛋白质序列分析基本策略(1)相似序列→相似结构QLMGERIRARRKKLKQLMGAERIRARRKKLK(a)(b)第44页/共69页2023/4/1445生物信息学第六章、核酸和蛋白质序列分析基本策略(2)分类分析第45页/共69页2023/4/1446生物信息学第六章、核酸和蛋白质序列分析二级结构预测的方法大体分为三代:

-第一代是基于单个氨基酸残基统计分析

从有限的数据集中提取各种残基形成特定二级结构的倾向,以此作为二级结构预测的依据。

-第二代预测方法是基于氨基酸片段的统计分析

a)统计的对象是氨基酸片段;

b)片段的长度通常为11-21;

c)片段体现了中心残基所处的环境

d)在预测中心残基的二级结构时,以残基在特定环境形成特定二级结构的倾向作为预测依据-第三代方法(考虑多条序列)

a)运用长程信息和蛋白质序列的进化信息

b)准确度有了比较大的提高第46页/共69页2023/4/1447生物信息学

蛋白质二级结构的组成规律性比较强三种基本二级结构平均占氨基酸残基的85%

各种二级结构非均匀地分布在蛋白质中第六章、核酸和蛋白质序列分析2、蛋白质二级结构预测方法(1)经验参数法(Chou-Fasman法)第47页/共69页2023/4/1448生物信息学第六章、核酸和蛋白质序列分析

有些蛋白质中含有大量的螺旋如血红蛋白和肌红蛋白一些蛋白质中则不含或者仅含很少的螺旋如铁氧蛋白-有些蛋白质的二级结构以折叠为主如免疫球蛋白例:肽链Ala(A)-Glu(E)-Leu(L)-Met(M)倾向于形成螺旋肽链Pro(P)-Gly(G)-Tyr(Y)-Ser(S)则不会形成螺旋

第48页/共69页2023/4/1449生物信息学第六章、核酸和蛋白质序列分析

每种氨基酸出现在各种二级结构中倾向或者频率是不同的

例如:Glu主要出现在螺旋中

Asp和Gly主要分布在转角中

Pro也常出现在转角中,但是绝不会出现在螺旋中可以根据每种氨基酸残基形成二级结构的倾向性或者统计规律进行二级结构预测第49页/共69页2023/4/1450生物信息学第六章、核酸和蛋白质序列分析

经验参数法由Chou和Fasman在70年代提出来是一种基于单个氨基酸残基统计的经验预测方法。通过统计分析,获得的每个残基出现于特定二级结构构象的倾向性因子,进而利用这些倾向性因子预测蛋白质的二级结构。

第50页/共69页2023/4/1451生物信息学第六章、核酸和蛋白质序列分析一个氨基酸残基的构象倾向性因子定义为

Pi=Ai/Ti (i=,β,c,t) 式中下标i表示构象态 如螺旋、β折叠、转角、无规卷曲等;Ti是所有被统计残基处于构象态i的比例;Ai是第A种残基处于构象态i的比例;Pi大于1.0表示该残基倾向于形成二级结构构象i,小于1.0则表示倾向于形成其它构象。

第51页/共69页2023/4/1452生物信息学第六章、核酸和蛋白质序列分析第52页/共69页2023/4/1453生物信息学第六章、核酸和蛋白质序列分析发现关于二级结构的经验规则

基本思想是在序列中寻找规则二级结构的成核位点和终止位点。

扫描输入的氨基酸序列,利用一组规则发现可能成为特定二级结构成核区域的短序列,然后对于成核区域进行扩展,不断扩大成核区域,直到倾向性因子小于1.0为止。

规则:(a)α螺旋规则

(b)β折叠规则

(c)转角规则

(d)重叠规则

第53页/共69页2023/4/1454生物信息学第六章、核酸和蛋白质序列分析(a)α螺旋规则沿蛋白质序列寻找α螺旋核

-相邻的6个残基中如果有至少4个残基倾向于形成α螺旋,则认为是螺旋核。从螺旋核向两端延伸

-直至四肽片段的α螺旋倾向性因子的平均值{P}<1.0为止。将螺旋两端各去掉3个残基

-剩余部分若长于6个残基,而且{P}>1.03,则预测为螺旋。

第54页/共69页2023/4/1455生物信息学第六章、核酸和蛋白质序列分析(b)β折叠规则

相邻5个残基中若有3个倾向于形成β折叠,则认为是折叠核。折叠核向两端延伸直至4个残基的平均折叠倾向性因子{P}<1.0。若延伸后的片段的{P}>1.05,则预测为β折叠。第55页/共69页2023/4/1456生物信息学第六章、核酸和蛋白质序列分析(c)转角规则

转角的模型为四肽若位置专一性转角形成几率四肽片段Pt的平均值大于1.0,并且Pt的均值同时大于P

的均值以及P

的均值,则可以预测这样连续的4个残基形成转角。

第56页/共69页2023/4/1457生物信息学第六章、核酸和蛋白质序列分析(iv)重叠规则

对于螺旋和折叠的重叠区域,按{Pa}和{P}的相对大小进行预测若{Pa}大于{P},则预测为螺旋;反之,预测为折叠。第57页/共69页2023/4/1458生物信息学第六章、核酸和蛋白质序列分析(2)GOR(Garnier-Osguthorpe-Robson)方法是一种基于信息论和贝叶斯统计学的方法

GOR将蛋白质序列当作一连串的信息值来处理

GOR方法不仅考虑被预测位置本身氨基酸残基种类的影响,而且考虑相邻残基种类对该位置构象的影响.GOR方法可预测蛋白质二级结构为螺旋、折叠或转角的准确率约为65%第58页/共69页2023/4/1459生物信息学第六章、核酸和蛋白质序列分析第59页/共69页2023/4/1460生物信息学第六章、核酸和蛋白质序列分析(3)同源分析法

将待预测的片段与数据库中已知二级结构的片段进行相似性比较,利用打分矩阵计算出相似性得分,根据相似性得分以及数据库中的构象态,构建出待预测片段的二级结构。该方法对数据库中同源序列的存在非常敏感,若数据库中有相似性大于30%的序列,则预测准确率可大大上升。第60页/共69页2023/4/1461生物信息学第六章、核酸和蛋白质序列分析假设已知二级结构的氨基酸片段T=STNGIYWT的二级结构为CHHHHHT

H代表螺旋,

T代表转角,

C代表无规卷曲待预测二级结构的氨基酸片段

U=ATSGVFL序列比对:

T=STNGIYW U=ATSGVFL直接将T的构象态赋予U第61页/共69页20

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论