基于个体化生物医学研究的两种新ArrayTrack库.ppt_第1页
基于个体化生物医学研究的两种新ArrayTrack库.ppt_第2页
基于个体化生物医学研究的两种新ArrayTrack库.ppt_第3页
基于个体化生物医学研究的两种新ArrayTrack库.ppt_第4页
基于个体化生物医学研究的两种新ArrayTrack库.ppt_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于个性化生物医学研究的两种新ArrayTrack库,喻富,历史背景,随着近代高流量基因分型技术的发展,个体化医学和营养学方面的研究取得了阶段性的突破。然而,大多数有关对遗传标记识别的研究并能不能很好的满足对表性特征的研究。 测试与疾病关联研究所识别的候选基因是否相关对个体化医学和营养学的研究起着关键性的作用。 一个有效的数据挖掘策略和一系列复杂的工有助于我们更好地了解和利用基因与疾病关联的研究。,内容简介,本文以ArrayTrack软件为平台,设计了SNP库和QTL库数据查询界面。,采用相关的数据挖掘技术,对遗传变异引起的相关疾病进行研究,如哮喘,肥胖症,糖尿病,心脏病,高血压等等。 SNP和QTL库主要收集在特定的分散的数据,使得研究人员很容易访问和比较多个知识库内的数据。这些数据从不同公共信息库内下载出来然后重新组编在ArrayTrack软件内。在SNP和QTL库能直接链接到他们的资源,也可以链接ArrayTrack内原有的数据集合。,SNP数据库,SNP(单核苷酸多态性),全称Single Nucleotide Polymorphisms,是指在基因组上单个核苷酸的变异,形成的遗传标记,其数量很多,多态性丰富。SNP可以说是第三代遗传标志,人体许多表型差异、对药物或疾病的易感性等等都可能与SNP有关。 SNP库内包含有大约1500万个人类SNPs及其注释。 表1 列出了SNP数据库内的一些字段名称以及相关的解释说明。 图1为SNP数据库界面。,SNP数据库,表 1,SNP数据库,图 1,QTL数据库,QTL是quantitative trait locus的缩写,数量性状位点。它指的是控制数量性状的基因在基因组中的位置。对QTL的定位必须使用遗传标记,人们通过寻找遗传标记和感兴趣的数量性状之间的联系,将一个或多个QTL定位到位于同一染色体的遗传标记旁,换句话说,标记和QTL是连锁的。 该QTL库收集了大鼠,小鼠和人类的QTLs。 表2和图2分别列出了QTL数据库内的一些字段名称以及相关的解释说明和QTL数据库界面。,QTL数据库,表 2,QTL数据库,图 2,基因-营养交互,也就是说在某营养环境下找出与某些疾病相关的基因。通过手工去定位这些基因的位置是相当复杂和耗时的。QTL库通过搜索和收集数据和提供基于查询界面,我们能过快速而有效地定位这些基因的QTLs。 基因-营养交互策略大致分为两步来完成: 1.选择一种营养成分,如硫胺素,叶酸,核黄素,葡萄糖,果糖,维生素A,维生素D和维生素E等。 通过GeneGo或其他类似的路径搜索工具来搜索 参与该营养成分新陈代谢的基因列表。,数据挖掘策略1基因-营养交互,2.使用QTL库,将每一基因会映射在促进某种表性特征的QTLs上。这新表性特征主要是遗传变异性引起的一些疾病(如肥胖,2型糖尿病,心血管疾病等)。这样,每个参与营养代谢促使某些疾病症状的基因的具体QTLs信息将会被找到。如:基因名,QTL名,染色体起止位置等。,数据挖掘策略1基因-营养交互,为了识别潜在地存在于这些疾病进程中果糖代谢路径的基因,一种路径分析程序GeneGo被使用。总共有34种基因是用于果糖代谢的(鼠版)。这些。通过QTL库搜索,指定扩展搜索范围5Mbp(百万碱基对),我们发现这些参与果糖代谢的34种基因与总共108种QTLs有关。这些结果再经过过滤仅仅只保留那些与肥胖,2型糖尿病和心血管疾病相关的QTLs。过滤后参与果糖代谢路径的11种基因被确定与在表3所描述的19种鼠类QTLs有关。,数据挖掘策略1基因-营养交互,数据挖掘策略1基因-营养交互,表 3,数据挖掘策略2GWAS结果与QTLs相连,全基因组关联研究(Genome-Wide Association Studies,GWAS)是指在全基因组层面上,开展多中心、大样本、反复验证的基因与疾病的关联研究,全面揭示疾病发生、发展与治疗相关的遗传基因。 灵长类和啮齿类动物具有同线性,他们在某些染色体区域内有基因的相同定位。为了提高识别候选基因的可靠性,我们采用将GWAS与QTLs相结合的方法挖掘与某疾病相关的遗传基因。,该策略分3步进行: 1.为所选的某一病状如肥胖,2型糖尿病或高血压,从已经公布了的GWAS结果获取特征相关的SNPs列表。 2.使用SNP库,找到每一个SNP对应所在染色体位置上的基因。这步的结果是一个基因的列表。 3.对列表中的每一个基因,查询QTL库中是否能找到任何附近的可能促进该病状的QTLs。,数据挖掘策略2GWAS结果与QTLs相连,从GWAS目录中获取一个SNPs的列表,这个目录连接了与高血压相关的显示形状。最终,我们搜索QTL库通过映射定位找到那些与列表中的任何基因密切相关的人类基因。指定一个2Mbp(百万碱基对)的扩展搜索范围,并且在得到的结果中筛选出那些与高血压相关的特征或显型的保持相关性的QTLs。 表4 给出了与高血压相关的GWAS结果和人类QTLs的数据列表,数据挖掘策略2GWAS结果与QTLs相连,数据挖掘策略2GWAS结果与QTLs相连,表 4,总结,随着全基因

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论