中药指纹图谱相似度分析之TXT文本导入.doc_第1页
中药指纹图谱相似度分析之TXT文本导入.doc_第2页
中药指纹图谱相似度分析之TXT文本导入.doc_第3页
中药指纹图谱相似度分析之TXT文本导入.doc_第4页
中药指纹图谱相似度分析之TXT文本导入.doc_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中药指纹图谱相似度分析之TXT文本导入话说很多同行都无法将高效液相,气相,气质联用跑出来的色谱图导入到指纹图谱相似度分析软件进行分析。目前对谱图相似度分析的软件也只有接下来几个版本:、B版、药检所版的中药色谱图分析和数据管理系统、浙大版的中药指纹图谱相似度计算软件及中南版的相似度分析软件,在写这边帖子之前,前三个版本我都反复安装试过很多次,第四个一方面需要matlab的只是、另一方我也没有在网上找到资源。最后我选择了使用药典版的中药色谱指纹图谱相似度评价系统A版,以下简称(A系统)。药典版的中药色谱指纹图谱相似度评价系统有A,B版两个版本,即:研究版(2004 A)和检验版(2004 B)。研究版主要用于科学研究工作,具有生成对照图谱功能。检验版侧重于色谱指纹图谱的检验工作,功能简化,不具有生成对照图谱的功能。软件就不详细介绍了,直接进入主题如何将得到的TXT文件转换成能够导入A系统的TXT文件。本系统支持三种格式文件的导入:AIA(*.cdf)文件,文本文件(*.txt)和Scp(*.Scp)格式文件的导入(如图1)。建议采用通用的AIA(*.cdf)格式文件导入(但是我试过导出的AIA依然无法导入,并且AIA文件没办法编辑,也许是能力不够,至今没有找能编辑AIA文件的方法)。注意AIA(*.cdf)文件中应包含样本图谱的峰面积信息,在色谱工作站导出AIA(*.cdf)文件前应现进行积分。否则导出的AIA(*.cdf)文件可能因不包含峰面积信息而无法导入(我用TXT文件试了,没有积分依然可以导入,只是无法匹配,也就是无法进入下一步相似度分析)。文本文件(*.txt)的导入需要采用特殊的格式,可以参考本系统导出的文本文件格式【文后附上标准文本文件格式】。Scp(*.Scp,即Standard Chromatographic Project的简写)是本系统为生成的对照图谱的导入提供的一种特殊的文件格式。我用的是岛津GC-MS跑出来的质谱图试验的,文后附三个版本的分析软件及需要的文档,其他液相气相的没有使用过,也不知道如何导出TXT或者AIA文件,如有知道的,还希望您不吝赐教)图1第一步,导出text文件,做好准备工作打开GCMSSolution软件,导出你需要处理的图谱(如图2),当然如果要导出AIA文件,也可以如图3那样导出。但是只能导出AIA文件,无法导出TXT文件。图221图3 那么如何导出TXT文件呢,莫着急,且看下文如图4,右键点击*.qgd,在出现的菜单里点击文件转换,是不是发现原来可以转出很多种格式?ASCII文件转换出来的即为TXT文件,其他四种无需多介绍,包括的信息应该都是一样的。123图3点击“ASCII文件转换”,如下图4,点击输出项目,里面有很多选项,当然相似度软件分析的只用两个就可以了,即“定性峰表”和“色谱图(TIC/MIC)”,可以同时选择两项,这样导出到一个TXT文件里;当然也可以分别选择,导出到两个TXT文件里(如图5)。(个人建议导出到两个TXT文件里)21图4这样导出的TXT包括了两部分:定性峰表信息(峰序号,保留时间,开始时间,结束时间,Mass,峰面积,峰高,峰面积/峰高等信息)【后文称(积分数据)】和色谱图信息(时间每0.008s记录一次,信号,相对信号三列)【后文称(色谱图数据)】。导出的两个TXT文件,这两部分就分别在一个TXT里,导出的一个TXT文件,那么前面是定性峰表信息,后面是色谱图信息。这样我们需要的TXT文件就导出来了,这样的TXT是无法导入A系统的,它会提示提供的信息格式错误。俗话说:万事开头难,那么你也成功了一半了。接下来,就是编辑信息了,使之让A系统采纳。3图512第二步,编辑text信息,使之为A系统采纳在进行编辑TXT信息之前,还需要这么一个小小的插曲做一个Excel来提取你所需要的信息。新建一个Excel文件,分别给三个工作表名称改为:色谱图数据,积分数据,我要的数据(如图6)。图6将导出的TXT文件分别打开(我是导出的两个文件,这样选择时可以用Ctrl+A快速选择),将色谱图数据全部复制到Excel中的色谱图数据表,积分数据导入到Excel中的积分数据表。那么,到现在,我们需要的数据也都导入到Excel中去了。接下来就是懒人想出来的办法了。进入第三个工资表,也就是“我要的数据”中,编辑公式,提取有用信息。一般同一批色谱图导入到Excel中的积分数据和色谱图数据前面几列都不会改变的,如图7中的方框部分(为色谱图数据表,为积分数据表)12图7有用的数据就是色谱图数据中的时间列(即本例中的第一列)和信号列(即本例中的第二列)及积分数据中的峰序号(即本例中的第一列)、保留时间(即本例中的第二列)、峰高(即本例中的第七列)和峰面积(即本例中的第六列)【一共六列】。那么在“我的数据表”中就提取这些信息即可。如图8图8PS:文后附上例子中的Excel表,熟悉的可以自己编辑,不熟悉的也没关系,看了就能懂。好了,小插曲结束,继续正题。首先,新建一个TXT文件,用以存储你提取的有用信息。命名好后(TEST1.txt),分别按照标准文本文件格式的信息输入,及先把指纹图谱采样号数据(即色谱图数据)复制粘贴到TEST1.txt文件中,然后再后面复制粘贴上指纹图谱积分数据(即积分数据)。这样就把TXT文本的信息编辑好了,那么接下来应该做什么呢?导入A系统试试,对就是这样的。我们导入进去试试,结果奇怪的事情发生了,怎么会多一条直线呢,如图9。图9接下来的就是第三部需要解决的问题,最关键也是最简单的一步第三步,删除作怪空格,给图以原貌将text1.txt打开,发现有图10的四行中文字,它没有错,错就错在图11,也就是它在作怪。图10是不是发现指纹图谱积分数据那两行都多了很多空格,删除。再导入到A系统试试,得到图12的结果图11是不是发现自己很厉害,祝贺你,成功了。就是这样编辑

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论