机检基础.ppt_第1页
机检基础.ppt_第2页
机检基础.ppt_第3页
机检基础.ppt_第4页
机检基础.ppt_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章,计算机检索基础,计算机检索是指人们在计算机或计算机检索网络的终端机上,使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出需要的信息,继而再由终端设备显示或打印的过程。,计算机检索的发展 脱机批处理检索时期Off-lineBatchProcessing (1950-1960年代) 联机实时检索时期On-line Real Time (1960年代中期到70年代初) 光盘检索时期 (1980年代中期开始) Internet网络化检索时期 (1990年代至今),1 文献数据库,文献数据库是将各个学科领域、各种专业技术方面的文献信息汇集在一起,经过分门别类的组织、加工、编排

2、后形成的数据库。它能够提供人们方便而快速地,更具针对性地查找各种文献资料的线索或者全文。,字段:如在数据库中题名、作者、作者单位、期刊名、摘要、全文等等均是字段;一条记录由多个字段值组成;对计算机检索来说字段相当于检索入口。如:,文献数据库的类型,按收录文献的类型划分,按提供信息的详略划分,图书文献数据库,期刊文献数据库,专利文献数据库,会议文献数据库,文摘数据库,全文数据库,2文献数据库检索步骤,确定检索要求 和目标,选择检索系统及 数据库,检索式的制定,检索方案的调整,检索结果输出,选择检索点与 检索词,确定检索要求和目标,分析课题的主要内容及其所涉及的学科范围。 所需文献的类型、语种、年

3、代及文献量的范围。 对查新、查准、查全的指标要求,及其侧重。,选择检索系统和数据库,Content, 指数据库的内容,涉及它的学科范围、科技含量、数据库类型、数据来源等。 Coverage, 指数据库的规模,涉及它的时间和地理范围、机构来源、文献量等。 Currency,指数据库的更新的及时性,更新的频率、周期。 Cost,指数据库的费用,各种数据库、各种检索输出方式和格式的收费是不一样的。,选择数据库的4C标准,选择数据库的方法: 1、注重平时的积累 2、不要盲目检索,应养成检索前了解一下数据库的习惯 3、注重与他人的交流 4、重视图书馆主页的资源,选择检索点和检索词,选择检索点,作者(文章

4、的责任者,如:钱钟书) 篇名(或题名,如:红楼梦) 机构(如:国家统计局) 关键词(如:污水处理、高层建筑) 主题词(规范化的主题概念,如用激光不用雷射) 文摘(论文或图书的摘要或内容提要) 引文(即参考文献) 基金(如:国家自然科学基金项目) 刊名(期刊的名称,如:环球银幕) 全文(或者全记录),选择检索词,利用主题词表选取规范化的主题词或词组。 选用自由词。由于词表规模的限制,不可能对某一专业作全面检索时,应考虑选用自由词,尽可能多地选用与课题有关的同义词,以防漏检。 注意同义词、近义词、词形变化。 分析隐性概念 提炼关键、核心的词为检索词,例如,查“多元共渗”方面的英文资料。 由于汉英词

5、典上没有对应的词,因此必须进行概念分析,进而选择主题词。 多元共渗是指多种元素在一定温度、压力、浓度条件下自金属表面扩散的能力有所提高,利用的是扩散涂层原理,因此,通过DiffusionCoating就可以找到有关文献。,例二注意同义词、近义词 patroncustomer clientshopperconsumeruserreader 自行车单车脚踏车 airplaneaircraftplane,例三:提炼关键的、核心的词为检索词,去掉意义过于宽泛的词。 课题:网络数据库的安全性研究 关键词1:网络数据库(研究对象) 关键词2:安全(研究目的) 而意义太泛的词“研究”不应作为检索词,课题:基

6、于代理技术的网络入侵检测 关键词1:(网络)入侵检测,但入侵检测一般即指网络中的入侵检测,意义重复,网络可不要。 关键词2:代理(技术),在入侵检测中使用“代理”,“代理”本身就是指的一项技术,因而也可不要。,检索式的制定,逻辑算符 位置算符 截词符,常用检索算符,布尔逻辑检索,即采用逻辑和(OR)、逻辑乘(AND)、逻辑非(NOT)等算符,将检索提问转换成逻辑表达式。,逻辑检索概念示意图,A,B,A,B,A,B,A and B,A or B,B not A,与、AND、* A AND B :A、B两个检索词必须同时存在。 用于概念交叉和限定。起缩小检索范围和提高文献查准率的作用。 例 Sol

7、ar*Energy 组织文化and 管理决策,或、OR、 A OR B :A或B两个检索词单独一个词存在即可,或同时存在。 用于概念之间并列关系的组配。增加主题的同义词,以扩大检索范围,避免文献漏检。 例 www + internet + network userface or interface,非、NOT、 A NOT B :A必须存在,同时不允许B的存在。 从原检索范围中剔除一部分不需要的内容,提高检准率。 例: EnergyNuclear 除核能以外的有关能源方面的文献才被命中。,组织文化,管理决策,逻辑“乘”能够缩小检索范围,提高检准率,利用逻辑“和”算符,可以扩大检索命中文献数,(

8、W)或( )算符:“With”的缩写 词序不许颠倒 两词之间不许插词,只许空格或连字符号 例: CD(W)ROM 将命中 CD ROM 或 CD-ROM solar ( ) energy 检出 solar energy,位置算符,位置算符,(nW)算符:“n words”的缩写 (nW)是从(W)算符引伸出来,检索词之间允许插入0n个词,词序不许颠倒 例 anticorrosion (1W) paint 可检出 anticorrosion paint 和 anticorrosion of paint 例 检索“材料磨损”(wear of materials)方面的文献, 检索式: wear (

9、1W) materials,截词检索,就是把检索词截断(加上截断符号),让计算机按照字的片断同索引词对比。包括: 前方一致(右截断):把截词符号放在字根的右边。 后方一致(左截断):把截词符号放在字根的左边。 中间一致(左右同时截断):把检索词左右同时截断。,截词检索,例如:查Computer 这个词时,若用截词符号,则可以写成Computer*,则索引词Computer , Computers, Computerise, Computerize都将被命中。这样可以省去多次键入词尾有变化的词的麻烦。 键入*mycin可以检出一大批有关抗菌素的文献。,Computer*,截词检索,在实施实施截断

10、是要认真考虑的,如果把Computer截成 com*,将会把数据库中全部以com开头的词全部检出来。,Com*,通用字符检索,在英语中,有的字有不同的写法,例如,“颜色”这个词有两种拼写形式color, colour .这样的问题不是截词符所能胜任的,为了使不同拼写方法的检索词都能够被检索出来,就出现了通用字符的检索方法。,通用字符检索,它是将拼写有变化的字母处代之以通用字符符号,这样,计算机在进行检索时,除通用符号外,其它字符相同的,都可以被命中。 如“硫”这个词,有两种写法sulphur sulfur, 在编写检索式时,写成如下形式 sul*ur,Sul*ur,Col*r,检索方案调整,检

11、索方案调整 如果检出的文献量过多,则增加限定 如果检出的文献量过少,则放宽限定 检索词可以借助于词表的提示来选定和调整,扩大检索范围,提高查全率的方法: 1、考虑同义词或近义词(使用布尔逻辑符or连接) 2、选择较大检索范围的字段如摘要 3、使用截词符 4、使用上位词(如飞行器航天飞机 载人航天飞机),缩小检索范围,提高查准率的方法: 1、使用and、not等限制检索范围 2、使用位置算符 3、选择检索范围较小的字段,如题名。 4、使用二次检索 5、使用下位词 6、使用精确检索,如对于固定短语来说可用“”引起来。,检索实例,课题: 检索“有关用干扰素治疗人体肿瘤”的英文文献。,检索过程,一、检

12、索要求与检索目的分析 1、检索课题所属的学科范围(医学) 2、明确所需文献的语种(英文)、文献类型等。 3、根据自己的要求确定检全率与检准率等指标。,检索过程,二、选择检索系统和数据库 三、选择检索点和检索词 以主题词进行检索为例: 检索词: tumor, tumour, cancer,neoplasm interferon, man , human,检索过程,检索词之间的逻辑关系: (tumor or tumour or cancer or neoplasm) and (man or human) and interferon,检索过程,(tumr or cancer or neoplasm

13、) and (man or human) and interferon 四、实施检索,输出结果。,检索实例2,课题: 检索“有关微生物处理废水”方面的1998年以后的英文文献。,检索过程,一、分析检索课题 1、需求文献所属学科为生物学、环境科学。 2、文献的时间范围是1998 3、文献类型未做要求,语种为英文。,检索过程,二、选择检索途径与检索词 主题词: 微生物Microorganism(s), Microbe,micro organism 废水-Waste water,wastewater sewage, sewerage 处理-Treatment,检索过程,三、构造检索式,实施检索 (Microorganism(s) or micro organisms or Microbe) and (Waste water or wastewater or sewage or sewerage) and Treatment 四、检索结果输出,可以使用右截断,检索实例3,检索有关“红枣栽培技术”方面的文章。 关键词:红枣大枣栽培技术 检索策略: 红枣or大枣and 栽培技术 红枣and 栽培技术 大枣and 栽培技术,检索实例4,检索课题:“最新的关于药物上瘾治疗方法的研究”。 检索词: Drug addiction(addict,addic

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论