印本图书与电子图书的集成检索.doc_第1页
印本图书与电子图书的集成检索.doc_第2页
印本图书与电子图书的集成检索.doc_第3页
印本图书与电子图书的集成检索.doc_第4页
印本图书与电子图书的集成检索.doc_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

印本图书与电子图书的集成检索*本文得到广州市哲学社会科学发展十一五规划2007年度课题(07B36)资助陈定权 刘胜(中山大学资讯管理系,广州,510275)摘要 传统的印本图书和现代的电子图书并存于现代图书馆之中,通过各自的独立的服务系统为读者提供信息服务,未能形成一个完整的馆藏资源体系。本文在分析图书馆图书集成检索的现状和采取的技术路线基础至上,提出了图书集成检索与服务传递系统的功能结构,指出了图书集成检索将会发展成为馆藏资源整合的不可或缺的一部分。关键词 电子图书 印本图书 OPAC 集成检索Integrated Retrieval of Printed Books and E-Books at LibraryCHEN Ding-quan, LIU Sheng(School of Information Management, Sun Yat-sen University, Guangzhou, 510275)Abstract: Traditional printed books and modern e-books coexist at modern library that cannot form one integrative collection and provide information service for readers using respective information system. This paper analyses the actuality of integrated retrieval system of book at some library and the their technical routines, puts forwards the function framework of the retrieval system. Lastly, the paper predicts the trend of book integrative retrieval system that will be part of library collection integration in the near future.Key Words: Printed Books, E-Books, OPAC, Integrated Retrieval1. 引言图书馆馆藏资源包括传统的印本资源和现代的电子资源。图书馆为读者科学揭示和合理组织这些资源并以恰当方式为读者提供高效服务,然而图书馆并没有将印本资源与电子资源之间、电子资源与电子资源进行很好地集成,使得读者所感受到的仍然是一个个相互独立的信息服务系统,而不是一个完整的馆藏资源体系。图书和期刊是图书馆拥有量最大的两类资源。因为期刊和图书本身固有的特性,电子图书与印本图书的集成检索(简称图书集成检索)比电子期刊与印本期刊的检索集成(简称期刊集成检索)要简单得多,图书馆也大多是先解决图书的集成检索,所以本文专门探讨了图书的集成检索。最常见的图书形态是电子图书和印本图书,其中印本图书也常称为馆藏图书。读者查找图书一般有两种途径:一种是通过OPAC系统来搜索印本图书的著录信息,另一种是通过某电子图书服务系统来检索或获取电子图书。在很多情况下读者需要同时使用两类系统,例如:读者利用OPAC系统查找到一本满意的图书,但OPAC提供的著录信息极为简单,就想利用电子图书服务系统来查阅全文;读者看到一本满意的电子图书,就利用OPAC查找图书馆是否有相应的电子图书以便借阅等等。在这些情况下,读者就希望在电子图书和印本图书之间能够建立某种关联,方便读者在电子图书和印本图书之间自由浏览,这就需要图书馆能够为读者提供图书集成检索和一体化服务。本文所讨论的图书集成检索与一体化服务不是传统学者所讨论的“藏、借、阅、咨”一体化服务1-2,而是一种能够消除印本资源与电子资源之间的技术隔阂、为读者提供图书集成检索与服务传递的一体化服务。2. IFLA的书目功能需求与图书集成检索国际图联IFLA在1998发布了著名的书目记录的功能需求(Functional Requirements for Bibliographic Records,FRBR)报告3,旨在为书目记录提供一个抽象的概念模型和规则基础。该报告提出了四个概念:作品(work)、内容表达(expression)、载体表现(manifestation)和单件(item)。 作品。从本质上讲,作品只存在于创作者的大脑中并且只有以某种表达形式表达出来才能为别人所欣赏; 表达形式。作品只有通过表达才能够被看到、听到或感觉到,一件作品可以有多种表达形式。例如贝多芬的命运交响曲可以以钢琴谱的方式来表现从而被看到,或者是通过演奏的方式让别人听到; 载体表现。以某种作品可见的表现形式存在的载体的名称。例如一篇报告可能以HTML页面发布,也可能以WORD文件、PDF文件形式发布,还可能以用上述发布形式的打印件发布。 单件。一种载体表现的单一样本,具体的物理实体,如一本具体的可触摸的印本图书或一个可以打开的PDF文件。FRBR书目信息组织十分科学, OCLC完全遵照FRBR模型开发出的FictionFinder4就系统为读者提供书目记录的搜索和浏览服务,取得了很大的反响。但鉴于目前大量图书馆还是采用传统的MARC标准来描述书目信息,完全遵照FRBR模型来组织馆藏资源还十分困难。为此,很多系统就对其进行简化或者只借鉴其思想,并取得了很好的效果。如美国研究图书馆集团(RLG)在其网络版联合目录RedLightGreen将FRBR简化为二级“作品载体表现”5。本文所讨论的图书集成检索可以说借鉴了FRBR的思想,但图书集成搜索则是在某作品的一种表达形式(阅读)的集成,将一种表达形式的不同载体表现的图书集成为一条命中记录,比FRBR集成的思想宽松得多。与图书集成检索比较相似的系统有元搜索(Metasearching)或联邦搜索系统(Federated Searching),如Ex Libris公司的MetaLib和Innovative Interface公司的Research Pro、清华同方异构统一检索平台USP等。但联邦搜索的搜索对象一般是异构的、分布式的全文数据库,尤其是论文数据库,很少考虑到来自读者对印本图书和电子图书的功能需求,所以图书馆为了解决读者的实际需求,一般是没有采用联合搜索系统的。3. 图书集成检索的几个案例传统的MARC标准是为实体资料而设计的,后来为了支持电子资源的编目,特别增加电子文件地址与检索字段(856字段)。基于此,图书馆将电子图书的书目信息经转换后导入到MARC书目数据库中,就在OAPC系统中实现图书集成检索。这种技术也就是一般学者所指的基于OPAC的资源整合技术6,7。笔者挑选并逐一分析了几个分别代表着不同的图书集成检索技术路线的案例。3.1 中山大学图书馆中山大学图书馆利用原来的目录检索系统(采用深圳的ILAS II系统)实现了图书集成检索8。图1是某检索结果的部分界面。如图1所示,它将一件作品(黄如花主编的数字图书馆原理与技术)的电子版本和印刷版本视为不同的检索结果,没有在两者之间建立任何关联。当点击印本图书的“详细信息”,读者可以看到其基本著录信息以及馆藏地点和可用状态等。当点击电子图书的“详细信息”,读者可看到其著录信息,并提供了超链接“点击此处查看电子书”,引导读者到Apabi电子图书服务系统。图1. 中山大学图书馆OPAC检索结果界面3.2中科院国家科学图书馆中国科学院国家科学图书馆在其“图书联合目录”系统中实现了图书集成检索9。图2是其检索结果的部分界面。如图2所示,该系统也没有在电子图书和印本图书之间建立某种关联,但与中山大学图书馆相比,有更多特色:第一,完全不同于原有OPAC界面的全新服务界面;第二,超链接“在线借阅”直接引导读者到电子图书的服务界面;第三,集成了原来OPAC系统不能集成的服务,如参考咨询等。图2. 国家科学图书馆“图书联合目录”检索界面3.3重庆大学图书馆重庆大学全新开发了资源导航与检索中心(Web OPAC系统)10。该系统提供了馆藏图书的查询、电子图书导航与查询的功能,要求数据库商按照图书馆元数据要求提供数据,将其并入该馆自行开发的AdLib2.0的统一检索平台中,让各种数据库商的平台逐渐回到后台。在电子图书平台,读者可以浏览和查询电子图书,并且能将不同格式的电子图书都集成在一起,且能够有效链接到对应的印本图书(如果有的话)。在馆藏书目检索系统,馆藏图书也可以有效链接到对应的电子图书(如果有的话)。尽管印本图书和电子图书都有自己的检索平台,但两者实际上是一体的,实现了印本图书与电子图书之间的双向关联。图3. 重庆大学图书馆的电子图书平台图4. 重庆大学图书馆的馆藏书目检索为方便读者,该系统还提供了“一键搜索”功能。通过它,读者可以实现对印本图书和电子图书的一站式检索,检索结果按照印本图书和电子图书分列。不足的是,当有某本电子图书来自两个不同的电子图书服务系统,电子图书的检索结果会显示成两条命中记录,而不是将这两本电子图书的检索结果整合成一条命中记录。3.4 读秀图书搜索“读秀图书搜索”(也称为读秀知识库)是由北京世纪读秀技术有限公司研发的一个面向全球的图书搜索引擎11,具备图书搜索及全文文献传递两大功能,方便读者方便快捷地获得想要阅读的图书及其内容。如图5所示,该系统有效集成了印本图书和电子图书。超链接“本馆馆藏纸书”引导读者到该馆的OPAC系统;超链接“本馆电子全文”引导读者阅读图书全文,如果该馆没有购买电子全文,读者则可免费阅读前17页的全文。另外,该系统还,允许读者发表评论、基于社会过滤的图书推荐、文献传递等功能,不足之处是目前还不能集成第三方的电子图书。图5. 读秀图书搜索3.5 Primo:以波士顿学院图书馆为例Ex Libris公司2007年推出的Primo可协助图书馆展示丰富的馆藏(图书、期刊文章和其它的数字对象),方便读者方便快捷地发现和获取图书馆的文献信息资源,而不管这些资源的格式和存放的位置。这里以波士顿学院图书馆为例,分析Primo是如何整合印本图书和电子图书的12。在检索图书时,系统根据某种规则将不同载体表现(如印本和电子版本)的图书视为一条命中记录,然后指出该记录存在的几个版本(Versions),读者可以浏览不同版本的图书著录信息。很显然该系统只是借鉴了FRBR思想。例如题名为gone with the wind、gone with the wind:the Screenplay以及Gone with the wind : 50th anniversary edition并没有作为一件作品来看待,而是呈现为3条命中记录。gone with the wind则有8个版本,其题名都是gone with the wind,并且作者字段包含有Margaret Mitchell,但有两种表现(book和Video)。图6所展示的是一条命中记录的两个版本。尽管在同一命中记录的不同版本之间没有建立直接关联,但因为将它们作为一个命中记录来呈现,也没有给读者使用带来困难。在检索结果页面,“Getit”功能可以根据资源的类型来提供到电子全文的链接或馆藏图书的链接。图6. Primo系统的检索界面3.6 EnCore:以肯塔基大学图书馆为例Innovative Interfaces公司的EnCore系统与Ex Libris公司的Primo系统很类似,截止到2008年5月,已经超出100家图书馆采用了该系统13。这里以肯塔基大学图书馆为例14,分析EnCore是如何整合印本图书和电子图书的。与Primo一样,EnCore也不支持作品的概念,并且不支持Primo的版本概念。如图7所示,该系统能够将印本图书和不同格式的电子图书作为一条命中记录来呈现,然后提供到电子图书和印本图书的超链接。在读者查看馆藏信息时,该系统还提供了导向其它版本的超链接,相当于建立了一个印本图书到其它版本的单向链接。图7. EnCore系统的检索界面4. 图书集成检索的技术路线和功能分析图书馆目前还不能也不一定有必要完全按照FRBR思想来组织馆藏资源,但实现图书集成检索却是迫在眉睫的任务。为此,图书馆、传统的图书馆系统开发商以及数据库开发商等单位都投入了大量的资源来开发或改造相关系统。下面将详细分析这些单位所采取的技术路线,并总结出图书集成搜索的功能结构。4.1 技术路线分析通过分析上述案例,我们大致可以将它们的技术路线分为以下几类:4.1.1 完全基于传统的OPAC服务系统图书馆在无须引进或开发新的系统的前提下,只需将本馆所购买的电子图书的书目信息按照MARC标准转换并导入到原有的书目数据库即可,电子图书的地址存放在MARC 856字段内。但该方法存在如下不足:第一,电子图书编目数据维护困难。如果电子图书存放地址发生变化,原来所做的链接将全部失效,后期的维护成本较高;第二,所提供的功能受到原来的OPAC系统的框架限制,不能推出新的功能和服务。对于图书馆而言,这样的方案是简单易行,风险极小。采取该技术路线的有中山大学图书馆(ILAS II)、国家图书馆(Innovative Interfaces 的WebPAC PRO)等。4.1.2 在原有系统基础上进行二次开发在原有的电子图书检索系统和馆藏书目检索系统基础之上,图书馆重新开发出新的检索系统。以中科院图书馆为例。该馆图书联合目录系统就是基于Z39.50协议和某元数据标准在原有系统基础上实现了图书集成检索。图书联合目录系统有点像是一个元搜索引擎,将查询分发给一个或多个服务系统,然后重新组织获取的检索结果并增加新的服务(如参考咨询服务)。这类方案不需要改变原先业已存在的文献服务系统并且都能正常工作,这样既保护了以前的投资和系统的稳定,同时能够推出新的服务。4.1.3 开发或引进新的信息系统根据开发系统的公司性质,大致又可分为以下几种情况:(1)由电子图书供应商开发。电子图书服务系统原本处理的对象是电子图书,但为了满足图书馆图书集成检索的需求,将馆藏书目信息纳入其处理范畴。例如“读秀知识库”能够实现电子图书和印本图书的有效集成,但其不足之处是开放性不够,图书馆很难借助该系统将其它格式的电子图书集成到一起。(2)由图书馆/图书馆联盟自行开发。因为开发主体是图书馆或图书馆联盟,它们能够充分考虑某个或某类图书馆的特色功能需求。该方案需要图书馆投入大量的资源,其难度大、风险高。除非有雄厚的资金和优秀的IT技术人才的支持,图书馆一般不宜采用这种路线。例如重庆大学图书馆的ADLIB2.0和图书馆联盟OCLC的FictionFinder。(3)由传统图书馆系统供应商开发。供应商在其系统基础上推出了资源发现与服务传递系统(Resource Discovery & Delivery)。该类系统大量采用了网络2.0技术,能够对本地和远程的书刊、论文、数字内容等提供单一服务入口,方便读者发现和获取文献资源。这类系统将会成为读者寻找所需信息的理想地点并逐渐取代OPAC的位置,是目前实现电子资源和印本资源集成检索的最佳系统。该类代表产品是前面提及的Primo和EnCore系统。对图书馆而言,该技术路线风险比较小,经济投入较大,并且需要其它系统的支持。4.2 图书集成检索与服务系统功能通过上述分析,基于目前图书馆的实际情况,笔者认为一个良好的图书集成检索与服务系统应该具备如下功能或特色:(1) 单一的服务入口。通过单一服务入口,读者单次认证或无需认证直接登陆并可访问馆藏资源,给读者的感觉是一个完整的馆藏资源体系,不需要在电子图书服务系统和馆藏图书服务系统之间奔波。(2) 能够在同一本图书的不同载体表现之间建立关联。将这些不同载体表现的图书视为一个命中记录,并在这些载体表现之间建立关联。(3) 检索结果集的分面浏览。按照某个分面体系,例如载体表现、年代等来提供分面浏览,方便读者在大结果集中快速找到自己所需的文献。(4) 构建一系列的网络服务(Web Service)。这些服务包括资源的发现、定位、请求、传递、共享等。基于这些服务,图书馆可以将资源发现与服务传递等方便地集成到不同的信息系统之中或针对特殊需求而进行的二次开发,如个人数字化学习系统、课件管理系统、校园门户网站等,读者不访问图书馆网站也可以方便地获取来自图书馆的服务。(5) 提供多种排序方式。这些排序方式有相关度、时间、流行度等。(6) 提供图书推荐功能。图书推荐可以是基于图书的主题内容也可以是基于社会过滤。例如基于图书的全文内容或书名来提供相关图书、基于社会过滤技术“很多人借阅(收藏)本书的同时也借阅(收藏)了”等。(7) 个性化功能。允许读者设置个人信息、个人书架、个人空间等,既可以用来保存自己的个性化信息,方便读者之间的交流,又可以为服务效果的定量评价提供数据支持。例如,通过分析电子/印本图书的访问和借阅次数等使用数据,为下列管理行为提供支持:动态调整电子图书与印本图书之间的配置比例;为印本图书采访提供决策支持;评价图书采访的效果;分析读者的需求和阅读行为;统计流行图书等。5. 结束语图书只是图书馆文献信息资源的一种形式、馆藏资源的一部分,图书集成检索仅仅只是图书馆实现馆藏资源集成的第一步。图书馆应该将其所有的资源集成起来,不管其是印本资源还是电子资源,也不管是在存储在本地(图书馆)还是通过网络远程访问的,使得它们形成一个完整的馆藏资源体系,方便读者发现资源和利用资源。尽管目前出现了商业化的资源发现和传递系统也在很多图书馆得到采用或试用,有取代传统OPAC成为图书馆服务门户的趋势,但该系统还处于不断完善之中,没有考虑到中国图书馆界的实际需求和中文信息服务系统的,中国图书馆界最终能否成功引入国外的信息系统或者中国能否成功开发出类似系统,我们还将拭目以待。参考文献1 麦淑平. 图书馆“借、阅、参一体化”服务模式刍议J. 国家图书馆学刊,2007,(3).2 叶艳鸣 等. 论高校图书馆“藏、借、阅、咨”一体化开放服务管理模式J. 大学图书馆学报,2007,(3).3 Functional Requirements for Bibliographic Records EB/OL. 2008-1-10. /VII/s13 /frbr/frbr.pdf.4 OCLC. FictionFinder: A FRBR-based prototype for fiction in WorldCat EB/OL. 2008-5-29. /research/projects/frbr/fictionfinder.htm.5 Patrick Le Boeuf. Brave New FRBR World EB/OL. 2008-5-29. /loc/ifla/imeicc/ pdf/papers_leboeuf-eng.pdf.6 赵凤丽. 我国图书馆OPAC功能及其资源整合现状分析. 图书馆界, 2006(4):39-42.7 张薇. OPAC系统与馆藏数字资源整合研究. 晋图学刊, 2004(6):4143.8 中山大学图书馆EB

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论