作者:徐芳 字数:6226 点击:

摘 要:在信息技术的推动下,传统的文献信息资源收藏和服务模式已经无法满足用户不断提高的使用需求,图书馆资源共建、共享、共知成为必然的趋势,联合目录应运而生。本文主要对浙江省高校数字图书馆(ZADL)联合目录的建设实践进行了具体的介绍,包括工作原理、数据采集、内容与功能、管理与维护等几个方面,并对ZADL联合目录的特色进行了总结。

关键词:数字图书馆;ZADL;联合目录

随着信息技术和互连网络的迅速发展,图书馆的“馆藏”内容不断扩展, “读者”数量迅速增加,传统文献信息资源收藏和服务模式遭受着严重的冲击。任何一个组织机构想凭借一己之力收藏全部的文献资源,都是不可能的。图书馆资源共建、共享、共知成为必然的趋势,联合目录系统也在这种环境下应运而生。

联合目录通过反映各成员馆的文献收藏,揭示和报道多个文献收藏单位的文献目录,使图书馆能够得到准确的馆藏分布信息,以便对资源进行有效的协调配置;使读者能够实现跨库搜索定位资源,为资源利用和增殖服务奠定基础。联合目录是其它资源共享的基础,对于图书馆来说,联合目录的建设提供了充分发掘各个图书馆馆藏文献的机会,文献保障体系从单个图书馆的保障逐步过渡到区域性保障甚至全国保障。

1 浙江省高校数字图书馆联合目录建设概况

浙江省高校数字图书馆(Zhejiang Academic Digital Library,简称ZADL),是在浙江省教育厅领导下,由全省各个高校图书馆共同参与建设,服务于全省高校的数字化文献保障服务体系。ZADL联合目录是浙江省高校数字图书馆的核心部分,旨在建设浙江省高校图书馆文献资源目录数据库和目录导航,全面整合和揭示全省高校图书图实体印刷型书刊文献和虚拟数字资源的收藏、建设状况,提高全省书目数据标准化著录水平,方便各馆进行文献交流和馆际互借,最终实现全省高校文献资源共建、共知、共享。

目前联合目录的整体框架建设已基本完成。截至2014年初,ZADL已经汇集了大量数据信息 ,图书方面,汇集了浙江省50多家高校图书馆的127万多种图书的书目信息,其中大部分为本科院校,亦有少量高职院校;期刊方面,汇集了浙江省24所本科高校的161个期刊数据库的 56701万种期刊;数据库方面,汇集了浙江省高校图书馆的547个数字资源库,其中中文数据库208个,外文数据库257个。ZADL联合目录数据库服务体系由1个省级服务中心和5个高教园区分中心组成,向浙江省高校广大师生提供联合目录的导航和检索服务。

2 ZADL联合目录的工作原理

ZADL联合目录平台以CERNET为依托,各高校图书馆通过对CERNET的连接来实现互连互通。省中心网络通过千兆链路与校园网的主干相连,分中心以百兆上连到CERNET,采用TCP/IP网络协议和星型拓扑结构,确保数字资源共享带宽。为保证各中心的共享数字化资源服和能够为各高校合法用户使用,访问权限可以用软硬件通过IP地址控制来实现,省中心负责向CERNET申请IP地址,用于各中心资源服务器的对外服务,并通过硬件防火墙将数据中心分隔,根据相应的安全策略来控制数据访问,防止非法访问。关键的核心设备组网冗余连接,关键部件冗余配置,核心设备的配置能够实现如组播、IPv6等多样化的业务,网络设备及网络环境实行智能管理和监控。各分中心为ZADL在当地高教园区的统一汇集点以及信息资源的分发点。

在这样的网络技术保障下,ZADL联合目录采用集中管理的模式,即来自各成员馆的数据汇集在一个数据库中。基于z39.50协议或HTTP协议,成员馆将各自的数据库中的数据转换成OAI(Open Archive Initiative)元数据,并通过Web方式进行发布,数据中心利用元数据收割机(Metadata Harvester)获取这些数据,整合建库,加工清理之后提供服务。采用自动收割的方式有效地解决了集中式联合目录不能动态反映各成员馆的馆藏情况的难题,基本保证了中心库和各成员馆数据库之间的数据同步。

3 ZADL联合目录数据的采集

ZADL联合目录数据的采集分为三个部分,即图书书目数据的采集,期刊数据的采集和数据库数据的采集。

3.1 图书书目数据的采集和处理

图书联合目录采用两种格式;即ISO格式和MARC格式。中文采用CNMARC格,西文采用CNMARC格式和USMARC格式或LCMARC格式。书目数据著录标准与规范采用CALIS推荐的《中文文献著录原则》和《西文文献著录原则》,或国家图书馆推荐的中西文著录规则。

3.1.1 OPAC书目数据的采集和处理

ZADL联合目录对OPAC数据采用自动采集的方式,由系统对OPAC中的数据进行自动收割。OPAC数据的采集功能支持支持aleph,innopac,ilas,汇文,金盘,图创, 北邮等各类浙江高校图书馆自动化系统。

OPAC数据的采集:对于具有Z39.5开发接口的opac系统或具有查询接口的opac系统,可以直接自动采集;对于无接口无直接读取权限的opac系统,则可以采用页面分析法,监控opac系统的最新更新榜单,实现自动采集;对于具有MARC数据库读取权限的系统,可以通过自动采集程序直接将MARC数据导出;自动采集程序可以设定每日实施采集更新的时间,一般设置在凌晨1:00-5:00之间,以避开系统访问的高峰期。

OPAC数据的处理:通过导出程序得到的MARC数据首先要进行解码,通过接口采集的数据无需解码,解码后的数据先进入到预处理数据库;通过对预处理数据库进行过滤和清洗工作,去除多余信息和编码错误信息;与图书书目总库进行合并筛查处理,对于来源于不同图书馆相同版本的图书书目进行合并根据书目总库的图书价值评分系统对图书进行权重标识,按照分词建立搜索索引。

3.1.2 电子图书书目数据的采集及处理

通过对各馆电子图书系统进行书目信息的查询采集,可以得到每个图书馆的电子书书目信息,包括采集OpenURL的链接地址信息。对于本校自建或版权电子书书目则可以通过导出程序进行书目导出,与采集书目进行合并处理,通过对电子书系统的页面分析跟踪,实现书目的每日更新。

3.2 期刊数据的采集

期刊元数据管理主要着眼于两个方面:一是期刊元数据库中的元数据的存储和维护;二是各个工具(数据仓库建模工具、前端工具、数据获取工具等)和模块间的消息传递和分工协作。搜集全部高校馆可以使用的电子期刊资源元数据。这一过程主要按照两个方面进行:一是根据各成员馆提供的数据库和电子刊订购目录,采用元数据采集和数据库商支持两种方式,为项目组提供电子期刊元数据列表以及变更信息和数据;二是开展网上免费期刊资源的调研,搜集OA期刊资源的数据。整合两方面搜集得到的数据,得到全部高校馆可以使用的电子期刊资源数据;对全部期刊数据进行规范的加工与处理。经加工整序的期刊数据包含了该期刊的来源数据库、电子期刊的网址、所属学科分类、刊物级别(标注SCI、EI、IM 期刊源)、该电子期刊的收藏馆等信息;与期刊资源导航平台实现期刊资源检索、浏览导航、原文传递等功能的有机集成与无缝连接。具体过程如图1所示。

3.3 数据库数据的采集

一方面通过各高校图书馆网站的资源列表进行收集,另外一方面将收集到的列表与各图书馆工作人员进行核对,数据库列表的采集工作为确保准确性,将有人工进行完成收录工作;后续的更新也分为两个部分,一部分,对于数据库的变化,更新或权限改变,各图书馆工作人员通过联合目录制作平台进行更改,去掉本馆无权限数据库, 新增数据库时要注意比对已经在系统中上线的数据库名单列表,确保数据库名称的唯一性;另外一方面由联合目录中心工作人员设立数据库跟踪列表程序,定期访问各高校数据库列表的URL变化情况,收集更新各图书馆的数据库变化和访问地址变化情况。数据收集与加工的内容与工作流程:搜集浙江全省高校图书馆拥有的各类数字资源数据,可以直接到图书馆网站的资源栏目进行收集,也可通过馆员直接获取;对收集到的数据和资料进行规范的加工与处理。数据格式包括以下字段信息:数据库名、收藏馆、学科分类、文献类型、来源(购买、自建、免费)、数据库链接IP等。

4 ZADL联合目录的内容和功能

ZADL联合目录内容包括三个方面:全省主要高校印刷型书刊文献联合目录数据库、全省高校电子期刊导航平台、全省高校数字资源导航目录等三部分。

4.1 印刷型书刊联合目录

内容:浙江省主要高校图书馆(成员馆)的中外文纸质图书馆藏目录;浙江省主要高校图书馆(成员馆)的中外纸质期刊目录。

功能:科学、准确、全面地展现和报导当前浙江省高校图书馆纸质文献的馆藏情况;提供多种途径对书刊联合目录进行检索;提供图书、期刊联合目录统一检索平台,统一检索平台可以同时有选择或全选各图书馆的OPAC系统进行书刊目录检索;对数据的自动收割,对元数据进行查重整序,检索结果去除了重复记录,但可以同时显示到目标文献的所有资源提供者的全文链接,用户可以根据实际情况选择任意一个链接获取所需信息;能方便进行系统维护和数据统计。

4.2 电子期刊导航

内容:各馆订购的中外文全文电子期刊以及互联网上的免费期刊资源(Open Access)。

功能:准确、全面地展现和报导浙江省高校图书馆(主要是成员馆)购买的中外文电子期刊以及互联网上可免费获取的期刊资源情况,对这些电子期刊资源提供一站式的检索服务。用户可以通过刊名、ISSN字段等途径进行检索或者浏览,并提供全文下载;可馆际互借,把查找到的文章信息直接发送文献传递请求以获取全文;后台建立报错机制,以及使用障碍反馈渠道。

4.3 数据库导航

内容:浙江省主要高校图书馆(成员馆)购置或者自行建立的数据库以及互联网上可免费获取学术资源数据库。

功能:准确、全面地展现和报导浙江省高校图书馆(主要是成员馆)的数据库资源以及互联网上可免费获取的学术资源,通过统一的检索与浏览界面向全省高校师生提供服务,实现统一入口,统一检索,全文获取和个性化服务。

5 ZADL联合目录平台的维护和管理

5.1 ZADL联合目录平台的维护

ZADL联合目录平台的维护工作主要由服务提供者负责。

其具体工作包括以下几个方面:基于SAML(Security Assertion Markup Language)安全声明标记语言的控制信息验证,保证ZADL联合目录平台的子系统间安全信息的交换认证;授权管理,保证用户信息在子系统间的一致,确保用户可以安全访问整个系统;作业与同步系统的目的在于保证数据业务操作的安全,实时监控数据库存储空间的使用情况和对数据的访问操作情况,若有突发状况发生,则发出警报;硬件冗余设计保证数据备份的安全,保证收到意外事故时业务的连续性。

5.2 ZADL联合目录平台的管理

ZADL联合目录平台的监督管理体制由省中心资源、项目牵头单位、分中心负责单位、成员馆四级组成,它们各司其职,各尽其责,互相协调。

省中心资源负责统筹管理,浙江工业大学作为项目牵头单位,承担ZADL技术组与服务提供单位之间的沟通、协调工作,共同制订总体方案、经费预算、数据标准、工作规范、培训计划,检查数据质量,汇总和统计各成员馆的数据。各分中心承担成员馆之间的信息沟通、业务指导、数据质检、分中心数据统计和人员培训等工作。成员馆负责上传本馆的馆藏书目数据,协助提供数据库的拥有情况,在OPAC系统内修正不合标准的数据,方便后续的数据采集工作。而纸质书刊联合目录、期刊导航和数据库导航的数据质量审核工作则分别由浙江工业大学、浙江师范大学和浙江工商大学进行。

6 ZADL联合目录的特色

6.1 实现浙江省各高校图书馆资源的导航及统一检索

ZADL联合目录提供了成员馆馆藏资源的导航功能,另外还提供了对这些资源设置了统一的检索服务。

ZADL联合目录集中了下属众多图书馆的馆藏资源,内容覆盖了数百个数据库,而ZADL统一检索服务系统,集成了资源调度系统,对来自不同系统和数据库中的的数字资源进行统一检索,在用户层次,消除了本地资源和异地资源的差异,而对不同数据库的异构数据实现跨库检索。

ZADL联合目录采用了统一是的元数据,消除了对数据库数量的限制,从而加快了检索操作的速度,完成一次全省资源搜索操作只需要0.08秒的响应时间,实现了实时检索。

ZADL统一检索服务系统为用户提供了多种形式的检索服务,比如简单检索、高级检索、相关文献检索、原文/文摘获取、二次检索等,方便读者根据检索要求和自身的喜好选择合适的检索方式 ;另外还可以根据单个用户的要求提供具有专门性和针对性的个性化检索服务;值得一提的是,ZADL统一检索服务系统对文献的题名、主题、作者、文摘甚至全文进行分析型检索,同时采用了先进的知识组织体系和语义检索技术,使用户可以快捷地进行深入检索。

ZADL统一检索服务系统的检索结果按照统一的格式显示,并且检索结果还针对学科、年代进行了导航聚类,方便读者了解检索内容的概况和二次筛选。

便捷的检索途径,快捷的检索速度,统一的检索结果表示,,都带来了ZADL统一检索服务平台的良好的用户体验。

6.2一站式、个性化、全面的服务

ZADL以用户需求为出发点,以满足用户需求为目标,设计和开发出基于检索和导航为主的联合目录系统,建立了具有实用性、集成性、可扩展、可配置、统一认证等特点的数字图书馆,提供读者服务的统一入口,为读者提供一站式、个性化、全面的服务。

具体包括以下内容:

1) 统一入口服务:读者只需要一次登录,访问一个站点入口,就可以浏览和检索所需文献资源。

2) 统一检索服务:读者可以在同一检索平台上检索各类中文、外文资源信息;

3) 全文获取服务:检索平台与ZADL集成,可以调度整个浙江省高校图书馆的全文资源,有权限的用户可以直接获取文献,无权限的用户则可以通过ZADL文献传递系统进行文献传递;

4) 最新文献服务:向科研和教学人员及时报道最新的发展动向和最新文献;

5) 最全文献服务:系统全面揭示了浙江省高校图书馆拥有的各种内部和外部资源;

6) 个性化服务:根据用户需求,向用户提供灵活的专业性和针对性强的服务以及其他个性化服务。

ZADL联合目录平台的建成和开通,将全面展现浙江省高校图书馆文献资源(纸本和电子)的拥有情况。浙江各个省高校的广大师生可以借助本校图书馆网页上的ZADL联合目录检索平台系统,方便快速地检索所有成员馆的馆藏文献资源,通过文献传递或者馆际互借获得所需文献。ZADL联合目录平台为浙江省高校广大师生的教学、科研工作提供了有效的文献保障。可以说,ZADL联合目录的建成和开通,开启了浙江省高校文献资源共建、共享体系的新纪元。

参考文献

[1] 张薇. OAI-PMH协议实现联合目录的集中建库. 图书馆学研究[J],2010(7) :P58-61

[2] 谢琴芳,刘素清,白新萍等. CALIS联合目录——高校书目数据共建共享的成果.大学图书馆学报[J], 2002(3): P9-13

[3] 董红霞.论我国高校图书馆联合目录的发展.图书情报工作[J],2009(15):P78-82

[4] 浙江省高校数字图书馆http://zadl.zj.edu.cn/