刊物属性
  • 刊物名称:校园英语
  • 国内刊号:CN 13-1298/G4
  • 国际刊号:ISSN 1009-6426
  • 邮发代号: 18-116
  • 数据库收录:中国知网
  • 投稿邮箱:
      bianji@xiaoyuanyingyu.com
  • 作者:张靖 字数:2969 点击:

    关键词:数据挖掘;图书馆

    随着数据库技术在高校图书馆数据库中的广泛应用,面对数据积累越来越多以及读者不知如何从海量的图书资源中快速找到自己感兴趣的信息的问题,启发我们将数据挖掘技术运用到高校图书馆中,以实现对不同的读者提供个性化的信息推荐服务。

    1 数据挖掘的定义

    当前比较公认的数据挖掘定义是由U.M.Fayyad等人提出来的,所给出的定义是:“数据挖掘就是从大型数据库中提取出人们感兴趣的知识,而这些知识是隐含的、先前未知的、对决策有潜在价值的;提取的知识可以表示为概念、规则等形式。这些规则蕴涵了数据库中一组对象之间存在的特定关系,揭示出某些有用的信息,可以为市场策划、金融预测、经营决策等提供依据。”简单来说,数据挖掘就是从大量数据中提取或者“挖掘”知识,但这些数据是不完全的、模糊的、含噪声的和随机的,而数据挖掘就是要从中提取出那些隐含的、未知的和有价值的潜在的信息的过程。它也可以看作是一种决策支持过程,通过对各组织的海量数据进行分析,归纳推理并从中挖掘出潜在的模式,其结果将可为管理层的决策提供支持。

    数据挖掘的过程实际上就是一个知识发现的过程,通过运用各种数据处理技术从大量事实数据和观察数据的集合中挖掘出潜在的模式或规则,帮助我们真正理解这些数据的含义,并对数据之间所存在的关系产生更好的理解。通过数据挖掘,可以从大型数据库或数据仓库中的相关数据集中抽取出潜在的、有效的、新颖的、有价值的、最终可理解的知识信息,并从不同的角度显示,从而使存放有大量丰富可靠资源的大型数据库为知识归纳服务。因此,数据挖掘被认为是解决目前“数据丰富,但信息贫乏”问题的一种有效方法。许多人把数据挖掘视为另一个常用术语“数据库中知识发现(KDD)”的同义词。而另一些人只是把数据挖掘视为KDD过程的一个基本步骤。因此在通常情况下,人们对数据挖掘与KDD不进行严格区分。

    2 数据挖掘在高校图书馆中的应用

    高校图书馆最基本和最主要的工作就是面向读者的图书借阅服务,而要做好图书借阅服务工作的一个重要环节就是要了解读者的借阅需求并掌握他们的借阅规律和习惯。做好图书借阅服务是高校图书馆开展以读者为主体的各项图书馆服务工作的基础,也是图书馆建设合理的信息资源保障体系的重要依据。数据挖掘在高校图书馆中的应用,主要有以下几个方面:

    2.1 图书文献推荐工作中的应用

    利用数据挖掘技术对读者的历史借阅数据进行聚类分析或者关联分析,可以发现读者所借阅的图书文献之间存在一定的关联规则,即读者在借阅一类图书的同时也会借阅其他相关类别的图书,通过计算这种关联规则的支持度和置信度,得到读者的借阅模式,建立图书推荐数据库,在读者发生借阅行为时通过分析比较为读者推荐相关有价值的图书文献资源。例如,通过关联分析发现大多数读者在借阅了计算机编程语言教程图书的同时又借阅了数据库方面的书籍,说明这两类图书之间有较强的关联,那么在其他读者借阅前一类图书时可以为读者推荐后一类图书的相关资料。这样就可以帮助读者更好地学习,同时节省读者的大量查找时间,从而提高图书馆服务的质量。

    2.2 文献检索中的应用

    文献检索是反映高校图书馆个性化信息推荐服务的重要方面。传统的文献检索功能只能为读者提供简单的文献信息,而不能根据读者的阅读兴趣爱好提供个性化推荐服务。利用数据挖掘技术可轻松实现为读者提供个性化推荐服务的目的。首先,准备所需要的数据。收集有关读者借阅行为的大量数据信息,包括图书馆系统数据库中的读者借阅记录、预约信息和续借信息等。其次,数据的筛选和处理。对所收集的数据进行消除噪声数据、重复数据等筛选操作,再对筛选后的数据进行预处理和转换等,建立结构化数据库,这样有利于数据挖掘算法的运行。再次,挖掘数据。对先前建立的数据库进行聚类分析和关联分析,从中可以分析出不同类型读者所借书目的集合、阅读兴趣爱好特征等信息。最后,利用数据挖掘的结果结合可视化技术为读者提供个性化的文献检索服务。当读者检索文献时,通过数据挖掘形成的推荐集,检索结果会自动为读者推荐与这些文献相关的其他文献,并自动提取呈现有价值的相关文献的数据信息,并且将这些数据信息以可视化的、动态改变的方式呈现在读者面前。

    2.3 优化馆藏书架管理

    由于图书馆馆藏种类繁多,因此优化馆藏书架管理工作就成了影响高校图书馆科学发展的一个重要内容,而优化馆藏书架管理工作的一个方向就是预测图书文献的变化趋势,做到为最新的文献在书架中预留位置,减少图书馆藏图书倒架次数,还要及时做好剔除旧文献添加最新文献的工作。

    利用数据挖掘技术就可以实现上文所述的工作内容。首先利用预测分析技术中的回归与时序分析方法对历年的图书文献借阅日志进行分析,找出文献被借阅的周期性变化,然后分类分析图书馆借阅图书流通日志,可以发现借阅频繁的图书类别和增加幅度比较大的图书类别。将两部分分析的结果相结合,根据排架规则,在上架那些借阅量大且频繁的图书时尽可能地预留位置,减少图书馆藏图书倒架次数。最后就是剔除旧文献添加最新文献的工作。对馆藏中的文献数据进行分类分析,根据规定时间内未流通的图书和有过多的复本图书等分类要求,统计出符合这些规定的文献的数量和藏书位置,将其及时下架。

    2.4 情报咨询工作中的应用

    互联网所包含的信息浩如烟海,想要及时有效地获取所需的知识信息是一个很大的难题,同时也是衡量情报咨询工作的一个标准。利用Web挖掘技术就可以比较容易地解决上述难题。首先,,准备一台与互联网相连接的Web挖掘服务器,根据学校的教学安排、科学研究以及学校未来发展方向等各方面的需要,利用Web挖掘技术在服务器上对互联网上网页进行挖掘。Web挖掘可根据用户所提出的需求自动地从互联网上搜索相关网页,对这些海量数据信息进行深层次地分析,并能够保证数据的完整性和安全性。其次,通过对检索所得结果进行聚类分析和分类分析,将从互联网上检索到的相关数据信息按照学科建设和科研方向等进行分类分析,然后建立摘要、索引或者其他有效链接。最后建立检索界面,通过可视化的方式服务用户。用户可以通过代理服务器根据关键词、主题词或者其他一些检索条件进行检索。这样,就大大提高了检索服务响应的速度,节省了用户的时间,而且也丰富了图书馆的信息资源。

    3 结语

    作为图书馆的未来发展趋势,数字图书馆在研究中遭遇了重重困难,知识的有效组织与发现就是一段时期内数字图书馆所面临的重要课题之一。数据挖掘作为方兴未艾的信息技术之一,由于其在数据组织、分析和知识发现等方面的巨大优势和对信息的深层挖掘能力,并随着硬件环境,挖掘算法的改进、应用的普及和经验的积累等,数据挖掘在图书馆的发展中将显示出强大的发展潜力和广阔的应用前景。

    参考文献

    [1]刘显显.基于数据挖掘的高校图书馆个性化信息推荐方法研究[D].辽宁大学,2013

    [2]袁媛.数据挖掘在高校图书馆个性化服务中的应用研究[D].广州大学,2011

    [3]陈文伟.数据仓库与数据挖掘教程[M].清华大学出版社,2008,4

    [4]石军.数据挖掘在高校图书馆的应用[J].江西图书馆学刊,2005,3