您好,欢迎来到99网。
搜索
您的当前位置:首页大数据时代的数字图书馆建设

大数据时代的数字图书馆建设

来源:99网
第28卷 第11措 2016年11月 Vol 28.No. J:::ourna:::::lofLib:::::rarbrmyandhatato n :iSciencesinAg-ricultu rt :::::::—:—:::NOV 2()1f ::::::::::::::::::::::: ::=:::::=:::大数据时代的数字图书馆建设 高蕴梅 ,薛凯华 ,谢从华z (1.常熟理工学院图书馆,江苏常熟215500;2.常熟t ̄712学院计算机科学与] 程学院.江苏常熟215500) 摘 要:大数据的发展趋势将对数字图书馆的发展产生重要影响。从大数据的固有特性角度分析了大数据环境下的 数字图书馆建设面临的数据大规模性问题、数据多样性问题和数据价值性问题.提出了对应的数字图书馆 数字资源建设策略、平台建设策略和价值提升策略 关键词:数字图书馆;大数据;数字资源建设;平台建设;价值提升 中图分类号:G250.76 文献标识码:A 文章编号:1002—1248(2016)1 1-0085—03 oigit ̄Lihary‘:加slIn 伽inthe吼ofbig dam GAO Yun—mei XUE Kai—hua XIE Cong-hua2 .Library ofChangshu Institute ofTechnology Changshu 215500 China; 2,School ofComputer Science and Engineering,Changshu nsItitute ofTechnology,Changshu 215500,China) bI嗽The development trend of big data is to generate important effect on the development of digital library.This paper analyzed the challenges in the digital library construction in the environment ofbig data,including data scale,data iversitdy and data value,from the view ofbig data’S inherent characteristics,and proposed the corresponding strate— gies on igidalt esonrce rconstruction,platform construction nd avalue enhancement. 哪:Digiatl library;Big data;Di#tal resource construction;Platform construction;value enhancement 数字图书馆依托现代信息技术、计算机技术和通 讯技术构建的网络平台,采集、筛选、加工、存储、 整合与管理图书文献信息.满足人们日益增长的图书 文献信息需求,集成了一系列图书信息管理系统Ⅲ。数 字图书馆的电子资源代替了传统图书馆知识资源的纸 质文献,是传统图书馆在信息时代的发展。此后,移 动阅读成为民众获取知识、提高素质的一种重要方式, 传统数字图书馆服务功能产生了一次重大变革【2]。近年 大变革。 国内外学者针对大数据环境下数字 书馆面临的 新机遇与挑战.从咨询服务、资源管理、平台建设等 多方面进行了研究和探索[4-1o],并取得了阶段性成果.. 这些成果可以归纳为两类:数字图书馆为读者提供业 务等服务。以及数字图书馆需要的技术服务。为读者 提供业务等服务方面,袁红军川和胡海鹰I4]提Ⅲ了大数 据时代数字图书馆知识咨询的新方法与新思维等服务 创新策略。陈传夫[5]分析了大数据时代发展新型数字知 识服务。完善财政投入机制,规避知识产权风险等建 议。为数字图书馆提供技术等服务方面,温浩宁嘲提ifJ 了大数据时代的数字图书馆基于NoSQL的中间件模型 的数据集成方法.陈臣[7-81提出了基于读者体验视角的 数字图书馆个性化搜索引擎,王宇鸽[9】提m了数字图书 馆大数据技术的应用架构.李白杨㈣提m了大数据时代 来,随着互联网、物联网、云计算、i网融合等IT与 通信技术的迅猛发展,数据快速增长成为许多行业共 同面对的严峻挑战和宝贵机遇。信息社会已经进人了 大数据时代,不仅改变着人们的生活与:【作方式、企 业的运作模式.甚至还引起科学研究模式的根本性变 革l 3_。大数据时代。数字同书馆的数据处理及服务将会 发生明显的变化,传统数字图书馆服务将再次面临重 收稿日期:2016.04.26 项目基金:苏州市科技发展计划项目(项目编号:SYG201409);江苏省高校哲学社会科学研究项目(项目编号:2016SJB870016) 作者简介:高蕴梅(1982.),女,本科,助理馆员,主要研究方向:数字罔书馆建设;常熟理 学院。薛凯华(1969一),女,本科.馆员,主 要研究方向:数字图书馆建设。谢从华(1978一),男,博士,副教授,主要研究方向:数字图像处理和数字图书馆。 86 农业图书情报学刊:工作研究 第28卷 数字图书馆的数据存储、数据处理和数据分析方法。 以上两个方面紧密相连,互相依赖。大数据时代 数字图书馆为读者提供业务服务需要建立在最新的大 数据技术基础之上,没有技术的支持,很难实现这些 新的业务服务。另一方面,大数据技术如何应用在数 字图书馆上.需要在业务上创新。为了更好地加强这 两个方面的联系,现从数字图书馆建设的角度,分析 大数据环境下数字图书馆建设面临的问题,并提出解 决这些问题的建议。 1大数据环境下的数字图书馆建设面临的问题 数字图书馆从数据库到大数据,看似只是一个简 单的技术演进。但两者有着本质差别。大数据的出现 了传统数据管理方式,在数据来源、数据处理方 式和数据思维等方面都带来性的变化。现从大数 据的特性角度。分析数字图书馆建设面临的问题。 1.1数据的大规模性(Volume)问题 数字图书馆的资源既有文献资源、光盘数据资源、 网络资源等.也有读者信息和提供服务的信息。图书 馆的数据资源每天都在增长,数字图书馆数字资源总 量是一个庞大的数据集。相对于数据库处理对象通常 以M B为基本单位而言,大数据常常以GB,甚至是 TB或PB为基本处理单位。大数据的“大”,并不仅指 数据本身绝对数量的大,而是指处理数据所使用的 “大”模式:尽可能地收集全面数据、完整数据和综合 数据。数字图书馆将面对如何处理异构数据,如何存 储海量数据,如何选择数据资源等问题。 1.2数据的多样性f、,arieW)问题 数字图书馆数据主要包括系统运营与管理数据、 用户服务数据、读者博客与论坛反馈数据、用户私有 数据、读者阅读社交数据和其它没有Web化的数据等。 这些资源和数据的编码和格式无法达成统一,形成了 大量的异构数据。相对于数据库的数字图书馆。其数 据类型相对单一,且以结构化数据为主,非结构化数 据较少。而大数据时代,数据类型较多,包括视频、 音频等影像资料、办公文档、Web信息等可被感知的 半结构化或者非结构化数据越来越多。数字图书馆将 面对不同类型的数据采集、存储和检索利用的准确度、 时效性、方法和经济性需求等问题。 1.3数据的价值性(Value)问题 在大数据时代,图书馆对用户的服务策略需要转 变,图书馆的业务向数据分析和挖掘方面靠拢,图书 馆的真正业务将变成对于海量数据的处理与分析。许 多知识和资源蕴藏在碎片化的数据中。例如可能1小 时的视频中,有3分钟是宝贵的资源,但要从数以TB 的视频中找出这3分钟数据。数据挖掘将成为大数据 时代数字图书馆的一大主要业务,这些业务开展的水 平也将决定着大数据时代图书馆的发展水平及方向。 但是,基于数据库的数字图书馆,先设计好数据模式, 在使用过程中产生数据;而大数据很难预先确定模式, 只有数据出现之后才能确定模式,且随着数据量的增 加模式不断演变[1l】。数字图书馆将面对从海量异构数据 中找出有用的信息,为用户提供服务。 2大数据环境下的数字图书馆建设策略 2.1有选择性地建设与区域馆际合作共享相结合的 数字资源 关于大数据环境下数字图书馆建设的大规模数据 问题,没有必要也不可能建设所有类别的数字资源, 要避免资源面面俱到的“贪大求全”建设。应该优先 选择自己有特色或形成了一定规模的资源,整合相关 的其它资源.有系统、有组织地进行开发、整理和建 设.以真正发挥数字图书馆的规模效益。而对于其它 没有建设的数字资源,可以展开馆际区域合作与资源 整合共享。区域合作一方面可以克服大数据给数字图 书馆的发展带来的经济负担.防止产品与服务成本增 加造成的资金投入不足问题;另外,对于选择建设的 数字资源,可以更多地综合考虑长期保存的标准问题、 存储介质的选择问题、多重备份与适时迁移问题、仿 真与再造技术问题、安全和管理等技术问题,数字图 书馆可以实施规范化的项目管理,保证实现建设数字 资源数据的全面性、完整性和综合性要求。 数字图书馆建设数字资源的文字、图像、视频、 音频、文献、科学数据和论文等数据,主要考虑数据 存储的问题。目前主要有分布式缓存、基于MPP的分 布式数据库、分布式文件系统、各种NoSQL分布式存 储方案。这些存储方案都需要购买大量硬件设备和专 业软件系统,与传统数字图书馆相比,所耗费的资金 会非常高。面临巨大的资金压力.且需要专业人士进 行数据管理。随着云计算技术的日益成熟,能够为大 数据提供有弹性的、可扩展的基础设施支撑环境以及 高效的数据服务模式。数字图书管建设中可以根据需 要进行购买,从而可以解决因无法投入巨额资金购买 软硬件支撑大数据服务的难题。 2.2基于网格技术和面向服务的体系构架相结合的 平台建设策略 目前,数字图书馆对结构化数据的管理比较成熟. 但缺乏对非结构化数据的统一管理。应在基于用户需 第11期 高蕴梅等:大数据时代的数字图书馆建设 87 求的基础上调整信息资源结构建设,保证信息资源质 量,支持多种异质文档及其元数据的管理。并支持多 媒体文档的存储、保管、检索和管理。形成一种新型 的、分布式的和整合式的资源集成平台。 基于网格技术的数字图书馆平台,可以将高速互 联网、高性能计算机、大型数据库、传感器、远程设 备、终端等整合成一台虚拟的“超级计算机”。通过建 设网格技术平台的中间件。在数字资源系统上建立一 个数据核心协议层,把分散的各种信息服务在该层次 上统一解决,实现数字图书馆异构环境下跨平台异构 资源的协同工作。 构建基于Web服务的面向服务的体系构架(Ser. vice—Oriented Architecture,SOA)不局限于某一工作平 台,不要求服务的提供者和使用者都使用某一软件来 寻求服务,能最大限度地实现对现有异构信息系统的 资源整合,尤其是侧重于建立图书馆内部的异构资源 整合。 2.3创新应用服务和软件技术创新相结合的价值提 升策略 大数据环境下数字图书馆的数据价值体现在丰富 的应用系统上,比如信息检索、数据挖掘、知识服务 和个性化等应用服务和软件。应用服务和软件通过对 原始数据的转换、挖掘、组织等新型数据服务功能, 从海量数据中筛选有用信息,对用户满意度、资源利 用分布及趋势发展等作多种角度解析、跟踪,并通过 可视化技术展示出来。开拓一条数据主导型的知识服 务之路。 大数据时代的数字图书馆需要注入前沿科技活力。 软件技术的创新和发展是根本,尤其是机器学习、数 据挖掘和数据可视化等技术。不断创新与发展软件技 术。才能够跟上时代步伐。通过大数据分析和智能计 算,可以有效地分析用户的偏好,有针对性地为每个 用户提供个性化服务.才能为用户和读者提供最优的、 全方位的个性化服务。 技术的改变及用户服务要求的变化决定了数字图 书馆服务的改变.大数据时代的数字图书馆在服务方 式、途径、模式等方面也都将发生改变。大数据时代 数字图书馆服务不仅包括文献服务、信息咨询、学科 服务等,更多服务将围绕大量数据的采集、组织、分 析和决策等展开,为社会机构、企业单位等做的数据 处理和分析服务、数据挖掘服务。 3结语 大数据为数字图书馆的发展带来了历史性机遇. 未来数字图书馆建设面临诸多挑战,需要在数字资源 建设、平台建设、服务和价值提升等方面进行战略性 创新。选择合理的数字资源建设,有所不为才能有所 为。大量非结构化数据和结构化数据并存,需要建设 资源集成平台统一管理。服务和技术的不断创新。以 数据和应用促进新的发展,是大数据时代数字图书馆 的新使命。 参考文献: 【1】袁红军,宁光芳.大数据时代数字图书馆知识咨询能力研究框架构 建叨.现代情报,2013,33(1 1):25—28. 【2】沈思.国内外移动数字图书馆发展综述们.情报资料工作,2013,(6): 31-34. 。 【3】王元卓,靳小龙,程学旗.网络大数据:现状与展望 .计算机学报, 2013,36(6):1 125-1 138. [4】胡海鹰.大数据趋势下数字图书馆的服务创新策略叨.图书馆工作 与研究,2014,(218):27—29. 【5】陈传夫,钱鸥,代钰珠.大数据时代的数字图书馆建设研究[J].图书情 报工作,2014,58,(7):40-45. 【6】温浩宇,李京京.大数据时代的数字图书馆异构数据集成研究[J].情 报杂志,2013,32(9):138—141. [7】陈臣.一种大数据时代基于读者体验视角的数字图书馆个性化搜索 引擎[J1.I ̄t JII图书馆学报,2013,196(6):27—30. 【8】陈臣,陈双飞.一种基于大数据的数字图书馆高效搜索引擎[J】.现代 情报,2014,34(1):49-51. 【9】王宇鸽,邢军,张红.数字图书馆大数据技术的应用架构[J】.图书馆学 刊,2014,(7):1 13-1 16. 【1o】李白杨,张心源.数字图书馆建设中大数据问题初探明.情报科学, 2013。31(11):26-29. 【11】 ̄t/l,峰,慈祥.大数据管理:概念、技术与挑战.计算机研究与发展, 2013,50(1):146—169. 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- 99spj.com 版权所有 湘ICP备2022005869号-5

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务