您的当前位置:首页正文

浅谈大数据技术在图书馆中的应用研究

2023-11-19 来源:客趣旅游网
2015年4月 哈尔滨金融学院学报 第2期 Journal of Harbin Finance Unive ̄ity 总第130期 【图书馆建设】 浅谈大数据技术在图书馆中的应用研究 关晓颖 (哈尔滨金融学院图书馆,黑龙江哈尔滨150030) 摘 要:概括地介绍了大数据的概念、特征及发展状况。依据大数据与图书馆相符合的特征。研究分 析了大数据技术在图书馆中的应用领域。 关键词:大数据;大数据技术;应用 中图分类号:G250.74 文献标识码:A 文章编号:1004-9487(2015)02-0113-03 伴随着互联网井喷式的发展,我们的工作和 学者们也对大数据的应用研究领域展开了相关的 生活越来越依靠于网络,依靠于海量的数据。在 分析研究工作。中国工程院院士李国杰等人就阐 继Web2.0、云计算出现之后,大数据这个概念越 述了“大数据的研究现状与意义”,介绍了大数据 来越成为当今网络时代的新宠儿。据调查显示, 应用与研究所面临的问题与挑战,并对“大数据发 到2020年全球数据使用量预计将爆增44倍,数 展战略”提出了建议。 据总量将达到40ZB。大数据颠覆了传统的IT界, 二、大数据的概念、特征及大数据技术目前的 挑战着各行各业的存储架构、数据挖掘、云计算等 应用领域 各个应用环节。如果说云计算是一种处理超大文 大数据(big data)又称作海量资料。较为抽 件,将其读人电脑内存的一种工具,那么大数据则 象,至今尚无确切统一的定义。一般是指所涉及 是通过一些方法将这些大量的数据进行挖掘、分 资料量的规模巨大到无法透过目前主流软件工 析、处理后,通过计算机把大量数据中有用的、有 具,在合理时间内达到撷取、管理、处理、并整理成 价值的东西转化为价值。 为帮助企业经营决策更积极目的的资讯。要理解 一、大数据的发展概况 大数据这一概念,首先要从“大”人手,“大”是指 继201 1年全球最大战略公司McKensey提出 数据规模,大数据一般指在10TB(1TB=1024GB) 《大数据的下一个前沿、创新、竞争和生产力》的研 规模以上的数据量。数据的本身没有意义,它的 究报告后,2012年美国奥巴马政府宣布推出的“大 应用主要是通过数据挖掘来撷取价值。同过去的 数据的研究和发展计划,”该计划将“大数据”作为 海量数据有所区别,它的基本特征可以用4个V 全球性发展计划,将美国国防部、能源部、国家科 来总结(Vol—ume、Vartery、Value、Veloe—ity),且Ⅱ 学基金等六个联邦部门和机构集合起来,大力推 体量大、多样性、价值密度低、速度快。 动及改善与大数据相关的采集、组织、分析、决策 1.数据量巨大。从TB级别到PB级别。 工具及技术,该举措足以证明了大数据技术将在 2.数据类型众多。如网络日志、博客、视频、 近几年内影响着全球知识创新和知识服务的形 图片、地理位置信息等等。 式。 3.价值密度低。、在连续不断的视频监控中, 随着大数据概念逐渐被公众了解,我国国内 或许有价值的数据仅有一两秒钟。 收稿日期:2015—01—2O 作者简介:关晓颖(1972一),女,满族,黑龙江哈尔滨人,金融学硕士,副研究馆员,研究方向为图书馆应用管理。 一113— 4.处理速度快:1秒定律。这一点是和传统 的数据挖掘有着本质的不同,它所附带的互联网, 手机、电脑、以及遍布全球各个角落的传感器,无 一在不断出现的大数据种种应用后,图书馆已 经感受到它所带来的创新知识服务的巨大压力。 图书馆使用各种新技术机制在知识组织和创造、 不是数据来源或承载方式,速度提升惊人。 目前,国内大数据的应用已在金融、能源、医 传播和应用中起着相当重要的作用。它不仅涵盖 了图书馆服务体系的基础,还要指出结构化和非 结构化数据的深度分析、知识服务竞争力分析、预 测分析这样的高附加值服务。科技知识实时创新 为知识服务的协同操作,实现组织目标,创造积极 疗、零售业、通信、电商、等行业中逐步开展、扩大 起来。如:百度、腾讯、淘宝、中国移动等都已开始 对大数据的存储、处理和应用进行布局。 三、大数据与图书馆的关联 随着图书馆资源内容越来越丰富,资源类型 越来越繁多,增长速度越来越迅猛,图书馆资源建 的价值提供了数据情报服务。这就是大数据在图 书馆的应用中体现的魅力所在。 涉及的大数据的主要来源在图书情报领域的 设的发展和信息技术的运用使图书馆已经具备了 有(1)社交网络交互数据:随着社交网络应用的逐 大数据的特征。移动图书馆、智慧图书馆、社交网 渐普及,社交网络所产生的数据量将大大超过以 络等的发展,使那些能记录用户痕迹的半结构化 往的信息传播媒介,无庸置疑它将是未来很长一 数据和非结构化数据日益庞大。图书馆需要充分 段时间内大数据的最为主要的来源之一。(2)移 有效地利用这些资源与数据,转变服务理念,拓展 动互联网数据:移动互联技术的持续改进,可以使 服务内容。 图书馆的信息资源轻松驻人移动电子设备的访问 图书馆符合大数据的特征具体体现在以下三 (如工作人员、用户行为和需求信息)并对这样的 方面: 信息进行随机分析,进而及时帮助我们进行有效 1.图书馆的数字化资源。如今的图书馆在建 的智能辅助决策。(3)传感器数据:分布在图书馆 设与完善过程中已然经历了数字化的过程,数字 的不同位置与角落的传感器,对图书馆的环境和 化的图书馆占有数目庞大的数据库资源、电子书 资源不断地生成感知数据。因长时间的积累,所 资源、纸质转换资源,此外还有各类视频资源。这 获得的数据量是巨大的。(4)RFID射频数据:嵌 些数字资源总量巨大,并且拥有不断加快的增长 入RFID到图书馆相关资源中跟踪和分析数据。 速度,这是图书馆大数据中的重要组成部分。 目前国内图书馆还没有实现全面的推广,但一旦 2.海量的网络社交组成非结构化数据。中国 推广应用,将是大数据的主要来源之一。 互联网络信息中心2013年提交了《第31次中国 四、大数据技术在图书馆中的应用 互联网络发展状况统计报告》。报告中显示,我国 (一)业务管理方面的促进应用 目前即时通信使用次数已经超越搜索引擎,成为 1.图书采购环节中的线索参考作用 中国使用次数最多的网络应用,这标志着我国社 图书馆每年的文献购置费都是有限的,如何 交网络时代的到来,这就意味着会有数量巨大的 合理进行合理分布学科专业需求的形式分配,使 非结构化数据将产生,在这个基础上图书馆的智 这些购书经费恰到好处地发挥其最大效益,是一 能化、数字化、也会带来越来越多、越来越丰富的 个相当困难的问题,大数据可以帮助你解决。首 读者信息。图书馆因此可以利用大数据技术进行 先,使用大数据技术通过分析用户请求数据的服 合理收集分析,提练出有价值的信息,制定更能够 务器,你可以找到缺乏的信息资源,从而指导收集 迎合读者口味的服务。 信息资源,理顺数字图书馆的信息资源系统。其 3.浏览历史中的非结构化数据。检索数据的 次,对有需求的读者用户可以使用数据挖掘方法 浏览历史在以前是被忽略或很难得到的。我们采 模型,使用户兴趣的改变提前被发现,调整馆藏方 用大数据技术可以填补以往收集数据中很多这样 向,预先收集制定信息资源建设计划。通过对图 的空白。这些空白随着互联网的普及,诸如浏览 书馆借阅、流通状况及馆藏书库的分析、挖掘,定 历史、地理位置、人个档案等各类数据我们都可以 期整理荐构系统中的在线调查、语音邮件等建议, 从移动设备中轻易获得,这部分空白的填补使图 使之转化为标准的结构化数据库。最后,使用数 书馆管理补全了大数据技术所需的数据库,在如 据挖掘技术对互联网上无序的、非结构的数据进 此完整的数据资源的支撑下才能真正意义上地提 行分类、收集和购买学科分布合理的数据库建设, 高大数据技术为图书馆带来的核心竞争力。 使图书馆的信息资源更加完美。因此说,大数据 114— 在图书采购的环节上起到了线索参考的作用。 2.图书流通服务和参考咨询服务中的应用 图书流通服务中,在人力资源有限的情况下, 更高专指性地找到读者的需求信息。二是开发知 识服务:也就是说,从读者的研究在该领域及相关 领域的专业知识提供服务到为读者构建的研究、 开发与创新的知识数据。三是个性化服务:读者 访问过程的分析,确保对决策过程读者的跟踪和 图书馆可以按照时间序列模式以月度数据作为数 据分析的基本跨度,从流通数据库中挖掘出流通 量的变化规律与影响因素。为流通部门日常的工 作安排提供科学的参考依据。 在参考咨询服务中,随着现代科技的发展,数 综合信息服务。 (三)图书馆管理方面的应用 1.定位为图书馆服务的发展。图书馆是一个 字参考咨询服务的必要性越来越大。要求对数字 资源内容系统更深层次的挖掘和分析。如提供网 络资源导航,专题数据库等。在提供数字图书馆 实践服务系统,它应该是满足服务现实的需求,但 也要受到客观条件的限制。所以它的发展方向是 十分重要的。决定了未来图书馆的发展趋势,明 基于自然语言的语义检索系统的同时,还要具有 确自已的潜在资源,面对的读者,利用大数据中的 文本知识的挖掘功能,提供概念智能检索。此外, 挖掘技术可以科学地评价自身情况,做出切实可 声音、图像识别技术、时间序列数据相关信息检索 行的规划,确保图书馆可持续性地发展。 技术等检测手段,可以大大提高咨询服务的效率 2.为人力资源服务。人力资源管理是人力资 和质量。 源的开发的核心。图书馆事业发展的坚实的后盾 (二)读者方面的服务应用 取决于培养人才资源,如何培养人才的能力是我 1.在读者分类研究中的作用 们需要研究和规划的。目前图书馆馆员在业务素 开展对读者的分类研究是图书馆实行定向服 质水平、现代信息技术水平、外语水平等综合素质 务的重要途径。读者分类研究包括:读者分类、读 方面亟待提高。我们就可以从图书馆中的大数据 者属性和特征分析、读者满意度分析等。大数据 中搜集、整理、挖掘专家们的文献和建议,根据图 的数据挖掘分类模型就是用于提取能代表群体的 书馆自身的发展需求建立可预测、可调整、可执行 属性。图书馆可以建一个对读者详细情况进行描 的模板。为我们发现、提拔、管理优秀人才提供科 述的数据库。使用大数据挖掘技术进行读者群体 学化的依据。大数据是一项具有很高难度的前沿 细分:根据年龄、教育、职业等因素划分。针对不 技术。它的应用广泛而先进,我们应该充分利用 同层次读者的特点,采取相应的服务措施。 大数据带给我们的优势作用,将图书馆业务开展 2.在读者需求中的分析作用 迈向新的阶段。目前来讲,只有具备相关学科背 不同读者的个体或群体之间存在着明显的差 景和技术基础的人,才有可能胜任大数据分析的 异,但是相同类型的读者阅读需求的主题内容、类 重担,现阶段图书馆员在信息技术的开发利用方 型、性质、服务模式等方面却存在着共同的属性和 面能力相对欠缺。因此大数据人才的培养、图书 有序的结构。图书馆可以以读者需求为出发点, 馆员技术能力的提高,成为图书馆迎接大数据挑 建立一系列相关规则,服务读者的需求。一是集 战的重要条件。 成化服务:根据读者的需求,将主题范围内原始离 散、多样化的信息资源数据链接成一个整体。在 责任编校:李航 

因篇幅问题不能全部显示,请点此查看更多更全内容