您的当前位置:首页正文

基于知识使用场景的知识推送方法研究

2020-06-11 来源:客趣旅游网
基于知识使用场景的知识推送方法研究

赵晓玲;郭钢;董元发

【摘 要】针对知识推送问题,建立了基于场景的知识推送模型、场景驱动的知识库模型。采用语义相似度的方法计算知识使用场景的相似度,通过知识使用场景与知识的映射,实现与任务场景最匹配知识的推送。以某气门生产企业的工艺知识推送为例验证了该知识推送方法的可行性。%To solve the problem of knowledge pushing, the models of knowledge pushing based on knowledge usage scenario and knowledge base drove by usage scenario are proposed. Semantic similarity is used to calculate the similarity between knowl-edge usage scenario and knowledge index. According to the relationship between knowledge and knowledge usage scenario, knowledge is recognized and pushed to the task. A case study of process knowledge push in a valve production enterprise is pro-vided to demonstrate the feasibility of this method.

【期刊名称】《计算机工程与应用》 【年(卷),期】2013(000)022 【总页数】4页(P132-135)

【关键词】知识使用场境;知识推送;语义相似度 【作 者】赵晓玲;郭钢;董元发

【作者单位】重庆大学 机械工程学院,重庆 400044;重庆大学 机械工程学院,重庆 400044;重庆大学 机械工程学院,重庆 400044

【正文语种】中 文 【中图分类】TP391

知识对于提高组织的工作效率、工作质量起着重要的作用,在工作中获取知识有两种方式,被动获取和主动推送。被动获取是在组织的活动过程中通过输入特定的查询条件检索出需要的知识,但是知识泛滥、知识迷航的现象使得检索知识需要花费大量的时间和精力;主动推送是知识搜索引擎根据知识使用场景主动推送知识,知识推送能够很好地解决知识迷航等现象,是知识获取、重用的重要发展方向。 目前,国内外学者对知识推送进行了大量的研究工作。KWANMM、潘旭伟等提出情境是知识建模的重要因素,将情境信息保存在知识库中,使创造和使用知识在一定的情境下进行[1-3];MAI提出基于用户兴趣的搜索引擎方法,分析用户的历史信息发现用户感兴趣的信息,然后挖掘相似用户群组中的有用信息返回给服务对象[4-6];方凌云在分析企业知识流程明晰化模型的基础上,研究了企业内部员工个性化知识需求模型及兴趣相似度,提出了满足企业内部员工个性化需求的知识推送系统模型[7];乐承毅等从知识属性、流程、领域三个维度对企业知识进行了描述,在此基础上构建了面向流程的领域知识推送架构,提出了流程驱动的领域知识推送方式[8];石美红等针对知识泛滥、知识迷航等现象提出了一种基于业务过程和知识需求的知识推送系统[9];王生发等面向产品设计提出了一种基于知识管理的、以工作流驱动的、产品设计的知识主动推送体系结构[10]。目前虽然在知识推送方面进行了一些研究,但是如何将知识与任务匹配,使知识能够更好地服务于企业的任务过程充分发挥知识价值的研究还比较少。

本文面向知识管理重点研究知识推送,提出一种基于知识使用场景的知识推送方法,包括基于场景的知识推送模型、场景驱动的知识库模型、基于语义相似度计算的知识使用场景搜索匹配算法及算例验证等。

人们在企事业单位从事工作的时候所有的工作均以任务的形式下达、分配,任务执行者凭借自己的学识和经验来完成任务。任务执行者在执行任务时通常会遇到如下情况:任务执行者具有一定的能力但是从未从事过该类的工作;任务执行者从事过该类工作,但由于时间久远或从事的工作太多而无法清楚地记得该类工作实现的关键技术方法;任务执行者能力不足需要借鉴企业已有的知识体系等,此时如何获取与执行任务最匹配的知识就成为了首要问题。目前,大多数企事业单位知识获取的方法有如下几种途径:(1)通过企事业单位资料室或者任务承担者自己搜集的资料查找纸质形式的知识;(2)通过企事业单位内部信息系统查找电子形式的知识;(3)通过互联网查询相关的知识,如CNKI、中国国家数字图书馆等;(4)通过购买专利或专有技术获取知识等,这些方式查找知识需要花费一定的时间、精力,而且通过人工方式被动地查询知识有可能找不到所需的知识,因此出现了知识迷航等现象,为了解决知识被动查询中出现的问题,本文构建了一种基于场景的知识推送模型,如图1所示。

在图1中,基于场景的知识推送模型是从知识的使用场景出发,知识推送的步骤如下:

步骤1任务创建者根据该项目所处业务领域内企业已有的规范化流程制定该项目的具体业务流程,业务活动节点分解到最小子任务并确定子任务的基本属性信息即任务场景的特征属性。

步骤2任务执行者接收任务进行任务准备即输入任务具体的场景参数,最小子任务绑定任务场景形成知识使用场景并发出知识推送服务请求。

步骤3知识推送引擎接收请求并对服务请求做出响应,对最小子任务知识使用场景参数与知识索引参数进行相似性匹配,得到最匹配的知识索引。

步骤4任务执行者启动任务则触发知识启动器,知识推送引擎通过步骤3得到的最匹配的知识索引与知识通过映射关系搜索到知识,并将知识推送至最小子任务。

步骤5任务执行者执行任务,即知识重用。

场景驱动的知识库由两部分组成:(1)知识索引,为了实现带场景驱动的知识库需要构建知识的索引即知识的使用场景;(2)知识的分类结构,知识分类存储在数据库中。场景驱动的知识库通过场景参数与知识索引参数之间的相似性比较得到相似性最高的知识索引,然后通过知识索引与知识的映射关系搜索与场景最匹配的知识。根据知识使用场景与知识索引相似度比较的需求。本文提出基于语义相似度的场景相似度搜索匹配算法,实现知识推送引擎的知识匹配。

场景驱动的知识库模型还包括对场景驱动的知识库的录入与维护:(1)场景驱动的知识库由知识提供者录入与维护知识索引;(2)场景驱动的知识库由文档管理员录入维护知识分类结构、知识索引与知识的映射关系,场景驱动的知识库模型如图2所示。

4.1 基于场景的知识推送模型描述

对知识推送模型中涉及到的知识使用场景和知识进行模型描述,为知识的推送奠定基础。

(1)知识使用场景模型描述。根据图1的知识推送模型对知识使用场景进行描述。C_Task={C_TPD,C_TN,C_TID, C_TD,C_TU,Input,Output,S_Time,F_Time},其中 C_TPD、C_TN、C_TID、C_TD、C_TU、Input、Output、S_Time、F_Time分别表示任务所属业务流程编号、任务名称、任务编码、任务描述、任务执行者、任务输入、输出、开始时间、结束时间;P(P_Name,P_Attr),其中P_Name表示任务输入的名称,表示任务输入的具体属性。

(2)知识模型描述。知识依附于载体而存在,知识在使用的时候需要通过知识使用场景进行信息索引。知识的信息包括知识本身和知识使用场景,知识可以表示为:T(T_Item,T_Meta,T_R),其中T_Item表示知识,T_Meta表示知识使用场景,T_R表示知识与知识使用场景之间的映射关系。T_Item={T_IN,T_IC,T_MD,

T_IL},其中T_IN、T_IC、T_MD、T_IL分别表示知识名称、知识编码、知识所属领域、知识存储位置;T_Meta={T_MN,T_MC,T_MK},其中T_MN、T_MC、T_MK分别表示知识使用场景名称、知识使用场景编码、知识使用场景属性;T_R={K_IC,T_MC}表示知识与知识使用场景之间的映射关系。 4.2 算法描述 4.2.1 向量空间模型

知识使用场景由相互独立的属性 (Ti1,Ti2,…,Tij)构成,每个知识使用场景属性Tij根据其对知识使用场景的重要程度不同赋予一定权值(wi1,wi2,…,wij)。 一个知识使用场景Ti表示为一个向量:Ti=(wi1,wi2,…,wij)。 4.2.2 语义相似度计算

词汇语义相似度的计算方法有两类,一种是利用大规模的语料进行统计计算,一种是基于某种世界知识或分类体系来计算。基于世界知识的方法简单有效,无需用语料库进行训练,比较直观,易于理解,能够比较准确地反映词语之间语义方面的相似性和差异[11]。本文采用基于世界知识的语义相似度计算方法。

语义相似度可以用向量之间的夹角或距离来表示,其夹角或距离越小表明词汇的相似度越高[12]。知识使用场景由相互独立的属性构成,本文定义的知识使用场景相似度是其所有属性之间相似度的加权平均值。知识使用场景属性之间的余弦相关性公式如式(1)所示[13]。

式中,cos(Ti,Q)表示余弦距离,Ti表示已有知识场景项,wij表示已有知识场景项第 j属性对应的权值;Q表示待匹配场景项,qj表示待匹配场景项第 j属性对应的权值;属性的权值通过计算属性特征值在文档中出现的次数获得。

本文以某气门生产企业工艺设计知识推送为例,工艺知识与特定的气门零件特征相对应,气门零件特征属性即为知识的使用场景,通过气门零件特征的相似性比较得到与待匹配知识使用场景最相似的气门零件,然后将该气门零件所对应的与知识使

用场景最匹配的气门工艺知识推送至该工艺设计任务,实现基于场景的知识推送。知识推送的流程如图3所示。

由于篇幅有限,对案例数据进行了适当简化,现以编制k0气门过程流程图为例。 待匹配知识使用场景即k0气门零件的特征描述如表1所示。

该知识使用场景的向量表示为Q=(1.5,1.0,0.7,0.2,0.2,0.1,0.3,0.6)。 企业已有知识库中知识使用场景T1,T2,T3,T4,T5的描述如表2所示,其知识使用场景向量为:

按照式(1)的余弦距离公式,计算Q与T1,T2,T3,T4,T5之间的余弦距离: 计算结果表明,已有知识使用场景T2与Q之间的余弦值最大,是与待匹配知识使用场景相似度最高的知识使用场景。

根据知识使用场景与知识的映射关系T_R={K_IC,T_MC},将知识库中T2知识使用场景相对应的知识主动推送至待匹配知识使用场景Q。

为了发挥企业知识价值、实现知识推送,本文建立基于场景的知识推送模型,场景驱动的知识库模型,利用语义相似度在解决文本相似度计算方面的特点,进行知识使用场景相似度计算,并通过知识使用场景与知识的一一映射关系将最匹配的知识推送至待匹配的知识使用场景。以某气门生产企业的工艺知识推送为例,给出了基于知识使用场景知识推送方法的实际应用。

【相关文献】

[1]Kwanm M,Balasubramanian P.Knowledge scope:managing knowledge in context[J].Decision Support Systems,2003,35(4):467-486.

[2]潘旭伟,顾新建,程耀东.集成情境的知识管理模型[J].计算机集成制造系统,2006,12(2):225-263.

[3]施星国,张丹,包振强.基于知识情境的知识重用与创新机制研究[J].管理工程学报,2009(2):7-10.

[4]Ichirok,Mais.A study on information recommendation system that providestopical

information related to usersinquiry for information retrieval[C]//Proceedings of the 2006 IEEE/ WIC/ACM InternationalConference on Web Intelligence andIntelligent Agent Technology.WashingtonD C,USA:IEEE,2006:385-388.

[5]周明建,廖强.基于属性相似度的知识推送[J].计算机工程与应用,2011,47(32):135-137. [6]赵杨.基于语义网格的数字图书馆知识推送服务系统研究[J].情报科学,2007,25(12):1869-1883.

[7]方凌云.基于知识流程的企业内部知识推送系统研究[J].科技进步与对策,2010,27(9):138-141.

[8]乐承毅,代风,吉祥.基于流程驱动的领域知识推送研究[J].计算机集成制造系统,2010,16(12):2720-2727.

[9]石美红,王婷,陈永当.基于业务过程和知识需求的知识推送系统[J].计算机集成制造系统,2011,17(4):882-887.

[10]王生发,顾新建,郭剑锋.面向产品设计的知识主动推送研究[J].计算机集成制造系统,2007,13(2):234-238.

[11]刘群,李素建.基于知网的词汇语义相似度计算[C]//第三届汉语词汇语义学研讨会,中国台北,2002:59-76.

[12]Steinbach M,Karypis G,Kumvr V.A comparison of document clustering techniques[C]//Proceedings of the 6th ACM-SIGKDD InternationalConference on TextMining.Boston,MA,USA:ACM Press,2000:103-122.

[13]克罗夫特.搜索引擎信息检索实践[M].刘挺,秦兵,张宇,译.北京:机械工业出版社,2010:144-146.

因篇幅问题不能全部显示,请点此查看更多更全内容