摘要:对数据流上的Ad Hoc查询进行自适应处理,需要保证已有查询计划快速在线更新和迁移,但现有方法实现新旧查询计划的更新需要大量的滑动窗口状态转换。为此,提出一种Ad Hoc查询自适应处理算法。该算法基于数据流概要分布特性和自定义评分模型,快速计算出现有查询计划的最佳增量更新,以实现新到达的 Ad Hoc 查询处理,降低新旧查询计划切换时间。在数据流benchmark Linear Road提供的高速公路数据集上进行实验,结果表明,与MS、PT方法相比,该算法可较快完成新旧查询计划的切换。
XML关键字检索系统的数据源选择
随着互联网数据爆炸式的增长,信息检索系统逐步采用分布式多数据源架构存储数据,在关键字检索时,选择与用户查询的关键字相关度大的数据源进行查询对提高检索效率显得格为重要.提出一种基于关键字检索的XML数据源选择方法,针对XML文档结构的层次特性,提出一种递归定义的结果评分模型,将结点的关键字频率与路径长度递归地加入到评分模型中,使得评分模型能够准确地评判结果的优劣.同时,利用评分模型定义并提取了XML数据源的摘要,并给出了摘要存储中涉及的压缩、优化、更新等问题的解决方案及算法.根据摘要信息,提出4种数据源选择的方案,并使用DBLP数据集来验证了文章所提出的数据源选择算法的有效性.
一种新的基于路径的XML模式聚类方法
大部分已有的XML模式聚类方法中,对模式相似度的衡量主要是基于元素相似度的,这些方法不能全面地度量模式间结构上的差异所造成的语义上的区别.提出了一种新的基于路径的XML模式聚类方法,它基于一种新的XML模式相似度度量模型,该模型可以综合挖掘模式中元素、结构及其语义上的相似性,并计算出每个模式对应的特征向量;从而将模式间的相似性转换为它们各自对应的特征向量间的余弦相似度.实验表明,提出的方法在聚类质量上明显优于已有方法.
XML关键字检索的访问控制规则和索引
XML数据库的关键字检索简单易用,并且用户不必了解数据库的模式,近期受到人们的广泛关注.当前的相关研究主要集中于关键字检索的算法以及返回结果的组织和排序,然而却忽视了关键字的安全访问控制问题.结合XML关键字搜索和XML安全访问控制,提出一种新的建立于XML Schema上基于角色的访问控制规则SRACP( Schema Role Access Control Policy),并在SRACP规则的基础上建立安全的XML关键字检索的索引(SRACP-Index),包括:SRACP-Index的数据结构,SRACP-Index的构建和算法,以及如何利用SRACP-Index的建立进行SSLCA的查询.最后通过实验证明该索引和SSLCA查询算法的有效性.
不确定数据库上的top-k关键字查询
关系数据库上的关键字检索和不确定数据处理过去一直是两个独立的研究方向.研究了运用关键字方法检索不确定数据的问题,定义了不确定关键字查询的基本模型和语义,提出了一种在属性级粒度的不确定数据库上进行top-k关键字检索的算法.该算法根据用户指定的k值,计算并返回分数最高的前k个结果,其查询结果的评价函数综合考虑了结果与关键字的相关度和结果在可能世界语义下的概率大小,对算法进行了优化,显著降低了计算复杂度.最后通过实验,证明了算法的高效性和实用性.
质量驱动的Web服务Top-K查询
在Web服务发现领域中,引入Top-K查询且同时考虑服务质量的研究相对较少.针对这种情况,
提出一种重点考虑质量的Web服务Top-K查询方案.在该方案中,规范化服务的质量数据,给出质量评价函数,根据质量定义服务之间的从属关系,并且改进传统Top-K查询的门槛算法,提出收敛速度更快的StopLine算法.实验表明,该算法能更快地得到前K个服务,效果良好.
安全访问控制的XML关键字检索
摘要:XML(extensive makeup language) 关键字检索简单易用,用户不必了解数据库的模式,受到人们的广泛关注.当前的相关研究主要集中于关键字检索的算法以及返回结果的组织和排序,却忽视了其中的安全性问题.结合XML关键字搜索和XML安全控制,研究了基于安全访问控制的XML关键字检索技术.在XML关键字的最小最低公共祖先(smallest lowest common ancestors,SLCA)和基于视图的安全访问控制规则的基础上,确定基于安全访问控制规则的XML关键字检索结果;建立基于安全视图的关键字索引,以及在此基础上的关键字检索算法.实验表明,为了满足安全访问控制规则,该算法虽然需要额外的时间开销但总体上是高效的.
基于结构摘要的XML关键字检索
摘要:基于最低最小公共祖先(SLCA)的XML关键字搜索语义,提出一种使用XML结构摘要(summary)对关键字进行索引的方法XKSS.XKSS索引方法通过避免重复存储大量XML树上的含义相同的节点,大幅度降低了索引的空间耗费,并提高了查询性能.基于XKSS建立的索引,提出一个算法SSB-SLCA来计算SLCA节点.实验表明,基于XKSS的关键字搜索方法能够更高效地寻找关键字的SLCA.
XML流管理研究综述
摘要:近年来,XML流管理是数据流研究领域中的一个热点研究问题.不同于传统数据库管理系统,XML数据流管理系统需要在使用少量内存的情况下随时处理在线到达的数据流;由于XML流具有递归的、层次的结构,并且用户兴趣通常用XML查询语言来表示,因此,XML流管理技术与关系型数据流(基于元组的数据)管理技术有很大不同.综述XML流管理技术及各项研究成果;指出XML流管理系统的特点;比较了当前典型的XML数据流管理系统;系统地阐述和分析当前国内外已有的XML流数据处理方法(包括基于自动机的方法、基于索引的方法,基于序列的方法)和流处理的相关优化技术;指出尚需进一步研究的问题.
基于结构语义的XML关键字搜索 摘要:XML关键字搜索是一个用户友好的信息发现方法,非常适用于XML文档不存在schema的情况,但问题是用户在关键字搜索中很难准确地表达搜索语义.现有的主要XML关键字搜索的研究是基于SLCA(最小最低公共祖先)方法,但该方法可能会丢失一部分有意义的结果.提出一种新的基于语义距离的模型,更全面地考虑XML文档结构的语义特性;在该模型的基础上,设计了多种算法将彼此语义相近的关键字结点聚集在一起形成XML关键字搜索结果,并用大量实验对几种算法进行了比较.
XML流上的关键字查询算法 摘要:针对当前XML流过滤研究中存在的问题,使用关键字查询方法作为解决方案.提出最右包含边界的概念,结合一个虚拟栈实现用于在XML数据流上进行关键字查询的XVirtualStack算法.理论分析和实验结果证明,该算法具有高效性.
针对XML流数据的复杂Twig Pattern查询处理
摘要:XML流数据处理在研究领域引起了研究者的广泛兴趣.针对XML流数据的、具有嵌套
AND/OR谓词的复杂Twig Pattern查询处理,提出一种新方法.为了提高查询处理性能,将所有Twig Pattern合并为一个共享前缀的查询树,其中,AND/OR谓词被表示为单独的抽象语法树,因而能够以文档顺序、单遍地处理复杂Twig Pattern的匹配,并避免了YFilter中对嵌套谓词进行后置处理所产生的中间结果.实验结果表明,该方法能够有效改善Twig Pattern的处理性能,尤其是在处理大文档的情况下.基于已有的研究工作,讨论如何利用DTD(document type definition)的结构和约束信息优化Twig Pattern,即这种优化是在系统运行前进行的预处理.
在O/R Mapping时保留的Java Collection特性
摘要:根据国家\"863\"项目中对复杂对象的存储与建模的研究,一种Java collection O/R mapping的实现方法被提出,该方法可以在mapping的过程中保留collection的特性,并且由于在mapping整合了collection在Java中的继承层次关系,因此在查询时可以有效分地进行类型转换.
面向对象的Web工程 摘要:分析了Web应用的特点和目前所面临的一些问题;基于面向对象的概念,提出了多层次、多视图的Web应用开发模型,以对象作为建模的基本实体,提供了Web应用的高层描述,支持Web服务的任意粒度的抽象、封装、重用以及Web导航特性的分析;提出了基于XML的面向对象Web建模语言OOWML并实现了编译工具,能够自动生成Web应用的目标语言.与已有的方法相比,本文提出的模型为Web应用的工程化开发提供了更有效的支持.
基于状态图的Web导航模型及其特性分析 摘要:WWW的指数级增长和Web应用的复杂性,需要系统化的方法和模型以支持Web应用的开发,导航建模是Web应用开发的特殊需求.提出了基于状态图的Web应用的导航模型,清楚地描述了复杂、动态的Web应用的导航特性,简化了系统的维护,并提出了导航树的概念和构造算法,能够有效地分析Web应用的导航特性,如可达性、死锁等.
Web应用开发的两层体系结构建模 摘要:随着Intemet的迅猛发展,Web已经成为各种应用的主要平台.在Web应用的开始阶段,只是一些简单的网站,将Web作为信息中介和信息发布的平台,这时候所提供的工具只是集中于网页的创建和编辑,如HotMetal编辑器和微软的nontPage,它们都限于被动的超文本表示以及一致的跨网页的布局和部分的导航模型.随着网站的规模和复杂度日益增加,它所承担的任务已不仅是简单的基于Web的数据发布,也包括了信息系统的构建和复杂的应用逻辑,我们将这一类应用统称为Web应用.
因篇幅问题不能全部显示,请点此查看更多更全内容