【摘 要】
:
互联网上的信息与日俱增,随着信息检索技术的发展,用户已经能够通过Google,Yahoo,Baidu等搜索引擎提供和查询接口查询互联网中大量的文本数据库而得到一部分用户所需要得到的信息.然而,互联网上的更多信息是包含在网页后台的关系数据库中的,访问这些数据库需要用户了解数据库的数据模式,并且熟悉结构化查询语言,这对于普通用户来说太困难了.因此,提出了一种新的查询算法,并且在查询算法中加入短语的识别
【机 构】
:
中国人民大学信息学院 北京 100872
【出 处】
:
第二十五届中国数据库学术会议(NDBC2008)
论文部分内容阅读
互联网上的信息与日俱增,随着信息检索技术的发展,用户已经能够通过Google,Yahoo,Baidu等搜索引擎提供和查询接口查询互联网中大量的文本数据库而得到一部分用户所需要得到的信息.然而,互联网上的更多信息是包含在网页后台的关系数据库中的,访问这些数据库需要用户了解数据库的数据模式,并且熟悉结构化查询语言,这对于普通用户来说太困难了.因此,提出了一种新的查询算法,并且在查询算法中加入短语的识别,增加那些包含用户查询中重要短语的返回结果的权重,使得它们在返回给用户时处于前列,让用户更加满意返回结果,提高查询结果的有效性。
其他文献
本文研究了由一个无风险债券、m个风险证券股票组成的金融市场,股票价格遵循转移几何布朗运动,在有固定交易成本下,以最大化财富的长期增长率为目标的最优投资组合模型.通过转化为一最优停时问题,给出了求解最优交易策略的一种方法和数值例子.
在过程工业生产中,随着产品市场需求的变化,企业的生产负荷也要随之做相应的调整.在石化生产装置上,调整生产负荷是一个相当复杂的过程.本文针对某丁二烯生产装置,在DeltaVDCS系统上,通过对装置的控制回路进行改造,应用顺序控制策略和专家系统策略,设计了全自动负荷升降系统,并成功地投入实际的应用,从而解决了生产负荷调整带来的人力物力浪费与生产不稳的问题,提高了生产效率.
对一类含有时滞与Brownian运动的线性跳跃系统,考虑了随机保性能控制问题.这类系统是一类混合系统,由两部分构成,第一部分是系统的模式,第二部分是系统的状态,模式可以用连续时间离散状态的Markov过程来描述,在每一个模式中,状态可由一个随机微分方程表示.基于随机微分方程稳定性理论,给出了随机保性能控制器存在的充分条件.通过求解一系列关联线性矩阵不等式,无记忆状态反馈控制器的参数化形式被获得.进
本文研究了具有随机输入状态稳定(SISS)零动态的随机非线性系统的全局输出反馈镇定问题,用积分反推法构造性地设计了一个输出反馈控制律,在一般性条件下,证明了闭环系统概率意义下的全局渐近稳定性.所得结果将文献[6]从被控系统没有不可观测动态情形推广有SISS不可观测动态的情形,将[10]的线性反馈框架拓展到非线性反馈控制,将[11]的确定性非线性系统推广到随机非线性系统.
读者到图书馆借书时,要在短时间内借到自己满意的图书并不是一件容易的事.提出了一种基于决策树的图书推荐模型,根据图书馆中所存储的读者借阅信息进行分析,从图书的主要读者类型、借阅效率等方面向读者推荐.为了让读者有直观的认识,运用了多种可视化技术将图书借阅数据显示给用户,也能帮助用户快速检索反映其兴趣偏好的图书.
GML是一种基于XML、用于地理空间信息表示和交换的地理标记语言.随着越来越多的空间数据以GML格式发布和存储,查询GML空间数据已成为亟待解决的问题。GML基于XML,XML查询技术也可应用于GML,但GML许多不同于XML的特性使得这些查询技术并不完全适用于GML.W3C推出的XML标准查询语言XQuery只适用于GML非空间数据查询.在XQuery的基础上,参考GML查询语言GQL,添加空间
XML关键字搜索是一个用户友好的信息发现方法,非常适用于XML文档不存在schema的情况,但用户在XML关键字搜索中很难准确地表达搜索语义。现有的一些XML关键字搜索的研究是基于SLCA(最小最低公共祖先)方法,这种方法返回一组被称为SLCA的结点,一个SLCA结点满足:1)标签中或者后代结点的标签中包含所有关键字;2)没有任何一个后代结点是SLCA.SLCA方法的主要缺点是可能会丢失一部分有意
压缩数据库技术是海量数据管理的重要技术之一.利用海量高频度数据自身特点,提出了一种基于属性划分的海量高频度关系数据压缩存储方法。该方法通过存储非高频度数据的数值及其位置信息来减小存储海量数据的空间需求,从而有效地支持选择、投影、连接等基本操作.理论分析和实验结果表明这种压缩存储方法可以显著提高海量数据的存储效率和数据操作的性能.
P2P环境下的数据管理具有高可扩展性,可以为数以万计的用户提供数据管理服务.多维范围查询是数据管理系统中一项不可替代的基本查询功能.然而,当在P2P环境下一个范围查询涉及大量节点时,执行查询的时间代价和网络带宽消耗非常巨大而且无法避免.提出了一种P2P环境下的anytime多维范围查询处理方法。在查询处理过程中,算法不断地计算当前已获得结果的质量。如果已获得结果的质量满足用户的要求,查询处理算法可
随着硬件技术不断发展,特别是容量越来越大的内存,具有高性能的内存数据库逐渐成为人们研究的热点.然而,内存数据库的高性能却严重依赖于内存容量,由于内存容量受内存技术、服务器技术和操作系统位数的制约,可扩展性不好。针对这一问题,我们提出了可扩展内存数据库系统ScaMMDB.首先,我们介绍了ScaMMDB的体系结构,并重点介绍了RCAP(远程列访问协议)和EPM(扩展并行MAL语言);我们从体系结构和列