Web数据库查询结果个性化分类方法研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:a345333488
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的不断发展,网络上的在线数据库越来越多,许多用户可以通过Web站点提供的查询接口来访问Web数据库中的信息,这种在Web中可通过查询接口访问的在线数据库,被称为Web数据库。对于Web数据库,由于普通用户对数据库的存储内容和存储结构并不十分了解,或者查询意图本身就比较模糊不清,因此他们通常很难准确、完整地表达其查询要求,所提交的查询条件可能只是对查询结果的一个试探性要求,从而导致了数据库返回大量与用户查询意图相关性不高的结果。  为了解决多查询结果问题,研究者们提出根据用户偏好对查询结果进行排序和分类的方法。但是,大多数的研究工作都假设用户具有相同的偏好,而在现实生活中,不同的用户会具有不同的偏好。为解决用户偏好的多样性问题,本文提出一种基于改进决策树算法的数据库多查询结果个性化分类方法。该方法分为两个处理过程:第一步是离线处理,该过程分析系统中所有用户的查询历史,并在原始数据集上产生一个元组聚类集合,每一个集合对应一种用户偏好类型。第二步是在线处理,当用户查询到来时,向用户提供一个在这些聚类上的导航树,使得用户能够方便的选择与其偏好相匹配的聚类子集。在此基础上,用户可以在选择的偏好聚类上对结果进行浏览,排序或再分类。导航树的构建使用了改进的决策树算法并且考虑了构建导航树的代价,能够在保证最小代价的前提下提供最好的分类结果。  实验证明,本文提出的Web数据库查询结果个性化分类方法能够很好的满足用户需求和偏好,与解决同类问题的分类方法相比,具有较高的分类质量和执行效率。
其他文献
长期以来,过程感知信息系统的研究主要是从过程建模和过程实施的技术角度出发,而对其所表现出的过程价值性却关注甚少,这主要表现在:(1)传统的成本分析方法将PAIS系统与一般软件
以XML文档形式发布和查看数据库已经成为时下研究的热点。这种方法主要来自于XML的普及,利用XML提供的工具可以对封装信息实现可视化处理。本文研究了这种方法为模糊数据处理
无线传感器网络(Wireless Sensor Networks,WSNs)由随机分布的集成了传感器、数据处理单元和通信模块的微小节点通过自组织的方式构成。它借助于节点中内置的形式多样的传感
提高软件可靠性是软件开发的重要课题之一。软件可靠性手段包括分析、测试和验证等,其中测试的投入往往占系统开发总成本的很大比例,因此测试效率的提高可以有效缩减成本。但
随着我国城市化进程的不断加快,铁路客运市场需求不断快速增长,传统的人工售票方式已经难以满足大流量旅客快速乘车购票的需求;另一方面高速铁路客运专线建设尤其是京津客运
随着新时期军队的数字化,具有快速、高精度、高稳健性等突出优势获取DEM数据的多基线InSAR技术,已经成为获取虚拟战场地表信息最具潜力的观测新技术之一。但目前国内外多基线
随着Internet的快速发展和普及,网络化应用大量涌现。Web应用是Internet中典型的应用,近年来也出现了多种被业界概括成Web2.0的应用类型。Web2.0应用包括博客(Blog)、播客(Podc
模式识别技术已经在社会的各个领域发挥着巨大的作用,是一个具有重大科学意义的研究领域。信号波形轮廓形态的分析和识别是模式识别应用中的一个重要技术,具有广泛的应用。句法
现实世界许多应用中的数据,不是有限的离散数据集,而是无限的连续数据集。这种由连续、无限、随时间变化的数据项组成的有序序列被称为数据流。数据流的到达速度及数据量一般是
互联网科技蓬勃发展,新技术术语层出不穷。云计算、大数据、物联网等信息通信技术的发展,互联网+与各领域的融合,AI浪潮推动使互联网行业的竞争格局新变化。及时发现互联网新技