【摘 要】
:
由于在Web数据抽取与集成、数据挖掘与机器学习、统计数据分析和传感器网络等应用领域中大量的对不确定性数据进行有效的存储与管理的需求,不确定性数据处理技术成为近年来学
论文部分内容阅读
由于在Web数据抽取与集成、数据挖掘与机器学习、统计数据分析和传感器网络等应用领域中大量的对不确定性数据进行有效的存储与管理的需求,不确定性数据处理技术成为近年来学术界关注的热点研究问题之一。与传统的数据库相比,存储在不确定数据库中的数据往往是不准确的,从而查询的结果也是不准确的。这使得查询结果对输入数据的灵敏度分析问题成为不确定数据库中迫切需要解决的关键问题。本论文对不确定数据库中的基本查询结果和Top-K Ranking查询结果的灵敏度分析问题进行了深入的研究,实现了不确定数据库中查询结果的灵敏度分析机制,使得用户可以理解存储在数据库中的哪些概率值的变化对查询结果的影响最大,并且可以修改错误的概率值以得到正确的查询结果。本文的主要创新点如下:对不确定数据库中的基本查询提出了基于偏导的灵敏度分析方法,对于具有安全计划的查询将灵敏度分析算法从平方量级的时间复杂度优化到线性的时间复杂度。对不确定数据库中的Top-K Ranking查询结果的灵敏度分析问题进行了分类,提出了模块化的灵敏度分析方法,并设计了最优算法、累积贪心算法和非累积贪心算法。累积贪心算法和非累积贪心算法在准确度和运行时间方面做了权衡。累积贪心算法具有更高的准确度,非累积贪心算法具有更快的运行时间。另外,本文还对基于属性级别的不确定数据模型和PRF框架的Top-K Ranking查询的算法进行了改进,使得运行时间从当前最好的立方量级的算法降为平方量级的算法,并且进行了有效的剪枝策略的设计,进一步减少了程序的运行时间。本文在实际数据集和测试数据集上进行了大量的实验,验证了所提出的算法的有效性。
其他文献
巷道围岩塑性区大小是评价围岩稳定性的重要依据及进行巷道支护设计的理论基础。一般圆形巷道所受原岩应力场为非均匀应力场。通过对圆形巷道围岩的力学分析,获得了围岩主应
从人的价值角度探讨体育化人的价值,可以看出体育的价值不仅体现在增强体质的功效上,更重要的是体现在人格的培养功能上。参与体育的过程,一方面增强肌体功能;另一方面学会公
近几年,我国社会经济发展迅速,民众物质生活水平得到了较大程度的提升,民众在生活中越来越注重对精神层面的追求,对戏曲提出了新的要求。戏曲为谋求在新时代的发展,不断对传
NP难解问题是理论计算机科学的主要研究对象,对NP难解问题提出实际有效的固定参数可解算法是理论计算机科学中的一个新的研究方向。参数计算方法是求解实际应用问题的一种新
针对我国粮库地域分散以及现行的人工监管方式引起的虚库、偷盗、虚报贴息等不良现象,给国家造成巨大经济损失问题,本文提出了以下两种粮食数量智能识别方法。基于SFS(Shape Fro
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
为解决目前林木装备在作业时由于林区环境、地形复杂、障碍物的存在而导致的工作效率较低,危险较大的问题。本课题拟基于二维激光测距仪和红外热像仪来对林区环境信息进行采
目的:研究手术对非小细胞肺癌(NSCLC)外周血微转移的影响。方法:对70例NSCLC患者、18例肺部良性疾病患者于手术开始时、结扎肺静脉时和结扎肺静脉后1小时取外周静脉血,采用逆
提高高职院校学生的专业技能和素质,必须紧跟当前社会发展的步伐,将"工匠精神"贯穿于人才培养模式之中,落实到每一门课程教学与实践环节里,做到与企业需求紧密结合,加强培养
从大尾寒羊粪便中分离纯化枯草芽孢杆菌(Bacillus subtilis),绘制生长曲线。在LB液体培养基中添加5、10、15、20、25、30、40mg/mL和50mg/mL的香蕉和山楂多糖溶液,以及0.5、1