概率数据库查询结果分级中的数据模型改进

来源 :第二十三届中国数据库学术会议(NDBC2006) | 被引量 : 0次 | 上传用户:tseysaw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种数据模型的改进方法,利用改进后的数据模型和相应算法,只需要对所有元组进行一次扫描,就可以得到需要的多个CondScore和GlobScore,并得出最终的Top-K元组,相比文中建立大量的中间表,连接中间表时对TID的属性值多次进行扫描,本文算法在保证分级质量的前提下,不仅可以节约建立中间表的空间,还可以显著降低表连接过程中多次扫描元组TID的时空开销,从而提高了分级算法的效率。
其他文献
导航系统的运作方式简介在互连网上怎样高效地管理、组织信息,以及为普通公众提供简洁方便的信息检索,称为互连网信息导航.目前普遍是通过建立互连网信息导航站点,来引导用户
会议
Model-Driven Architecture(MDA)是由OMG组织于2001年2月提出的用模型技术进行软件系统开发的方法和标准体系,它代表了现代软件开发理论与方法发展的主流趋势.可以预见它会成
会议
海量数据来源于科学统计和计算的结果(例如:地震监测、天气预报等),并被存储在科学统计数据库(Scientific and Statistical Databases,SSDB)中.SSDB有如下特点:①关系的模式
会议
在企业信息系统中隐藏着大量结构化、半结构化及非结构化存储的文本信息还没得到有效利用.结构化存储的文本信息隐藏于关系数据库内部,而传统关系数据库管理平台文本信息检索
会议
本文针对普通用户自然语言提出查询请求,结合XML文档检索的新特征,分析了XML文档中自然语言查询的模糊内容和结构检索结果排序的影响因素.充分利用答案结点的逻辑意义完整性,
会议
本文通过理论和实验的分析,在采用了新的压缩方法和索引表结构等手段,DM4的全文检索系统所存在的两大问题,即空间膨胀率过高和索引填充时间较长的问题,已经得到了很好的解决.
少数民族大学生作为高校特殊的群体,在多元体育文化中经历着文化与情感上的冲突,在漫长的文化适应和个体发展之后,最终选择一种体育融创角色;这种角色将持续不断地得到发挥,
本文对传统的全局颜色直方图进行了改进,提出了一种简洁的描述图像颜色空间分布的模型--扇形模型图.这种模型既考虑了图像的颜色特征和分布状况,又兼顾了计算的简便性,是图像
由于传统的关系数据库存在着数据存储冗余和查询效率低下等缺陷,近年来图数据库的应用越来越广泛,其上的查询也成为人们研究的问题. 本文中要解决的Top-k顶点度查询问题如
会议
中国的诗歌艺术渊源流长,诗歌作为一种最接近口语的大众化文学形式,在汉语文化的成长演变与传播中占有极其重要的地位,唐代的诗歌更是集古代诗歌的优势于一身,并且把诗歌艺术
会议