基于检索结果聚类的XML伪相关文档查找

来源 :计算机科学 | 被引量 : 0次 | 上传用户:yuanjie119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统伪相关反馈容易产生“查询主题漂移”,有效避免“查询主题漂移”的首要前提是确定高质量的相关文档,形成与用户查询需求相关的伪相关文档集合。在检索结果聚类的基础上,研究了XML伪相关文档查找方法,在充分考虑XML内容和结构特征的前提下,提出了基于均衡化权值的簇标签提取方法,并以此为基础,提出了候选簇的排序模型和基于候选簇的文档排序模型。相关实验数据表明,与初始检索结果相比,排序模型获得了较好的性能,有效地查找到了更多的XML伪相关文档。
其他文献
针对贵州电网数据中心存在的配置信息难以管理和有效使用的问题,引入本体技术对配置信息进行语义管理,提出了一种四元组定义的配置管理本体模型,并以现有的配置管理数据库、
《计算机科学》杂志系“中文核心期刊”、“中国科技论文统计与分析用期刊”、“中国期刊方阵双效期刊”和“中国科学引文数据库来源期刊”。主要报导国内外计算机科学与技术
近期,香港历史博物馆举行“历久常新——旗袍的变奏”展览,展出270多件不同时代及款式的旗袍珍品。此次展出的旗袍琳琅满目,远至清代女装长袍,近至2008年北京奥运会礼仪小姐所穿
运动捕获数据行为分割的目的是将长序列数据划分为单个运动类型短片段的序列集合,使集合中每个片段具有特定的运动语义。针对相邻运动片段的过渡区间存在部分运动帧序列的语义归属歧义,提出了一种结合双特征的运动捕获数据行为分割方法。该方法首先从原始数据中提取角度和距离两组不同类型的运动特征集,并分别基于PPCA方法构建规格化的综合特征函数;然后利用子区间标准差阈值限定方法分别对综合特征函数进行粗分割,从而将运
高空翼伞是新型降落伞,这种伞能在空中作远距离的滑翔和飘移,可使空降兵在距目标相当远的距离跳伞,然后滑行至目标区着陆。本文介绍了这种伞用绸的技术要求,从撕破强力、透气量和
Kate Middleton王妃的蕾丝衣袖婚纱礼服及美国女影星Reese Witherspoon的绯红色婚纱礼服犹如一块巨石,在婚纱时尚界中激起阵阵波澜,更是受到众多准新娘的风靡追捧。
我国产业用纺织品占总纺织品的比重一直徘徊在11%~14%之间,与国际上先进国家服用、装饰用、产业用纺织品三分天下的差距较大。本文介绍了第五届长三角科技论坛国际纺织分论坛上演
4.涤纶超细织物染色时怎样染色深色?应注意什么?涤纶超细纤维主要由细旦丝、异截面丝、异收缩丝等组成。由于涤纶超细纤维线密度较小,表面积较大,表面反射光增加,结晶度高,纤维结构