信息检索中基于反向学习和聚类的数据融合方法

来源 :江苏大学 | 被引量 : 0次 | 上传用户:ttlme
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的不断发展,互联网技术已成为人们获取信息的主要途径。信息检索的首要问题是帮助用户从互联网大量信息中迅速、准确地获取用户需要的信息。数据融合技术的思路是将不同信息检索系统检索到的成员结果进行组合从而得到一个新的检索结果。之前的研究结果表明,数据融合技术能够有效地提高检索性能。线性组合法是一种常用的融合技术,其中权重分配是提升融合性能的关键问题。另一方面,融合性能不仅受到参与融合成员系统数目的影响,还与它们相互间的关系密切相关。当成员系统数目较多时,融合资源消耗增多,有必要选择出一部分合适的成员系统进行融合,使数据融合同时具有较高的有效性和实现效率,但是目前尚缺乏关于这方面的研究。本文分别从提高融合性能和实现效率两个方向着手来探索信息检索中的数据融合问题,以期改善融合时的效率。论文的主要工作如下:(1)线性组合法能够根据具体的情况对参与融合的成员系统赋予不同的权重,对成员系统进行合适的权重分配是决定线性组合法成功与否的关键因素。本文在分析了反向学习特点的基础上,首次将反向学习算法引入到数据融合中,提出了基于反向学习的权重分配策略。该方法利用和发挥反向学习算法简单、求解精度高、无需调参的特点,优化权重分配,从而提高融合结果的性能。在TREC数据集上的实验表明,与已有的一些权重分配算法相比,该权重分配策略能有效地提升融合性能。(2)针对大规模成员系统参与数据融合时,融合消耗资源多、实现效率低的问题,本文结合几何框架对数据融合的解释,提出了基于变色龙聚类的成员系统选择算法。首先,从结果列表的相似性出发,得到初始成员结果集的距离矩阵,确定其内在相互间的关系,同时采用变色龙聚类根据距离矩阵将成员结果划分成不同的簇。其次,利用贪心策略遍历不同的簇,并从不同的簇中选择成员结果,构成一组新的融合性能好、相似度较低的成员结果组,最后将其对应的成员系统作为新的参与融合检索系统组。实验结果表明,与其他方法相比,该方法能在减少参与融合成员系统的基础上维持融合性能,兼顾了实现效率和融合性能,从而提高了融合有效性。
其他文献
丁家畈遗址发现于安徽省庐江县万山镇永桥村丁家畈自然村,该遗址位于江淮地区,水源丰富,地理环境优越,是人们理想的生存之地。2018年和2019年,河南大学和南京大学考古队为配
在粮食储藏过程中,害虫是粮食的最大威胁,我国粮仓每年因为害虫造成的粮食损失达数百万吨,给国家造成了巨大的经济损失。因此,粮仓害虫的监测非常必要。目前绝大多数粮仓每年
党的十九大报告中明确提出要建设高素质专业化干部队伍,近年来党中央和国务院陆续颁布了《干部教育培训工作条例(试行)》《2010-2020年干部教育培训改革纲要》等一系列干部培
权利要求书是一项专利技术方案的载体,记载能表达技术手段的最小技术单元,处于专利制度的核心地位。由于文字是权利要求的载体,语言的不确定性和撰写人的写作缺陷会不可避免
伴随着基础课程改革的深入推行,对话教学作为一种不同于传统教学的新的教学形态成为人们关注和研究的焦点。对话教学强调师生间,学生间信息交流,通过信息交流,师生互动,最后在意义理解上达成共识。通过对话激发学生的学习兴趣,引导学生积极思考,从而也会提高学生的分析能力和创新能力。为了解目前对话教学在高中英语课堂教学中应用情况,对牡丹江市第三高级中学的300名学生和30名英语教师做了问卷调查。为了进一步了解现
清代律学研究成果斐然,私家注律在清代得到前所未有的发展,私家注律现象十分活跃,出现注家辈出、百家争鸣的盛况。注律家凭借多年从事司法审判工作总结的经验与心得,倾注毕生
“大数据”时代对信息存储的容量、速度、稳定性等指标要求越来越高,对用于存储介质材料的也提出了更高的需求。基于有机场效应晶体管的非易失性存储器,由于引入了具有分子设
第一部分:南京地区淋球菌对庆大霉素敏感性分析目的:了解2016-2017年南京地区流行的淋球菌菌株的敏感性特征,获得其对庆大霉素的敏感性数据,分析2016至2017年度庆大霉素敏感性变化情况。方法:采集2016-2017年我院性病门诊就诊的男性尿道炎患者尿道分离的淋球菌菌株,使用琼脂稀释法分别测定淋球菌对庆大霉素、头孢曲松、头孢克肟、青霉素、四环素、大观霉素、环丙沙星和阿奇霉素的最小抑菌浓度(MI
进入21世纪,我国经济发展迅猛,科学技术不断创新与进步,人们的生活水平有了很大提高,各个行业都从中受益,化妆品行业更是最大的受益者之一。爱美是女人的天性,化妆品企业为了
本文是欧·亨利短篇小说的翻译项目报告。尽管欧·亨利的短篇小说国内已有多个译本,但是大多数译本年代较为久远,且任何一本译作都不可能穷尽对原作的理解与阐释,任何一本译