最大和网络搜索结果多样性问题及其贪婪策略分析

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:hwwacm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的迅猛发展,网民人数的不断增多,互联网资源库中的信息也在呈指数倍地上涨,搜索引擎作为人们在海量信息中获取有效信息的重要检索工具正在受到越来越多人的青睐。在实际检索过程中,用户体验到搜索引擎带来的便捷的同时,也感受到了大量无效信息所带来的困扰,用户常常需要在庞大的结果集合中对信息进行筛查、选择或者细化检索内容,才能定位到自己感兴趣的信息。一方面,由于用户在关键词的“输入长度”、信息结果的“浏览长度”等方面具有“懒惰性”,利用关键词对所需信息进行查询时,用户往往通过给定较少的关键词,要求搜索引擎在结果的前几页显示自己所需信息。另一方面,关键词本身具有广泛的语义、搜索系统一次呈现结果存在数量上的限制。因此,系统常常不能快速地呈现用户的真实需求,返回多而繁杂的搜索结果集不仅耗费了用户大量的时间,还降低了用户的搜索效率。论文从提高搜索引擎效率,提高用户检索满意度的角度,考虑了不仅产生同搜索关键词相关,而且各个结果之间最好应具有能够覆盖关键词多个意义的网络搜索结果呈现问题,给出了该问题的贪婪策略,分析证明了贪婪策略具有的近似性能比。论文的主要研究工作如下:1、本文从搜索结果集合的相关性和多样化两个角度出发,建立了搜索结果多样性问题的数学模型。通过对问题模型的求解分析,得出该问题的算法结果集合,并将其与问题的最优结果集合进行比较,证明策略的有效性。同时,分析了余弦距离相似度条件下搜索结果多样性问题的近似性能比。2、用户往往是通过对搜索结果集合进行筛选而寻找到所需信息,对信息的筛选就是浏览信息的过程,浏览量越多,结果集合同关键词的总体相关性就越高,但每条信息给用户带来的边际满意度随之而降低。针对这一情况,运用非负的单调次模集合函数度量搜索结果问题的相关性,在此基础上建立数学模型,设计了贪婪策略,研究了单调次模情形下的网络搜索结果多样性问题,分析证明贪婪策略具有较好的近似性能比。3、在日新月异的网络信息世界中,不同的时间点用户对同一关键词的信息需求可能会不一样。为了满足用户不断变化的信息需求,本文将通过对静态结果集合中元素的调整,研究信息具有动态性特征的网络搜索结果有效呈现问题。4、为了验证策略的有效性,我们根据近似思想对其进行了仿真实验,实验结果表明,贪婪算法具有很好的理论近似比。本文的分析及结论丰富了现有的搜索结果多样性问题的研究,为相关问题的进一步深入探索奠定了理论基础,对实际搜索结果多样性问题具有一定的理论指导意义。
其他文献
过去十多年,有关非认知技能的研究迅速增长,并成为教育和经济领域的新兴热点.到目前为止,人们对非认知技能的重要性和可培养性达成共识,但在有关概念、内涵和如何测量的问题
应用题叙事是社会数理生活方式的镜像.应用题的人物关系及其话语特征表征了学生的数理生活语境与价值结构.应用题的编写机制、叙事门类与方式,折射了特定时期数学教育的目标
本研究探讨外来工子女感知的教师正义对其学习动机的预测作用,以及学业控制感和求学无意义感在其中的中介作用.泉州市某公立外来工子弟学校小学部和初中部的181名4-8年级学生
针对大部分已有的遥感图像去噪算法在去噪的同时不能有效的保留细节和增强边缘,提出了一种基于Cycle Spinning Contourlet变换和总变分最小化的图像去噪新算法.该算法依据了C
当今社会,人的活动范围、接触面前所未有地扩大,也因而更加需要宽容.对宽容的理解有“消极的”,也有“积极的”,但宽容的“积极概念”实际上不是宽容,而是与宽容并行的另外一
为探讨学校制度如何影响学生品德,本研究以制度情境观为理论基础,以民主化、道德化为作用机制,采用倾向性道德敏感性量表以及自编的学校制度情境量表、民主化量表、道德化认
21世纪是属于跨文化交际和全球化的世纪.随着国际交流的增多,英语作为国际沟通工具而得到了广泛的应用.在传播发展的过程中,英语不可避免地与其它国家和地区的语言和文化产生
创造力是推动数学发展的源动力.中小学生创造力培养正成为评价数学教育水平的重要指标之一.中国基础数学教育取得了国际公认的成绩,但如何提高学生的数学创造力却面临挑战.本
动态与文摘采用БeЛA3-75125型自卸汽车的经验阿衣哈里斯克(Axack)采选联合企业自1993年就开始采用2辆载重量为120t的БeЛA3-75125型自卸汽车,其运行结果表明了别洛露西亚汽车制造厂生产的该型汽车的一些优缺点
期刊