基于二次搜索的搜索引擎技术研究

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:abel1500
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
搜索引擎已经发展到今天的第四代----主题搜索引擎,它始终向着专业化和个性化方向发展。搜索引擎无论在主题爬行技术方面还是在其推进主题服务模式方面都有着良好的发展。然而,针对有着共同兴趣的群体,目前的搜索引擎在满足其信息需求方面还显得有些乏力。为此,论文针对现有搜索引擎的不足,提出主题搜索引擎的解决方案,实现搜索引擎的主题化需求,并就方案中涉及到的一系列理论和技术问题进行研究,主要包括:(1)重新界定了主题搜索引擎的概念,改进主题搜索引擎的模型框架,给出基于主题的元搜索引擎的工作原理。(2)主题爬虫技术是主题搜索引擎的核心技术之一,论文将蚁群算法引入到其中,这样就使主题爬虫能够根据用户的查询行为与兴趣进行对网页的遍历,更能提高主题爬虫的爬行效率。(3)论文提出主题推荐技术以获得更适合于有共同兴趣的群体的主题描述,通过改进常用的主题描述方法,建立一种基于蚁群算法爬行结果的主题树,并给出主题向量表示。(4)论文依据二次搜索的理念,给出通用搜索引擎与使用二次搜索的搜索引擎的工作原理。并详细介绍了二次搜索中所用到的主题推荐技术,给出主题推荐技术的算法。最后,重新设立主题搜索引擎的性能指标,并根据这些指标做出实验,验证使用二次搜索的主题搜索引擎的优越性。
其他文献
[目的/意义]对联邦检索研究进行梳理,总结发展现状,明确发展方向。[方法/过程]在大量文献调研的基础上对联邦检索研究进行总结和评述。[结果/结论]联邦检索包括数据集描述、
在人类社会的发展过程中,领导活动无处不在,它影响着一个社会发展的进程和方向。而领导力作为领导活动中最为重要的一个因素,是领导活动高效率进行的内在动力。领导者作为领导活
信息安全是各种网络应用不可避免的问题,身份认证、权限管理和访问控制是信息安全的重要部分。授权管理基础设施(Privilege Management Infrastructure,PMI),是在PKI解决了信
柯九思(公元1290-1343)字敬仲,号丹丘生,浙江天台人。他的画,山水、花鸟俱佳,尤以画墨竹闻名。元代画竹依据画法不同可分为两派:工笔勾勒青绿设色者为“画竹”;以水墨写意者
背景:网络技术的飞速发展使得人们能更方便地获取健康信息,但由于网络信息发布不同于传统媒体,质量难以保证,缺少医学背景的用户若没有被指导如何获取准确的信息,就可能获取不利的
政府信息是社会信息资源的一个极其重要的组成部分。政府信息公开是实现信息资源共享的关键,是促进社会经济发展的重要方式。2007年国务院通过《中华人民共和国政府信息公开条
创新教育是素质教育的具体化和深化,创新教育的核心是培养学生的创新精神和实践能力。小学生数学学习是一个主动建构知识的过程。对学生来说,获取数学知识需要再现类似的创造过程,不是被动地吸收课本上的现成结论,而是一个充满丰富生动的思维活动过程。因此,小学数学创新教育可以涵盖为以培养学生的创新意识、创新思维、创新能力以及创新个性为目标的创新教学活动。  根据小学生从具体形象思维向抽象逻辑思维过渡的特点,加强
我国是一个食品药品生产大国,也是一个食品药品消费大国。随着人民群众安全意识的提高,以及假冒伪劣食品药品案件的不断曝光,食品药品安全问题已日益成为全社会关注的“焦点”。
临沂市是山东省花生生产第一大市,推广种植高油酸花生品种有利于该市花生产业转型升级.本研究对24个新引进高油酸花生新品种的丰产性和脂肪酸成分等进行评价,并以此为基础筛
商品经济时代,一切有交换价值的商品都有价值测度的需求。目前人类社会已经进入知识经济时代,知识管理成为知识型组织生存和发展的重要任务和主题。因此,知识产品的价值测度