基于对等网的内容语义搜索技术研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:LittleMeteor
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展以及海量数据管理需求的日益增加,对等网技术在网络应用领域起到了越来越重要的作用。如何发布数据以及如何对分布在网络中各个节点上的数据进行基于语义的高效搜索,逐渐成为了一个重要的研究方向。在这种趋势下,本着对基于对等网语义搜索技术实例化研究的目的,本文设计并实现了Mariana系统。 Mariana系统基于DHT分布式路由技术,实现了在对等网之上文档信息的发布存储功能,并构建了P2P网络上的语义搜索引擎,使用户可以透明地从P2P网络中获取信息,实现基于语义的信息搜索和查找。 本文详细介绍了Mariana系统的设计原理及实现过程,分析了设计实现过程中所遇到的问题,总结了期间的经验;并结合对等网语义搜索技术的理论基础,对如何实现对等网内容语义搜索系统进行了深入地研究。 文章的研究重点包括以下几个方面: 一、如何在对等网上建立基于语义的信息管理系统。 研究了当前主流的全分布式结构化对等网技术,着重分析了DHT网络在精确匹配查询和内容语义检索之间的矛盾。进而提出了基于关键词语义扩展查询技术的搜索方案。 二、如何利用文本语义抽取技术实现语义网络的构建。 利用基于朴素贝叶斯模型的中文关键词抽取方法所生成的关键词,动态构建语义节点关系图,进而生成具有语义搜索能力的关键词语义网络。 三、如何利用已构建的语义网络,设计搜索算法,从而达到基于语义搜索的目标。 在方面二的基础上,基于关键词的“重要度”,关键词之间的“关联度”以及文档与关键词之间的“匹配度”,提出了对对等网中信息进行语义搜索的一系列排序算法。
其他文献
在无线通信系统中,由于多径衰落及码间干扰的存在,对信号的传播产生重要影响。分集接收是抗衰落的一种有效途径。常见的分集方式有:空间分集、时间分集、频率分集、角度分集等。
人们一直期待着实时传输视频图像信号,而实时视频传输首先需要解决两个主要问题:如何获取数字视频信息?怎样对获取的视频信息进行有效的压缩编码以减少数据量?信息获取取决于高
随着无线通信业务的发展,可利用的频带资源变得日益紧张。然而在另一方面,很多已被授权的频谱资源的实际利用率是非常低的。认知无线电技术正是针对这一状况提出并发展起来的
本文主要探讨了有限冲激相应信道下无线多载波通信系统中常见的问题,对多载波信号抗多径干扰的能力在连续时间域和离散时间域分别予以理论分析证明。通过研究数字信号处理以及
移动通信技术发展日新月异,人们在享受3G网络带来的便捷的同时,也察觉到了 3G网络的弊端,如某些区域3G信号不强或者存在干扰等,这都会严重影响用户的3G体验。目前国内各大通
本文研究的重点是如何实现远距离更多用户倍增。 首先介绍了xDSL及SHDSL技术,特别是SHDSL承载语音技术的优势,其次详细分析了基于SHDSL技术的用户线路倍增系统的组成及功能,
IP网,无线通信网等网络环境中的实时视频传输是一件具有挑战性的工作,因为它要求视频信号必须具有很高的压缩效率和友好的网络接口设计。 H.264是ITU和ISO联合制订的新一代
移动通信中继站是组成完整移动通信系统不可缺少的一部分,软件无线电是无线电通信的发展趋势,中频部分数字化是软件无线电关键技术之一,本文以软件无线电理论为基础,讨论了直放站
随着通信技术的快速发展和网络接入技术的不断提高,多种无线网络同时存在。网络间既彼此竞争又互相补充,构成了异构无线融合网络。其中,以WLAN与3G网络融合最具代表性。WLAN
本文的研究思路就是以提供自适应业务特征为核心,在Parlay/OSA结构的基础上讨论新的NGN业务体系结构,对NGN自适应业务依据功能进行分类,并分别介绍了各种自适应业务的基本概念和