语义标记在搜索引擎中应用的研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:qwer32173
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
搜索引擎技术给人们的生活、工作和学习都带来了非常大的影响,随着互联网上信息的不断丰富,人们在信息筛选上需要付出的时间也越来越多,如何应用语义匹配技术来优化搜索引擎的工作效率也变成了越来越迫切的问题。本文先从爬虫、倒排表、查询排序三个部分对搜索引擎的工作原理做了总结,介绍了三个部分所关心的问题和挑战。在分析关键词检索方法的基础上结合目前互联网上网页持续增加的背景,分别分析了影响查全率和查准率的主要因素,并针对这些问题提出了解决设想,得出了搜索引擎的两个发展估计:一是搜索引擎需要互联,二是准确率会成为主要问题。在提高准确率的问题上,本文用语义匹配来弥补关键字匹配的不足,结合相关文献分析了语义的性质,介绍了前人在语义分析方面的成果,如义素分析法、语义场、语义网络。讨论了语义定义和语义度量的研究成果。在语义标注上,本文对语义网标注语义的方法做了通俗的总结,分析了语义网在搜索引擎中处理上的优势。设计了在搜索引擎中应用和处理语义标记以提高准确率的实验方案,并进行了程序实现。本文最后还介绍了自动语义标注的研究思路,对基于统计的自动标注方法进行了程序实现,给出了实现步骤。
其他文献
随着经济的发展及贸易的全球化,跨地域的沟通交流日益频繁。人们需要快速便捷的沟通交流方式,来满足日常工作的需求。多媒体会议系统支持两个及以上不同地方的个人或群体,通
随着具有Wi-Fi功能的智能手机的推广和移动Ad-hoc网络的不断发展,智能手机之间通过Wi-Fi直接互联变成可能。Magic-hookup系统正是基于移动Ad-hoc网络,实现了两部手机之间直接
随着云计算和大数据技术的发展,机器学习技术成为学术界和企业界的热点。然而机器学习涉及大量理论知识,同时机器学习模型包含大量参数,需要有丰富的经验才能设计一个高效的模型
为了满足低成本、无主站快速独立组网的应用需求,北京邮电大学无线通信与电磁兼容实验室提出了一种SCPC-TDMA(Single Channel per Carrier-Time Division Multiple Access,称
随着互联网上诸如VoIP、实时视频等服务的部署,端到端的网络性能越发的引人关注,尤其在报文延迟和丢失方面。研究表明,路由协议对故障事件的反应特性,特别是路由收敛时间,对
随着互联网的蓬勃发展,各种新兴网络应用不断出现。这些应用在为用户提供各种网络服务的同时却消耗大量带宽,影响网络关键业务的正常进行。网络应用采用的新型加密方法和动态端
随着计算机技术的发展,嵌入摄像头的移动终端逐渐普及,相应的图像和视频应用也迅速发展,而移动终端屏幕尺寸导致的交互局限性使得图像和视频浏览管理系统更需要人性化、智能
计算机早已经大范围普及,智能手机等多媒体通信终端设备也在迅猛发展,伴随着3G(3rd Generation)牌照在中国的颁发,中国的电信产业也进入了一个全新的时期。人们对于移动通信
随着网络技术的发展,网络规模越来越大,而且网络用户及承载业务种类与日剧增。用户需求不仅仅是网络可达性,而是针对不同业务种类从经济、性能方面提出不同的需求。传统互联
智能交通系统(IntelligentTransportationSystem,简称ITS)是将先进的无线通信技术、传感器技术以及计算机技术等有效地应用于整个交通运输网络,从而建立起一种在大范围内、全