【摘 要】
:
随着互联网技术的高速发展,网络信息量也随之飞速增长,如何从海量的信息中搜索出用户需要的信息成为当前热门的研究课题,搜索引擎作为互联网信息检索技术得到了广泛的应用,垂
论文部分内容阅读
随着互联网技术的高速发展,网络信息量也随之飞速增长,如何从海量的信息中搜索出用户需要的信息成为当前热门的研究课题,搜索引擎作为互联网信息检索技术得到了广泛的应用,垂直搜索作为信息检索技术在搜索方面的延伸,在很大程度上提高了搜索的性能,然而这种基于关键词的传统搜索引擎无法对互联网的信息提供语义级的组织,理解和处理,无法保证查准率。查询扩展作为一种能够有效改善检索性能的方法,得到了广泛的应用,随着语义web和本体的发展,使得信息以结构化的形式表示,并能够利用本体描述其中的语义。本文就在此基础上提出了一种基于本体的语义查询扩展方式,能有效解决传统查询扩展方式带来的许多语义理解错误,并建立一个基于本文中的语义查询扩展方法的垂直搜索引擎概念模型,利用行业领域本体对用户提交的关键词进行语义查询扩展,进而提高查询的查全率和查准率。本文的主要内容组织如下:第二章首先介绍了本体的概念和技术,并建立一个关于计算机领域的本体片段,然后对语义web的概念进行了论述;第三章介绍查询扩展技术的发展,并对广泛应用的多种语义查询扩展方法进行了论述;第四章详细阐述了一种基于本体的语义查询扩展方法,首先提出了在本体中计算概念相似度的方法,利用概念相似度进行概念扩展,然后提出了一种基于窗口模型的文本标注方法,使用本体对文档进行标注后形成的文档-概念索引进行扩展,最后使用排序算法对结果集进行排序;第五章主要针对本文提出的语义查询扩展方法,建立一个垂直搜索引擎的概念模型,并概括了实现细节。第六章阐述了本文建立的实验系统,并对实验结果进行了对比分析。
其他文献
随着科技发展,机器人产业的应用和需求与日俱增,人类生活各领域如工业、农业、教育、国防等逐渐出现机器人的影子。因此,机器人学是一个重要且极具广泛应用价值的研究课题。
XML以其扩展性、结构性、平台独立性和自描述性等诸多特性,越来越多的信息采用XML格式进行存储和交换,XML已经成为Web上信息表示和交换的标准。大量XML数据的出现给XML的存储和
生物命名实体识别是生物医学文本挖掘的关键步骤,只有正确地识别出生物命名实体,才能有效地完成基因(蛋白质)标准化和蛋白质-蛋白质相互关系抽取等更加复杂的工作。然而,由于生
随着个人媒体设备的快速普及和互联网技术的出现,现实生活中图像的数量急剧增长,因此如何快速有效地组织和管理这些图像成为一个研究热点。与此同时,各种新兴技术的迅速发展
恶意代码作为信息技术的衍生物,对网络安全领域的威胁日益严重。恶意代码分析工作具有十分重大的意义。通过对恶意代码运行机制的深入挖掘可以获得其内部详细信息,进而作为恶
随着经济的发展,企业内部以及企业之间日益膨胀的企业活动需要工作流技术的支持,因此对工作流系统的可用性、灵活性、效率性、安全性提出了更高的要求。企业不仅需要一个能够定
进入二十一世纪,现代科技的发展正推动着各行各业的革新。教育事业作为立国之本,也在科学技术的推动下,产生了巨大的进步。现代社会的学习形式发生了很大的变化,我们正从单一的课
由于国内宽带网络的出口带宽瓶颈和服务器处理能力的限制,传统的基于C/S模式的流媒体分发系统,为了支撑不断扩张的客户群,需要购买越来越多的服务器硬件和带宽资源,从而导致
随着网络的高速发展,越来越多的实时业务在网络中传输,这些业务对数据传输的带宽、延时、抖动都有更高的要求。服务质量QoS成为研究的热点。QoS的研究目标是有效地为用户提供
近年来随着各个行业数据量的大幅度增长,如金融,电信行业等,使得存储费用和管理费用也随之增长。面对信息量不断膨胀的问题,数据库系统采用压缩数据的方法保存数据,同时为了提高压