金融信息精确检索中本体构建与查询扩展方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:luo000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的飞速发展,越来越多的人开始注意到Internet的存在,并通过它来发布和查找信息。尽管Internet上有海量的信息,人们还是常常感到不能找到符合自己要求的信息。随着Internet上数据的不断增加以及人们对查询质量的要求不断提高,传统的Web检索技术已经很难满足高质量的检索任务。人们试图将各种先进的思想和方法引入信息检索领域。基于本体论的语义网技术对于新一代搜索引擎的发展起着重要的作用,同时也促进网络信息检索技术向高精度智能化方向发展。本文通过构建金融年报本体及语义网,通过对查询扩展的研究来实现语义网搜索引擎的精确检索。  本文首先介绍了本体的定义、构建准则、描述语言、构建方法及开发工具,详细地阐述了本体的应用领域及其发展现状。通过对金融年报领域的分析,应用恰当的本体构建方法及语言建立金融年报本体。金融年报本体的建立标志着金融年报知识库的完善,利用知识库中的术语对金融年报网页进行语义标注,构建金融年报语义网。在标注的时候尝试采用两种方法,手工标注和自动/半自动化标注。标注好的语义网以XML格式存储,为了结构化显示语义网,为语义网建立XSL样式表与之对应,把XML转换成HTML格式显示。  然后,本文介绍了本体技术在语义网搜索引擎中的应用。除了利用本体构建语义网搜索引擎的实验环境,还利用本体中术语及术语之间的关系,对用户的查询请求进行扩展,并在搜索过程中使用本体技术进行关系匹配,从候选答案中筛选出最能符合用户要求的结果返回给用户。  最后,对搜索引擎的评估标准作了详细的说明。利用多组不同关系的关键词组合对搜索引擎进行测试,发现在利用本体进行查询扩展和查询分析之后,搜索引擎的查全率和查准率有了大幅度的提高,从而可以看出利用本体进行查询扩展和分析有效地提高了搜索引擎的性能。
其他文献
随着科学技术日新月异地发展,现实中的工程优化问题逐渐向复杂化、高难度发展,优化问题的求解方法已经成为一个非常重要的研究课题,而高维、不可微等复杂问题已经无法用传统
近来,随着我国正式加入WTO,如何提高国内企业的竞争力已经成了各方关注的焦点.很多企业都已经认识到,选择信息化是必由之路.然而,我国企业信息化建设的现状却是水平较低、企
随着计算机图形技术的发展,地形的三维表示比平面地图表现出更多的优势。三维地形的表示和生成技术是计算机图形学研究的热点之一,具有浓厚的学术意义,并广泛应用于军事、教
入侵检测是近年来网络安全研究的热点,随着计算机安全问题的日益突出,对入侵检测系统提出了更高的要求,当前IDS的最大问题是不能快速检测出新出现的异常入侵和较高的误报率。
光是一种电磁波,是信息传播的终极载体,通常由电场和磁场两个分量来描述它的性质。然而,从某种意义上来讲,光只有“一只手”,因为当它与传统材料的原子相互作用时,通常只考虑电场的
本论文是结合中国刑警学院校园网项目完成的。随着中国刑警学院校园网中各种应用系统的增加,每个系统有自己的账号管理方案,并且它们互相不信任,给各个系统的整合带来了巨大的负
近年来,随着多核CPU硬件体系结构的普及与SMT同步多线程技术的发展和成熟,多核CPU以其强大的并行计算能力越来越成为研究领域中的热点。人们已经开始研究使用多核CPU对多种数
本文介绍基于OPC(Object linking and embedding for Process Control)和消息中间件的数据集成技术,以及数据集成后的应用平台开发。系统是为提升企业信息化程度、满足企业对
本课题主要研究内容包括IPv6试验床的建设、BGP-4+路由协议在IPv6网络中的实施、全球IPv6 BGP路由信息分析与可视化研究。为此,主要进行了以下几方面的工作: 首先,建立了
在传统体数据可视化领域中,实现真实感效果的方法占据了主导地位,但是,大多数绘制方法面临一个难题,即如何调整绘制参数,使得结果能恰好显示出感兴趣的信息。与之对应地,近几