基于语义网的金融年报搜索引擎的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:youzhangyale
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网上的信息量越来越大,搜索引擎已经成为检索网络信息不可或缺的工具。然而日益增长的电子信息量使得目前的通用搜索引擎越来越不能满足用户精确检索信息的需要。  本课题研究的目的在于将语义网思想和垂直搜索技术相结合,为实现精确搜索探索新的途径。  语义网文件具有半结构化的特性,本文从这种结构特性出发详细设计了基于语义网的垂直搜索引擎的主要功能模块,达到内容级精确搜索的目的。  本文以上市公司金融年报为语义网基本内容,初步实现了一个基于小规模语义网的搜索引擎,用户在输入查询关键字之后能够得到一系列包含用户可能感兴趣的内容段,并可以针对金融年报的数据信息进行数字比较搜索。  本文的研究内容主要包括以下几个方面:(1)分析构建小型金融年报语义网的方法。  (2)研究在语义网环境中基于XML文档的搜索引擎的设计方法。(3)详细分析和设计搜索引擎的索引模块和搜索模块。  (4)通过试验分析语义网搜索引擎的优势和不足。  本文通过试验初步实现了上市公司年报语义网搜索引擎的主要模块,并对其性能进行了分析。对语义网络搜索引擎的工作原理和实现进行了探索。
其他文献
目的 规范临床微生物标本采集和送检,提高病原微生物的检出率,为临床疾病治疗提供有效信息.方法 现以我院2018年10月至2019年9月送检的1880例微生物培养及鉴定标本为观察对象
高性能计算技术是一个国家竞争力和科研实力的重要标志之一,并行计算技术受到各国的广泛重视。科学与工程计算中的很多问题的求解都依赖于并行计算技术。但目前的并行计算技术
目的 分析在医院药房管理中应用临床合理用药方案的实际价值.方法 选择自2017年3月至2018年3月我院医院药房执行的1000张处方及108例患者纳入对照组(实施药房规范管理前),选
现阶段,我国卫生统计与健康信息在开展模型建设的过程中,面临信息数据不全面、信息统一程度不足等一系列问题.本文对卫生统计与健康信息相关内容进行简单总结,提出卫生统计与
本文系统地研究了工作流过程定义中的复用问题,提出了一种基于复用的过程定义方法,该方法不再采用一切从零开始的方式进行过程定义,而是复用过去积累的知识与经验,能有效地降低过
经济发展与社会进步,促使国家医疗卫生领域得到迅速发展,信息化建设作为二十一世纪国家发展的主要特色,国家卫生部门提出增强卫生信息化及卫生统计工作建设的目标,并对于统计
本文从静止图像压缩理论出发,在分析JPEG2000标准的核心编解码算法的基础上,对JPEG2000标准中的码率控制算法进行重点研究。根据率失真理论,对于给定码率,可以对小波变换后的各个
当前高校医疗制度实践应用过程中,仍然存在诸多的现实问题亟待解决,高校教职工较为高昂的医疗费用难以得到有效的保障.因此,本文立足于高校医疗制度所存在的问题,进一步明确
  本文结合“共享信息的第二类网络”课题,通过HTIP/DVB传输研究,分析共享信息的第二类网络,了解其关键技术及核心思想,掌握HTIP实现框架;深入研究了共享信息的第二类网络数据链
随着互联网技术的迅速发展,在线中文网页的数量迅猛增加,互联网上的信息量越来越大。搜索引擎能够有效地组织和分析海量的信息资源,帮助用户迅速地获取其所需要的知识和信息。然