基于语义的信息检索方法研究与应用

来源 :浙江大学计算机科学与技术学院 浙江大学 | 被引量 : 0次 | 上传用户:xinfan413
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息检索的目的是从海量数据中找出符合用户需求的信息。在互联网应用中,存在大量关于信息如何检索的需求,这些需求分布在各个应用中,这种情况一方面导致大量冗余工作的产生,另一方面,由于传统关系数据库的局限性,造成了信息检索效率过低和检索结果的查全率、查准率不高的问题。针对以上问题,本文在查阅国内外最新文献和研究成果的基础上,对于信息索引的可移植性提出了一种基于语义本体的可配置信息索引方法,对索引结构的各项组成、属性约束进行分析,同时对分布式架构的组成和自适应调整过程进行总结,通过本体技术对索引结构和分布式结构建立语义本体模型。同时对于提高信息检索的查全率和查准率问题,本文将基于用户行为的查询扩展方法和基于词频统计的查询扩展相结合,设计了一个基于Web语义的查询扩展结构。通过对索引结构和分布式结构所建立的本体模型进行规则推演和应用,结果表明该方法具有高度的可配置性和可扩展性。最后使用搜狗搜索引擎共享的查询日志和语料库对基于Web语义的查询扩展方法进行实验和分析,结果表明该方法在查询语义扩展、检索结果扩展以及查询结果的准确率上具有良好的性能。
其他文献
在科学技术日新月异发展的今天,随着互联网中各种应用日益丰富,网民希望计算机网络是一个有利于身心健康发展的网络,避免看到不良信息;公司的管理者希望避免员工在网络上泄露
提高公共文化服务水平对于提升民族文化软实力具有重要意义,构建完善的公共文化服务体系逐渐成为当今世界热点。而纺织品文物作为我国文物遗产里的璀璨珍宝,研究纺织品文化数字
随着二十一世纪科技的不断发展,生物识别技术也得到了大量的普及与应用。但单一的生物识别技术必定存在它的缺点,如外界因素影响、恶意仿制与破坏系统、单一识别技术的局限性
煤矿是工业生产中伤亡事故最严重的行业,尤以瓦斯事故所造成的人员和经济损失最大。近10多年来,随着开采深度的进一步加大、高强度机械化采掘和集约化生产,自然灾害的威胁更
近几年来三维模型获取的软硬件技术正不断深入,人们可以通过多种数据采样方法来获取现实物体的计算机表示,并对之进行预处理,加工,分析和应用。这种通过逆向工程来获取的三维数据
情境感知计算是普适计算的一个重要研究方向,其目标是使系统能根据情境信息的变化自适应地为用户提供与用户当前任务相关的计算服务与信息。其中,建立一个有效的推理机制是关
由于信息技术的飞速发展,数据爆炸已成为焦点,因此海量数据传输成为人们关心的热点研究课题。但是,在传输过程中如何处理时延以及如何选择最优路径成为一大难题,因此数据传输
随着生活水平的不断改善,人们对家居环境的要求日益提高,智能家居应运而生。其在具有传统居住功能的基础上,通过物联网技术实现家居设备的互联、自管和自控,从而为住户提供一
供应链协调问题指的是供应链成员利益与运作矛盾的协调,它决定着成员企业的协作效率,是供应链管理中的核心问题。供应链是典型的、需要协调的系统,协调是供应链稳固和运行的重要手段,通过这种协调机制,使得买卖双方既能使自身利益增加,又能使对方受惠,同时也能使得整个供应链具有较好的柔性,达到整体为先,兼顾公平的目标。本文将多Agent理论引入供应链协调,着重对由多供应商、单生产商、多分销商构成的供应链进行研究
仿真内窥镜路径规划主要任务是如何完成管腔的中心路径的提取,要想快速准确地进行仿真内窥镜自动导航,一个首要的任务是要先提取出管腔器官的中心线以指导摄像机视头的移动,导航路径是仿真摄像机视头移动和获取内窥场景图像的重要基础。本文针对仿真内窥镜系统中的路径规划问题,结合快速距离变换和最大生成树方法,提出了一种基于边界距离场的中心路径抽取算法,该算法提取的中心路径可以直接应用到仿真内窥镜系统中;同时,设计