基于石油领域本体的语义关联检索

来源 :中国石油大学(华东) | 被引量 : 0次 | 上传用户:sosen871213
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着当今社会的发展,信息量急速增长,如何在海量的数据中查询到用户需要的信息显得尤为重要。传统的检索是以查询关键字为基础,这种检索模型只有在查询关键字完全匹配的情况下才能获取查询结果,这就导致在查询过程中遗漏很多信息,不能准确地满足用户的需求。本体将概念在语义和知识层次上组织起来,具备强大的概念层次结构以及语义关系体系,能够提供逻辑推理支持以及扩展查询功能,基于本体的语义关联检索提升了系统的查全率以及查准率。本文首先对本体的定义、本体的描述语言、已有本体及其分类以及目前已有的本体构建方法等本体和语义检索的相关理论知识、研究现状进行了深入的研究;其次本文在分析已有的基于路径的语义相似度算法与基于信息量的语义相似度算法的前提下,采用多阶段级联模型对概念的语义相似度进行分阶段计算,并且利用BP神经网络对计算结果进行训练。语义相似度算法在本体应用中至关重要,它是语义检索的重要环节,语义相似度算法的好坏将影响系统检索结果的准确性。本文充分研究了传统查询检索技术,分析不同的查询扩展技术的优缺点,综合本体以及局部分析法在查询扩展技术的优势,将两者进行互补,融入到查询扩展技术中,让系统能够扩展出更多的查询候选词,从而提高用户查询的准确性。最后搭建实验环境,并且构建基于石油领域本体的语义关联检索原型系统,将改进的语义相似度算法、改进的查询扩展技术和原型系统分别进行了实验,通过查准率、查全率和F测试值等参数对查询结果进行分析,检验语义关联检索原型系统的检索效果。实验结果表明,基于石油领域本体的语义关联检索系统在查全率和查准率方面都比传统的检索模型要高。
其他文献
为了构建资源节约型和环境友好型社会,新型光电化学器件的研发近年来一直是人们研究的热点。基于光学和电化学工作机制,将绿色无污染的太阳能转化为电能和化学能,可用以制备氢能或实现对有机和无机污染物的降解和检测。值得注意的是,光电化学器件的研究重点之一便是其光电化学性能的提高。现有的大量报道表明,围绕半导体材料的光学和电化学性质构筑异质结是提高光电化学性能的一种有效方法。本论文以三氧化钨(WO_3)纳米板
氨纶是一种粘弹性材料,得益于其独特的软硬嵌段分子结构,使其具有诸如高回弹性、耐磨耐腐蚀性、耐氧化性等优异性能。氨纶分子内部具有多种氢键、微相分离、结晶等微观结构,
对以银行业为主的金融机构,其本质是在经营风险,而信用风险正是金融机构面临的主要风险。如果信用风险管理得当,对于改善银行效率和稳定金融市场具有重要影响,而认识信用风险管理和银行效率的平衡点则是关键所在。鉴于此,本文首先基于传统经济学理论,分析商业银行信用风险同成本效率、利润效率的影响作用。其次,本文以2008-2017年我国16家商业银行数据为样本,基于傅里叶柔性生产函数构建随机前沿模型,一步回归分
匹配追踪算法是一种处理不平稳信号的有力工具,能够将信号分解为一系列时频原子的线性组合。本文主要将该算法分别应用于无拉伸动校正、时频表征以及叠前弹性阻抗反演中,并对
基于18电子规则,一系列稳定的单核金属羰基配合物Y(CO)8+→Ti(CO)7→Cr(CO)6→Fe(CO)5→Ni(CO)4→Zn(CO)3已经被理论或实验研究验证。Sc+、Y+及La+等离子具有相似的电子构型,按照18电子规
硅酸盐、铝酸盐体系因普遍具有原料来源广泛、良好的物理化学稳定性、易形成多样化的晶体场环境等特点,通常被用于透明闪烁陶瓷、白光LED荧光粉的基质材料。在这两大基质材料体系中,掺杂稀土或其它激发离子后制成的荧光粉在紫外和可见光蓝区均有良好的吸收,能完美地与当前主流的LED芯片复合实现白光照明。然而,无论是铝酸盐基还是硅酸盐基氧化物荧光粉,普遍存在发射光谱中缺乏红光成分,形成的白光色温较高,色品指数低等
新田县作为湘南地区永州、郴州、衡阳三市的交界地带,其特殊的地理位置、气候环境以及聚居习惯,成为湖湘文化不可或缺的一部分。为了保护新田县传统村落与民居不继续遭受破坏,使人们的乡愁有迹可寻,通过资料查阅以及现场调研的方式,综合多学科领域的研究成果,展开对传统村落形态与民居的研究,研究样本为新田县9个传统村落,研究内容主要集中在村落的形成原因、村落的形态、民居建筑的形态以及细部装饰特点,试图找出其背后的
随机环境中的分枝过程(BPRE)是国内外概率论界研究的热点之一,其在生物学、物理学、工程学、经济学等领域中都有广泛的应用.通常,受所处空间各种因素的影响,粒子所处环境也在不断变化,所以较经典分枝过程而言,随机环境中中的分枝过程更能准确刻画粒子的变化规律.本文所研究的Poisson随机指标分枝过程(PRIBP)本质上也是BPRE.在分枝过程的研究中,分枝律的均值m的估计是重点内容之一,其中最重要的一
在试验中含有定性因子时,传统的处理方法是将其定量化,将其表示成一个或多个虚拟变量,这种方法有效但并不适用于所有情况.本文的创新之处在于在处理上述问题时考虑到定性因子对回归模型的影响的各种情况,证明了一般的回归模型中存在定性因子时的等价定理,给出了其信息矩阵的特殊分块形式和行列式以及对应的D-最优设计的理论解,并针对具体工业试验实例予以应用,给出其含有定性因子时的三种情况下的D-最优设计方案.第一章
量化投资策略是股票投资领域当前的热点问题。量化投资中最重要的是择时,因而及时把握买卖时机是在控制风险的同时追求利润最大化的关键所在。基于此,本文选择对股票的量化择时投资策略进行研究。因为择时投资策略关键在于交易买卖点的确定,因此量化择时的关键就在于股价趋势转折点的预测。支持向量机在解决小样本、非线性和高维模式识别中具有特有优势,这恰恰满足所选股票数据的要求。因此,本文选择SVM进行量化择时投资策略