基于IVHFS的数学表达式检索结果排序方法研究

来源 :河北大学 | 被引量 : 0次 | 上传用户:xieyl2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息检索技术的飞速发展,人们获取信息的方式也日益多样化,高效地获取更接近人们需求的信息成为信息检索的一个重要内容。与一般文本信息检索内容不同,数学表达式表达形式多样、语法语义变换丰富的特点给基于数学表达式的检索及其结果排序带来了困难和挑战。因此,如何利用数学表达式复杂结构和语法语义特性,实现基于数学表达式的科技文献检索,对于提高信息检索技术的有效性和适应性具有重要意义。通过对数学表达式特点的分析与归纳,提出一种基于IVHFS(Interval Valued Hesitation Fuzzy Sets,区间值犹豫模糊集)的数学表达式检索结果排序方法。利用区间值与犹豫模糊集在完整保留属性信息,实现多属性决策方面的优势,改善数学表达式检索结果排序的性能。首先,通过对数学表达式符号、结构、语法、语义特征的分析与归纳,确定数学表达式检索结果的排序属性;然后,建立数学表达式子式空间结构属性、运算符关联属性以及运算数关联属性等数学表达式排序指标的区间值犹豫模糊元素,并进而构造数学检索结果表达式与数学查询表达式的区间值犹豫模糊集合;最后,采用IVHFS相似性测度计算数学查询表达式与数学检索结果表达式的相似度,按照相似度得到数学表达式排序的最终结果。采用公共数据集NTCIR-12_MathIR_Wikipedia_Corpus的31,742个文档中所含528,188个La Te X格式数学表达式为实验数据集,对本文方法进行数学表达式检索结果排序实验,其平均排序合理指标为0.7812,表明基于IVHFS的数学表达式检索结果排序方法可以有效避免传统评价方法在进行数学表达式属性信息评估时所存在的片面性问题,具有较高的排序效率和合理性。
其他文献
导热系数是材料的热物性参数之一,导热系数的准确测量有着非常重要的理论意义和使用价值。防护热板法是目前为止测量绝热导热材料导热系数最准确的绝对方法,但是近年来中国计量科学研究院开展的国内绝热材料导热系数测量的比对结果显示,不同实验室、不同来源的防护热板导热仪的测量偏差达到±15%。分析比对结果,认为产生测量差异较大的关键原因是导热仪的温度测量和控制水平不高,急需一种精确控温的方法和热控制系统,来提高
运动目标检测与跟踪技术是计算机视觉领域的一个重要研究课题,已经被广泛应用于安防、交通管理、机器人视觉。通过搭载视觉传感器获取视频图像信息,已成为移动机器人平台感知环境的重要方式。本文基于单目视觉研究NAO机器人运动目标检测与跟踪应用实现。由于实际应用场景复杂多变,现有的算法不能满足实际应用的需要。针对经典Camshift算法应用于机器人目标跟踪过程中遇到的问题,分别从目标检测和目标跟踪两个方面进行
在全球范围内,肺癌的死亡率居各种癌症之首。肺结节是肺癌早期的发病症状,准确检测与治疗肺结节对降低肺癌患者死亡率具有重要意义。目前,肺结节的筛查与诊断主要通过计算机断层扫描(CT)图像来实现。然而,肺结节在CT图像中尺寸不固定、形态多变,且易与肺内血管、器官等组织混淆粘连,因此,准确检测肺结节是一项十分困难的工作。随着深度学习在医学图像中的发展和应用,使人工智能技术辅助医生快速诊断肺结节已成为可能。
随着数据的爆炸式增长,越来越多人开始关注大数据问题。由于大数据具有规模大、维度高、数据复杂且变化速度快的特性,导致传统的机器学习算法不再适用。大数据约简是解决大数据问题的一种有效方法,大数据约简方法主要分为两类:样例约简和属性约简,也称为样例选择和特征选择。样例选择是从大规模数据集中选择出最有代表性的数据子集来代替原始数据集,特征选择是从高维的数据集中选择出重要的特征子集,并将原始数据投影到特征子
由于卫星具有强覆盖性以及可避免自然灾害的能力等优势,利用卫星通讯实现天地一体化通信网络系统是当下网络通信的发展方向。将地面网络与卫星网络进行无缝连接实现多种数据类型以及大容量信息数据传输是现在研究的热点。但是,地面通信环境与空间通信环境有很大的差异,因此地面网络的TCP/IP协议并不适用于空间通信,空间通信需要一种适合自身通信环境的协议。由于地面与空间通信网络的协议类型不同,要实现地面通信网络协议
随着深度学习的发展,图像生成技术有了长足的进展,研究人员提出了许多图像生成算法,但大多数图像生成算法只能生成单一图像,有些工作却需要图像对的数据集支撑。针对这一问题,本文重点研究生成图像对问题。图像对指的是主体高级特征相同,部分低级特征不同的对应图像元组,高效生成良好图像对可以更好地满足相关工作任务的需求。生成模型有多种,目前研究最多的是生成对抗网络和变分自编码器,本文主要研究变分自编码器的耦合模
软件定义网络(SDN)采用流量控制和转发分离的思想,具备网络可灵活配置的优势,迅速在数据中心网和企业WLAN网等小规模网络中得到了广泛应用。随着网络规模的增长,SDN网络中单一集中式控制器难以满足急速增加的流量需求,因此引入多控制器架构对网络流量进行管理和控制。但多控制器架构由于初期设计方式不合理以及实际运行中流量波动性较大等原因,容易出现负载不均衡的问题。针对此问题,本文从多控制器部署和交换机迁
电力电缆是电网正常运行的重要电力设备。在电缆及附件输电过程中,绝缘介质在直流电场长时间作用下,空间电荷积聚会造成绝缘介质产生局部放电场,进而引发局部放电。对电力电缆的局部放电进行实时监测可有效掌握电缆运行状态,是保证电网安全运行的基本要求。目前国内外研究人员针对电缆局部放电的检测提出了多种方法,但是针对长距离高压直流电缆局部放电检测研究还缺乏有效的实验手段。根据以上研究背景,基于萨格耐克(Sagn
学位
目前,网络平台层出不穷,用户量和信息量都呈现爆炸式增长。网络平台门槛低、管理宽松,给垃圾用户的出现创造了有利的条件。平台中的垃圾信息,在给正常用户造成困扰的同时增加了网络负担,检测垃圾用户已成为网络空间安全领域关注的热点话题之一。因此针对目前垃圾用户检测的优缺点,提出基于符号网络的垃圾用户检测方法,主要工作如下:(1)首先对垃圾信息以及垃圾用户进行了分析,同时介绍了节点间距离度量的方法,并总结了文