RDF的近似推理算法在DFLP专家检索中的应用

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:baochangjingmao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着语义网技术的不断向前发展,RDF数据已经成了一种重要网络数据。因为RDF数据本身具有语义性,蕴含着许多的关联,信息的获取就得需要计算机的推理。另外,RDF数据量呈现规模性的增长,目前还在持续的增长当中。面对如此庞大的数据,计算机通常不能高效的处理这么大规模的数据。近似推理技术是目前解决该问题的重要方法之一,它是基于这样的思想:牺牲推理结果的完整性和完备性来加速推理的过程。良好的近似推理算法可以在很大程度上优化推理过程。本课题研究的RDF格式的DBLP数据集是目前比较大规模的数据集,它主要记录了计算机各个领域已发表文献的基本元信息。计算机在处理这样的数据集时也面临着推理效率低下的困难。本课题针对这些问题所做的具体工作如下:  1、通过对RDF图中结点度选择的基本思想的总结,以及对近似推理技术的研究分析,把这两者融合在一起作为一种新的处理RDF数据的推理方法。然后将这种方法应用到处理DBLP的RDF文档,实现DBLP下近似的专家检索。这种方法是把RDF图中的主词和宾词看作为网络中的结点,谓词看成边,通过计算结点的度数并按大小排序,然后选择那些度数较大的结点作为优先推理,在较短的时间内得到近似的推理结果。这在时间方面得到了很大的优化,提高了推理的效率。  2、在基于DBLP数据集专家检索的方案中,从三种不同的视角去体现研究专家的特征。第一种是从作者在某一领域已经发表相关文章数量的角度去衡量一个作者的重要性与权威性,并认为如果作者在某一领域发表的文章数越多,那么他就越有可能是该领域的专家。然后从作者的合作者数的视角研究作者的重要程度,如果某一作者能够与很多的其他的作者在某一领域发表文章,也在一定程度上说明他在作者与作者之间的享有很高的信任度,可以认为该作者该领域的研究专家。最后是对以上两种不同视角下的加权。由于每个视角的侧重点不同,在检索过程中融合RDF近似推理的思想,对每个视角下专家作定性指标计算,综合实现每个视角下的研究专家列表。  3、在得到了阶段性的近似推理结果之后,给出了近似结果相似度的计算公式。这个指标是对每个视角每个阶段近似推理结果的一个评估,相似度的值越大则说明近似结果就越接近最终的完美结果。结果的相似度大小与推理时间有密切关系,结果相似度的大小以及所需推理时间的多少构成了一个综合选择。对于用户而言既要考虑结果的好坏也要考虑时间的耗费,那么这样对结果相似度的评估可以很好的满足了用户的需求。  由于目前的语义网发展迅速,而语义推理是关键的技术之一,因此本课题的研究不仅仅在专家检索系统中有一定参考意义,同时在大规模的数据处理研究当中也有积极的意义。
其他文献
城市给水管网在保障经济建设和人民生活中发挥着重要的作用。给水管网投资大、费用高,一般给水管线的投资占到工程投资的50%以上,给水管网的优化设计直接影响工程的投资。然而给
独轮机器人是一种本征不稳定的移动机器人,其动力学系统复杂,具有非线性、多变量、强耦合等特点,是一种典型的非完整、静不平衡系统。其建模和运动控制问题是控制科学及机器
带传动一体化起动/发电机(Belt-Integrated Start Generator,简称BSG),是一种将起动和发电功能集于一体的电机,该电机通过皮带与汽车发动机曲轴连接,可使发动机快速起停,能够有效
近几十年来,随着社会经济和科学技术的快速发展,世界各国建立了四通八达的道路交通,但一个不容否认的事实是车辆增长的速度已远远超出道路和其它交通设施的承载能力.各种车辆
随着道路车辆不断增多,拥挤的城市地少车多,开车不难泊车难。因泊车操作产生的纠纷和事故也在呈逐年增加之势。360度全景泊车辅助系统可以为驾驶员提供车辆周围360度的全景鸟
学位
运动平衡控制问题是机器人系统中普遍存在的问题,自平衡机器人是一类需要通过运动才能实现平衡的机器人。与一般的自平衡机器人相比,独轮自平衡机器人与地面接触点的数目降到最
中国的建筑运行能耗占社会总能耗25%以上,而其中的空调能耗占到50%以上,空调设备的运行管理需要进行节能研究。从控制理论角度分析,空调是典型的多输入多输出系统,具有非线性
不同失明年龄的盲人为我们提供了一个独特的模型来研究单感觉模态剥夺对大脑结构的影响。近期扩散磁共振成像对盲人的研究主要集中在失明年龄较早的群体,迄今为止,不同发育阶
单壁碳纳米管(Single-Walled Carbon Nanotube,SWCNT)所具有的独特电特性及尺度特性,使它成为研制新型电子单元器件的首选材料。因此,构建单壁碳纳米管纳电子器件的技术研究