论文部分内容阅读
摘 要:物联网已经渗透到各个领域,并对各领域数据进行自动采集和应用。但异构数据的存储和融合一直是物联网的技术难题,使数据信息不能被理解,阻碍传感器的应用。因此设计高质量的数据融合算法,具有重大实际应用价值。本课题拟通过语义,根据物联网传感器数据融合的理论分析与本体建模的方法,以及传感器本体和语义融合的一般方法,提出基于多传感器的语义数据融合方法,促进语义在物联网多传感器数据融合中的应用,为物联网系统的智能控制和决策分析打下基础,加快物联网在各领域的快速发展和深入应用,有一定的经济和社会效益。
关键词:物联网;多传感器;语义融合;本体
中图分类号:TP202
物联网是计算机科学发展的产物,渗透到各个领域,工业、医疗、军事、家庭等多领域,对各领域的各环节进行信息数据的自动化采集、处理、决策分析、预警等控制活动。负责信息数据采集的设备主要是传感器。传感器节点是信息采集、处理和传输的基础。每个传感器都是一个信息源,对于信息系统来说,数据是海量的,并呈指数级别增长,产生和存储这些数据的软硬件环境有很大的差别,因此采集到的数据内容和格式都不相同,使得数据的利用和共享成为难题,而处理这些数据需要面临的主要技术问题就是异构的数据源问题[1]。因此,设计高质量的传感器数据融合[2-4]方法,是多传感器数据的核心问题。
异构的数据源问题[5]包含四个级别:系统、结构、语法和语义。对于系统和结构上的异构问题,解决方案是使用XML语言消除异构,但是语义上的异构问题,使用本体是最有效的。本文的研究思路是:针对物联网中多传感器采集数据的格式不同问题,提出基于本体进行语义融合的方法,以达到多传感器数据有效利用、决策控制等目的。
1 本体(Ontology)
1.1 本体知识简介
在人工智能界,Neches等人将本体定义为“给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的规则的定义”。文献[6]指出:“本体包含有明确定义的词汇表,定义概念间关系,同一个本体的所有使用者都遵循这些定义规则。”因此本体能够在领域内部描述概念和概念间关系,而且具有确定的属性,促进人机交流。
1.2 混合本体
由于本体是可以共享的,首先查找现有本体资源,是否有可直接使用的本体。如果不能直接使用,那么利用混合本体方法[7],为每个传感器创建本体。常见的基于本体集成模型有单一本体法、多本体法、混合本体法。基于混合本体的信息集成方法,是消除数据结构上异构的有效方法。
1.3 本体开发工具
本文在选择本体创建和实例化的工具是protégé,版本4.1。Protégé也是目前开发人员在创建本体模型与本体化应用程序时使用的一款开源软件。
这款软件主要优点有:
(1)采用图形化界面,对类、属性、类间关系等的编辑非常容易。
(2)protégé软件结构有很好的扩展性。因此,其功能很强大,能够编辑本体,也能将本体信息存入数据库,并能够实现查询推理功能。
2 基于融合规则的语义数据融合方法
2.1 传统的数据融合算法
多传感器数据融合的过程是综合处理信息的过程,提取出多个传感器的数据信息,根据一定的规则重新组合,得到对被测对象的一致性测量结果,融合后的数据更加可靠、准确,是决策分析和预警的重要依据。多传感器数据融合,关键是信息形式更加复杂的异构数据源问题。数据融合的主要算法有:基于权系数的融合方法,基于参数估计的信息融合方法,基于D-S证据理论的融合方法,基于Kalman滤波的融合方法,基于模糊神经网络的融合方法,基于粗糙集理论的融合方法,聚类分析法等多种方法。每种融合算法的依据理论不同,其优劣势也不同,D.S证据推理和表决法的理论还不够成熟,神经网络和模糊逻辑应用难度较高。
2.2 语义数据融合的核心问题描述
语义数据融合方法[8-10],利用本体在领域内进行概念级建模,促进资源描述、信息共享和整合,有效消除海量异构设备产生的异构数据源问题。本体是针对语义内容,实现语义标注、语义检索等概念匹配的统一数据集。本文使用本体描述领域内多传感器资源,确定资源中概念的定义,消除二义性,便于计算机理解。
语义数据融合的核心问题有:
2.2.1 异构数据间语义冲突。语义冲突的结构包含模式层和数据层的冲突。模式层冲突是不同数据源中对相同概念采用不同逻辑结构造成的冲突。数据层冲突是对相同概念的表示不同造成的冲突。每种型号的传感器产生的数据内容和格式都有区别,数据的精度也不同,这对数据融合造成一定的难度。事实证明,传统的数据融合方法并没有很好地解决这个问题。
2.2.2 融合后的数据可靠性差。融合后的数据依然存在语义冲突和冗余。不能有效地用于决策分析、决策处理等。
2.3 基于混合本体的语义数据融合方法
本文中混合本体的作用主要表现在两方面:
2.3.1 从全局角度规范化领域内多传感器资源的概念和术语,各传感器本体中的概念参照全局本体,从而使概念具有一致性,有效解决语义冲突问题,为领域内和领域间的实际应用起到共享本体作用。
2.3.2 通过混合本体的分析、处理,既理清了多传感器领域知识的结构,又提高数据的可靠性,分析并提取出不安全数据,从而为后续决策分析、处理和事故预警等问题打好基础。而且多传感器本体可以重用,从而避免重复的多传感器领域知识分析。
本文利用混合本体为每个传感器创建本体,结合一定的算法,将提出一种基于异构多传感器数据的语义数据融合的方法。基于混合本体的数据融合方法不仅从数据的整体层面,也从局部角度处理数据,使处理后的数据更加可靠。具体步骤如下: (1)收集多传感器数据到网关。收集多传感器数据到网关,本质上是从串口读取、收集、发送数据到网关的过程。通过各传感器收集环境感知的数据,将数据精度处理并保持一致。这部分知识是数据融合过程中已经具备的前提,不多做阐述。
(2)描述异构多传感器数据资源。分析多传感器数据,结合本体知识,描述多传感器资源的本体概念,描述概念属性,和概念间关系。本文涉及的传感器有Arduino传感器和物联网实验室的传感器试验箱,这两种传感器采集到的数据内容和格式都不相同。以温度传感器为例,Arduino传感器采集到的数据是数值,而教学用的传感器试验箱中温度传感器采集到的数据有时间和温度值。传感器资源的描述如下,以温度传感器为例,有传感器数据,温度传感器,采集时间(包含月、日、时、分、秒),采集区域,传感器数值属性。
(3)创建多传感器的混合本体数据模型及其实例化。以混合本体为基础与传感器本体模型相结合,构建基于混合本体的多传感器数据模型。全局本体描述的是传感器的概念集合,局部本体描述的是各传感器数据库中的概念及其具体内容,局部本体中的概念与全局本体中相应的概念之间存在映射关系。传感器本体创建的步骤是:
1)抽取领域词汇。研究领域知识、学习领域资料,定义领域本体的关键概念词汇,以及概念间关系。定义类之间的继承关系,以及概念的属性关系。抽取领域内的核心词汇,需要结合领域和应用实际反复推敲,确定概念间的层次关系,以备用。
2)确定类属性及其属性值的取值范围和类型。根据领域本体词汇,定义本体概念的属性,确定属性取值类型和取值范围。
3)创建类的实例。定义本体资源属性取值后,需要创建本体实例。分析并选择一个类,确定属性的取值。最后确定本体概念、类以及类间关系的一致性,重复检测正确性。
(4)基于混合本体的数据融合算法。传感器类型、采集时间和采集区域属性能够唯一标识传感器,称为传感器的关键属性。基于混合本体的数据融合算法:首先比较传感器的类型属性。如果相等,则继续比较传感器的区域属性。如果不等,则直接向网关输出。再比较传感器区域属性,如果不相同,则根据传感器类型属性进行数据合并后,直接输出,如果相同,则说明是等价实例。继续比较采集时间,采集时间若相同,则需要根据融合规则,进行数据融合。如果采集时间不同,说明采集时间稍早的数据是过时冗余的数据,做删除处理。
(5)基于融合规则输出结果到网关。融合规则包含:
1)平均原则:将多个相同类型传感器的数据进行取均值运算,最终返回均值。
2)加权平均原则:将多个相同类型传感器的数据进行加权均值运算,并返回结果。
3)统计原则:统计数据,将出现频率高的值作为返回结果。
4)最值原则:取数据中的最大值或是最小值作为返回结果。
5)随机原则:在多个相同类型传感器的数据中随机取一个数值作为结果返回。
本文建议:如果有敏感数据产生,即不安全数据,那么基于统计原则必须输出不安全的数据信息,如果采集到的数据在安全范围内,那么以上融合规则都可以使用。
3 结束语
本文基于混合本体提出的语义数据融合方法,基本达到研究的预期目标。基于本体的语义数据融合方法,解决了语义冲突问题,使融合的数据更加可靠。语义数据融合,为自动化分析、处理多传感器数据打下基础,后续研究可以结合jena推理机,书写推理规则,对融合后的传感器数据进行推理,特别是对环境安全的决策分析、控制和预警活动有重要意义。
语义技术应用于物联网领域的数据融合研究,已经具备一定的理论基础。本文提出基于语义的数据融合方法,促进语义在物联网中的应用。
参考文献:
[1]朱敏.基于物联网的异构数据融合算法的研究[J].计算机光盘软件与应用,2014(08).
[2]严凤斌,高起蛟,杨彭远.基于混合本体的异构数据集成方法研究[J].信息技术,2010(12).
[3]姜延吉.多传感器数据融合关键技术研究[D].哈尔滨工程大学,2010(04).
[4]王欣.多传感器数据融合问题的研究[D].吉林大学,2006(04).
[5]张军艳,罗军,赵应秋.基于本体的语义异构数据集成方法研究[J].信息技术,2012(08).
[6]赵健.基于领域本体的RDF检索模型研究[D].吉林大学,2009(04).
[7]严凤斌,高起蛟,杨彭远.基于混合本体的异构数据集成方法研究[J].计算机应用,2010(12).
[8]房立芳.基于本体的异构数据集成与融合方法研究[D].中国科学技术大学,2010(05).
[9]李程贵.一种基于语义融合的智能家居系统的研究与实现[D].吉林大学,2012(06).
[10]刘波,齐德昱,林伟伟.基于本体的语义数据融合方法[J].华南理工大学学报(自然科学版),2009(01).
[11]黄漫国,樊尚春,郑德智.多传感器数据融合技术研究进展[J].传感器与微系统,2010(03).
作者简介:孙丽丽(1981-),女,吉林德惠人,物联网与网络工程教研室,研究方向:物联网。
作者单位:三明学院信息工程学院物联网应用福建省高校工程研究中心,福建三明 365004
基金项目:三明市科技局重点项目(项目编号:2011-G-4);福建省自然科学基金资助项目(项目编号:2012J01283);福建省教育厅省属高校科研专项计划(项目编号:JK2012051)。
关键词:物联网;多传感器;语义融合;本体
中图分类号:TP202
物联网是计算机科学发展的产物,渗透到各个领域,工业、医疗、军事、家庭等多领域,对各领域的各环节进行信息数据的自动化采集、处理、决策分析、预警等控制活动。负责信息数据采集的设备主要是传感器。传感器节点是信息采集、处理和传输的基础。每个传感器都是一个信息源,对于信息系统来说,数据是海量的,并呈指数级别增长,产生和存储这些数据的软硬件环境有很大的差别,因此采集到的数据内容和格式都不相同,使得数据的利用和共享成为难题,而处理这些数据需要面临的主要技术问题就是异构的数据源问题[1]。因此,设计高质量的传感器数据融合[2-4]方法,是多传感器数据的核心问题。
异构的数据源问题[5]包含四个级别:系统、结构、语法和语义。对于系统和结构上的异构问题,解决方案是使用XML语言消除异构,但是语义上的异构问题,使用本体是最有效的。本文的研究思路是:针对物联网中多传感器采集数据的格式不同问题,提出基于本体进行语义融合的方法,以达到多传感器数据有效利用、决策控制等目的。
1 本体(Ontology)
1.1 本体知识简介
在人工智能界,Neches等人将本体定义为“给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的规则的定义”。文献[6]指出:“本体包含有明确定义的词汇表,定义概念间关系,同一个本体的所有使用者都遵循这些定义规则。”因此本体能够在领域内部描述概念和概念间关系,而且具有确定的属性,促进人机交流。
1.2 混合本体
由于本体是可以共享的,首先查找现有本体资源,是否有可直接使用的本体。如果不能直接使用,那么利用混合本体方法[7],为每个传感器创建本体。常见的基于本体集成模型有单一本体法、多本体法、混合本体法。基于混合本体的信息集成方法,是消除数据结构上异构的有效方法。
1.3 本体开发工具
本文在选择本体创建和实例化的工具是protégé,版本4.1。Protégé也是目前开发人员在创建本体模型与本体化应用程序时使用的一款开源软件。
这款软件主要优点有:
(1)采用图形化界面,对类、属性、类间关系等的编辑非常容易。
(2)protégé软件结构有很好的扩展性。因此,其功能很强大,能够编辑本体,也能将本体信息存入数据库,并能够实现查询推理功能。
2 基于融合规则的语义数据融合方法
2.1 传统的数据融合算法
多传感器数据融合的过程是综合处理信息的过程,提取出多个传感器的数据信息,根据一定的规则重新组合,得到对被测对象的一致性测量结果,融合后的数据更加可靠、准确,是决策分析和预警的重要依据。多传感器数据融合,关键是信息形式更加复杂的异构数据源问题。数据融合的主要算法有:基于权系数的融合方法,基于参数估计的信息融合方法,基于D-S证据理论的融合方法,基于Kalman滤波的融合方法,基于模糊神经网络的融合方法,基于粗糙集理论的融合方法,聚类分析法等多种方法。每种融合算法的依据理论不同,其优劣势也不同,D.S证据推理和表决法的理论还不够成熟,神经网络和模糊逻辑应用难度较高。
2.2 语义数据融合的核心问题描述
语义数据融合方法[8-10],利用本体在领域内进行概念级建模,促进资源描述、信息共享和整合,有效消除海量异构设备产生的异构数据源问题。本体是针对语义内容,实现语义标注、语义检索等概念匹配的统一数据集。本文使用本体描述领域内多传感器资源,确定资源中概念的定义,消除二义性,便于计算机理解。
语义数据融合的核心问题有:
2.2.1 异构数据间语义冲突。语义冲突的结构包含模式层和数据层的冲突。模式层冲突是不同数据源中对相同概念采用不同逻辑结构造成的冲突。数据层冲突是对相同概念的表示不同造成的冲突。每种型号的传感器产生的数据内容和格式都有区别,数据的精度也不同,这对数据融合造成一定的难度。事实证明,传统的数据融合方法并没有很好地解决这个问题。
2.2.2 融合后的数据可靠性差。融合后的数据依然存在语义冲突和冗余。不能有效地用于决策分析、决策处理等。
2.3 基于混合本体的语义数据融合方法
本文中混合本体的作用主要表现在两方面:
2.3.1 从全局角度规范化领域内多传感器资源的概念和术语,各传感器本体中的概念参照全局本体,从而使概念具有一致性,有效解决语义冲突问题,为领域内和领域间的实际应用起到共享本体作用。
2.3.2 通过混合本体的分析、处理,既理清了多传感器领域知识的结构,又提高数据的可靠性,分析并提取出不安全数据,从而为后续决策分析、处理和事故预警等问题打好基础。而且多传感器本体可以重用,从而避免重复的多传感器领域知识分析。
本文利用混合本体为每个传感器创建本体,结合一定的算法,将提出一种基于异构多传感器数据的语义数据融合的方法。基于混合本体的数据融合方法不仅从数据的整体层面,也从局部角度处理数据,使处理后的数据更加可靠。具体步骤如下: (1)收集多传感器数据到网关。收集多传感器数据到网关,本质上是从串口读取、收集、发送数据到网关的过程。通过各传感器收集环境感知的数据,将数据精度处理并保持一致。这部分知识是数据融合过程中已经具备的前提,不多做阐述。
(2)描述异构多传感器数据资源。分析多传感器数据,结合本体知识,描述多传感器资源的本体概念,描述概念属性,和概念间关系。本文涉及的传感器有Arduino传感器和物联网实验室的传感器试验箱,这两种传感器采集到的数据内容和格式都不相同。以温度传感器为例,Arduino传感器采集到的数据是数值,而教学用的传感器试验箱中温度传感器采集到的数据有时间和温度值。传感器资源的描述如下,以温度传感器为例,有传感器数据,温度传感器,采集时间(包含月、日、时、分、秒),采集区域,传感器数值属性。
(3)创建多传感器的混合本体数据模型及其实例化。以混合本体为基础与传感器本体模型相结合,构建基于混合本体的多传感器数据模型。全局本体描述的是传感器的概念集合,局部本体描述的是各传感器数据库中的概念及其具体内容,局部本体中的概念与全局本体中相应的概念之间存在映射关系。传感器本体创建的步骤是:
1)抽取领域词汇。研究领域知识、学习领域资料,定义领域本体的关键概念词汇,以及概念间关系。定义类之间的继承关系,以及概念的属性关系。抽取领域内的核心词汇,需要结合领域和应用实际反复推敲,确定概念间的层次关系,以备用。
2)确定类属性及其属性值的取值范围和类型。根据领域本体词汇,定义本体概念的属性,确定属性取值类型和取值范围。
3)创建类的实例。定义本体资源属性取值后,需要创建本体实例。分析并选择一个类,确定属性的取值。最后确定本体概念、类以及类间关系的一致性,重复检测正确性。
(4)基于混合本体的数据融合算法。传感器类型、采集时间和采集区域属性能够唯一标识传感器,称为传感器的关键属性。基于混合本体的数据融合算法:首先比较传感器的类型属性。如果相等,则继续比较传感器的区域属性。如果不等,则直接向网关输出。再比较传感器区域属性,如果不相同,则根据传感器类型属性进行数据合并后,直接输出,如果相同,则说明是等价实例。继续比较采集时间,采集时间若相同,则需要根据融合规则,进行数据融合。如果采集时间不同,说明采集时间稍早的数据是过时冗余的数据,做删除处理。
(5)基于融合规则输出结果到网关。融合规则包含:
1)平均原则:将多个相同类型传感器的数据进行取均值运算,最终返回均值。
2)加权平均原则:将多个相同类型传感器的数据进行加权均值运算,并返回结果。
3)统计原则:统计数据,将出现频率高的值作为返回结果。
4)最值原则:取数据中的最大值或是最小值作为返回结果。
5)随机原则:在多个相同类型传感器的数据中随机取一个数值作为结果返回。
本文建议:如果有敏感数据产生,即不安全数据,那么基于统计原则必须输出不安全的数据信息,如果采集到的数据在安全范围内,那么以上融合规则都可以使用。
3 结束语
本文基于混合本体提出的语义数据融合方法,基本达到研究的预期目标。基于本体的语义数据融合方法,解决了语义冲突问题,使融合的数据更加可靠。语义数据融合,为自动化分析、处理多传感器数据打下基础,后续研究可以结合jena推理机,书写推理规则,对融合后的传感器数据进行推理,特别是对环境安全的决策分析、控制和预警活动有重要意义。
语义技术应用于物联网领域的数据融合研究,已经具备一定的理论基础。本文提出基于语义的数据融合方法,促进语义在物联网中的应用。
参考文献:
[1]朱敏.基于物联网的异构数据融合算法的研究[J].计算机光盘软件与应用,2014(08).
[2]严凤斌,高起蛟,杨彭远.基于混合本体的异构数据集成方法研究[J].信息技术,2010(12).
[3]姜延吉.多传感器数据融合关键技术研究[D].哈尔滨工程大学,2010(04).
[4]王欣.多传感器数据融合问题的研究[D].吉林大学,2006(04).
[5]张军艳,罗军,赵应秋.基于本体的语义异构数据集成方法研究[J].信息技术,2012(08).
[6]赵健.基于领域本体的RDF检索模型研究[D].吉林大学,2009(04).
[7]严凤斌,高起蛟,杨彭远.基于混合本体的异构数据集成方法研究[J].计算机应用,2010(12).
[8]房立芳.基于本体的异构数据集成与融合方法研究[D].中国科学技术大学,2010(05).
[9]李程贵.一种基于语义融合的智能家居系统的研究与实现[D].吉林大学,2012(06).
[10]刘波,齐德昱,林伟伟.基于本体的语义数据融合方法[J].华南理工大学学报(自然科学版),2009(01).
[11]黄漫国,樊尚春,郑德智.多传感器数据融合技术研究进展[J].传感器与微系统,2010(03).
作者简介:孙丽丽(1981-),女,吉林德惠人,物联网与网络工程教研室,研究方向:物联网。
作者单位:三明学院信息工程学院物联网应用福建省高校工程研究中心,福建三明 365004
基金项目:三明市科技局重点项目(项目编号:2011-G-4);福建省自然科学基金资助项目(项目编号:2012J01283);福建省教育厅省属高校科研专项计划(项目编号:JK2012051)。