基于概率描述逻辑的多层活动建模和识别

来源 :中小企业管理与科技·上旬刊 | 被引量 : 0次 | 上传用户:z675083421
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘 要】活动识别是指从一系列家居传感器信号中自动识别人的日常活动,由于人类活动本质的模糊性,大多数传统模式识别方法不能表示活动的不确定性和复杂结构关系。针对上述问题,提出基于概率描述逻辑的多层活动识别方法,从对数线性描述逻辑构建的OWL2本体中的概率推理出当前最可能执行的活动,实验结果验证了论文方法的有效性。
  【Abstract】Activity recognition refers to the automatic identification of human activities from a series of home sensor signals. Because of the fuzziness of human activities, most traditional pattern recognition methods can not represent the uncertainty and complex structure of activities. Aiming at above problems, a multi-layer activity recognition method based on probabilistic description logic is proposed. The most likely activity in current is deduced from the probability of OWL2 noumenon constructed by logarithmic linear description logic, and the experimental results validate the effectiveness of the proposed method.
  【关键词】活动识别;对数线性模型;描述逻辑;OW2本体
  【Keywords】activity recognition; log-liner model; description logic; OWL2 ontology
  【中图分类号】TP11 【文献标志码】A 【文章编号】1673-1069(2018)04-0152-04
  1 引言
  活动识别被广泛应用于众多领域,这些领域包括医疗健康,老人摔倒和异常检测、健康生活方式的跟踪和改善、智能家居的上下文感知服务、机器人技术和安防和监控等。活动识别方法主要可以分为三种,即数据驱动、知识驱动和混合活动识别方法。基于本体的方法在活动识别领域中的应用越来越普遍,然而大多数基于描述逻辑的活动识别框架缺乏对概率知识的表示和推理。
  为了弥补上述方法的不足,本文提出的方法将不确定性知识集成到一个统一的框架中,并考虑活动之间的不相容性,利用对数线性模型和描述逻辑的结合来推测出当前最可能执行的活动。
  2 多层活动模型的表示
  2.1 概率描述逻辑原理
  描述逻辑[1](Description logic,DL)是一种知识表示形式,通过概念、关系和公理来支持特定应用领域知识的逻辑表示,包括领域内概念的定义和对象个体的描述。
  对数线性描述逻辑[2](log-liner description logic)将描述逻辑集成到对数线性模型中,允许对描述逻辑加权公理的概率性和确定性依赖关系进行建模,并支持OWL2网络本体语言[3]。形式上,一个对数线性知识库C=(CD,CU)是由一个确定性知识库CBoxCD和一个不确定性知识库CBox CD=(c,?棕c)组成,其中c表示一个公理,?棕c是分配到公理c的一个权重。
  在规定的语法和语义下,最主要的推理任务是最大后验概率(MAP)查询,给定一个对数线性本体,推理出在同样的概念和角色下最可能的一致的本体,在概率描述逻辑背景下,MAP查询是至关重要的,因为它能够从概率本体中推理出一个最可能的本体。ELOG推理机[4]通过将概率本体转化为整数线性规划(integer linear program,ILP),從而进行MAP查询。它迭代查询一个推理机(例如Pellet)获得不连贯或不一致的解释,并将这些约束添加到整数线性规划中。
  2.2 多层活动的概念
  复杂活动、简单活动、操作手势、原子事件和其他上下文概念被定义为活动本体的概念,下面是一系列本体活动模型主要概念的定义。
  Person:表示一个执行不同活动的居住者。
  Arm:表示居住者的手臂,手臂分为左手臂和右手臂,一个人通过他的手臂与周围环境进行交互。
  Function:表示一个人的手臂操作物体的方式。
  Locomotion:表示肢体动作,例如躺、坐、站立。
  Object:表示居住者在执行一个活动中交互的物体,例如原子事件“移动瓶子”,交互的物体是“瓶子”。
  EventType:表示原子事件,表示这些不能被分解为更简单成分的原子活动,它们的持续时间非常短,为了简化模型,可以把它们看作为瞬时事件。
  Manipulative:表示操作手势,由几个简单的原子事件组成。在某些情况下可以并发进行。
  SimpleActivity:表示简单活动,由操作手势和肢体动作组成的时间序列构成,同样的简单活动可能由不同的操作手势时间序列构成。
  ComplexActivity:表示复杂活动,由执行的简单活动组成。
  2.3 多层活动模型的建立
  多层活动本体模型是依据一个开源项目“Opportunity”提出的框架建立的。本体模型一共包含四层结构,从底层到高层依次是原子事件层、操作手势层、简单活动层和复杂活动层。   本体模型的核心类是Person,一个居住者通过他的手臂与周围环境进行交互,基于本体的类和属性,表示活动概念的公理能够迭代地通过更简单的活动进行定义,这些类和对象属性如图1所示,图中的节点表示类,箭头表示关联类个体的对象属性。一个原子事件的公理可表示为类Person通过属性hasArm关联到他的手臂类Arm,进而通过属性hasFunction和hasObject关联到手臂操作物体的方式类Function和交互的物体类Object。
  3 多层活动识别系统的设计
  多层活动识别系统主要由两部分组成,首先使用OWL2本体语言构建多层活动本体,然后利用基于Java语言编写的活动识别框架来解析本体。
  3.1 多层活动本体
  本文提出的概率本体支持数据集[5]的活动识别场景,包括四个活动层级约150个日常生活动作和活动。只考虑个体S10生成的数据集构建我们的概率本体,其他两个人的数据用于评估我们的方法对活动识别的有效性。我们采用protégé OWL编辑器[6]构建活动本体,公理权重已经以注释的形式手动添加到公理定义中,权重的估计值通过领域常识和S10个体产生的数据获得。
  3.2多层活动的识别方法
  我们提出用以下技术从更简单的活动中识别出更复杂活动,该方法不局限于顺序活动的识别,也包括并发活动的识别。下面描述了操作手势、简单活动和复杂活动的识别步骤。
  3.2.1识别操作手势
  第三层的操作手势是基于原子事件和活动的语义推断得出的,为了识别在一个时间窗口?子3内执行的操作手势,我们执行下面四个步骤:
  ①收集所有在?子3时段内识别出的原子事件;
  ②使用本体论中的类和声明来表示它们,并将它们添加到概率本体中;
  ③使用对象属性将每一个原子事件和它的执行者关联起来;
  ④利用概率和标准的本体推理机推断出最有可能执行的操纵手势。
  3.2.2识别简单活动
  因为简单的活动被定义为由若干操作手势组成的时间序列,需要表示操作手势的执行先后关系。然而基于OWL2的描述逻辑本身并不支持时序推理,为了解决这个限制,根据操作手势的时间序列进行简单的时序推理。为了识别所有在?子2时段内执行的简单动作,我们按照如下步骤:
  ①收集所有在?子2时段内推测出的操作手势;
  ②利用本体的类和声明表示各种操作手势,并添加到概率本体中;
  ③利用对象属性关联每一个操作手势和它的执行者;
  ④更新收集到的操作手势的执行顺序,使用上述描述的公理形式,并添加到概率本体列表;
  ⑤使用关于对数线性的ELOG推理机[4]从概率公理中计算最可能的一致性本体;
  ⑥在最可能的一致性本体上执行标准的本体推理,得到在?子2时段内的简单活动。
  3.2.3识别复杂活动
  从简单活动中识别出复杂活动的方法类似于操作手势的识别,由于时间窗口?子1持续的时间较长,在时间窗口?子1内可以执行几个简单活动,这有助于区分各复杂活动和省略活动内部的時序关系。
  3.3 多层活动识别框架
  本文提出的方法是基于Java编写的系统OWL-API上实现的,如图4中所描述的一样,程序在一个滑动时间窗口中自动解析传感器的观测值,通过识别框架将更低层级活动作为输入,迭代地输出更高层级的活动。该程序收集的传感器观测数据包括执行者的肢体动作、手臂动作和交互物体。当运行时间超过了操作手势对应的预定义时间窗口?子3时触发推理过程。为了便于评估,依照传感器输入频率的平均值,我们固定?子3分割的时间为1秒。
  每个被识别出的原子事件都作为本体中对应类的一个个体,用于未知的操纵手势类的描述。新的公理被添加到对数线性本体后,通过ELOG推理机输出最可能一致的本体。ELOG推理机通过将概率本体转化为一个整数线性规划来解决MAP查询,它迭代查询Pellet推理机来获得关于不连贯或不一致的解释,并将其作为ILP的约束,可以使用Gurobi解算机解决它们和重复这些操作,直到所有的不一致都得到解决。获得的一致性本体再次作为输入,通过Pellet推理机可以推断出未知类的等价类。这些类表示在给定的时间窗口中预测的操作手势。在下一个传感器输入时,采集的数据被删除和收集推理过程又被再次触发。类似地,为了识别下一个抽象层的活动,之前的预测类用于定义当前简单活动的未知类,保存当前收集的操作手势直到一个简单活动被识别。从一个时间窗口到下一个时间窗口,它们的顺序也进行相应地更新。构成一个简单活动的最长序列包括4个操纵手势,我们固定?子2的间隔长度为4个?子3时间间隔,因此一个操纵手势在它被识别前的最大序号为4,利用Pellet的解释特性来获取识别简单活动的公理,并获得它的持续时间。最后,在?子1中预测的简单活动被用于产生未知的复杂活动类,复杂活动覆盖较长时间,考虑到识别框架的实时性,我们限制?子3为30秒。识别过程遵循与识别操作手势相同的步骤。
  4实验与评估
  4.1 实验数据集
  我们使用从高度丰富的网络传感器环境中收集到的真实数据来评估我们的方法,数据集是一个欧盟研究项目“基于传感器配置的活动和情景识别”的一部分。数据集通过观察几个住户早晨的日常活动获得,为了能够评估我们的方法,我们对三个目标个体S10、S11和S12在三个不同早晨执行的日常活动ADL1、ADL2和ADL3的不确定性进行注释。
  为了评估我们的方法,首先使用时间窗技术,获得每个时间窗口内的真实活动集,然后把它与对应时间窗口内预测的活动集进行比较。评估方法采用三个模式识别中常用的评价指标:精确度(precision)、反馈率(recall)和F测量(F-Measure),三者按如下公式计算:   對于每个输出,正确预测的活动被视为是正确肯定(true positive,TP);如果时间窗口?子1中预测的活动A1,不匹配真实数据集在同一时间窗口内的任何活动,则被视为错误肯定(false positive,FP);任意一时间窗口内,参考数据集的活动没有在时间窗口内被预测出,则被视为错误否定(false negative,FN)。
  4.2 实验结果和分析
  表1描述了住户S10、S11和S12三个早上的日常活动数据(ADL1、ADL2和ADL3)在每个层级活动上的平均识别结果。由于各个住户之间的变化 相对较小,本文方法表现出很好的性能水平。
  一般来说,单独从各个层级活动识别结果来看,系统具有较高的精度。虽然对于操作手势和复杂活动而言,反馈率的值是比较满意的,但简单活动的反馈率较低,遗漏了相当数量的简单活动,这主要有以下几个原因,一方面操控手势层的预测错误或遗漏很可能违反整个简单活动的执行顺序,从而导致错误预测。另一方面,我们的本体模型时序表示过于简单,不能捕获定义一个简单活动的所有操纵手势序列。尽管简单活动的反馈率较低,复杂活动有相对较高的F-测量值,这主要有两方面原因,一方面复杂活动类的数量相比与其他层级数量较少,另一方面由于复杂活动的识别频率相对较低,在一个时间窗口?子1能够识别到足够多的简单活动,从而能在很大概率上正确地推理出复杂活动。
  5 结语
  本文提出了一种紧密耦合的混合系统来进行人类活动的识别,提出的识别框架将符号逻辑和概率推理相结合,采用对数线性描述逻辑来表示和推理当前活动,实验结果验证了本文方法处理多层活动识别的可行性。本文不同于大多数相关工作,它在不牺牲本体建模和推理的优势下,支持人类活动固有的不确定性,这些优势包括一致性检测和集成丰富背景知识的能力,能同步识别复杂和简单活动。标准描述形式的使用增强了系统的移植性和重用性,支持表示异构和不确定的上下文数据,能够有效处理数据的不确定性。
  【参考文献】
  【1】F Baader,D Calvanese,DL Mcguinness.The Description Logic Handbook:Theory,Imple- -mentation and Applications[J].Cambridge University Press ,2010(32):9-10.
  【2】M Niepert,J Noessner,H Stuckenschmidt.Log-linear description logics[J].International Joint Conference on Artificial Intelligence,2011(12) :2153-2158.
  【3】BC Grau,I Horrocks,B Motik.OWL 2:The next step for OWL[J].Web Semantics Science Services & Agents on the World Wide Web,2008,6(4):309-322.
  【4】J Noessner,M Niepert.ELOG:A Probabilistic Reasoner for OWL EL[J].Springer Berlin Heidelberg,2011,69(02):281-286.
  【5】P Lukowicz,G Pirkl,D Bannach,et al.Record- -ing a Complex,Multi Modal Activity Data Set for Context Recognition[J].International Con- -ference on Architecture of Computing Systems,2011(08):161-166.
  【6】H Knublauch,RW Fergerson,NF Noy,et al.The protégé OWL Plugin:An Open Development Environment for Semantic Web Applications[J].Stanford School of Medicine,2006(07):151-162.
其他文献
我国教育领域以及电子信息技术的飞速发展,促进着多种以网络环境为背景的教学模式产生,其中MOOC教学模式的产生为高等院校的能力优化做出了较大贡献。论文将MOOC背景下的高校
按生产要素参与收益分配的政策设计既要有利于主导产业的健康发展,又要有利于公平正义的实现。根据各个产业在江苏省GDP中的占比及从业人数占比等指标选取了10个行业,运用主
在城市上空,升起了一颗小地球,那是专门给喜欢“自由自在”的小朋友准备的。全市的孩子都沸腾了,谁不想去小地球生活一段时间呀!如果你能拿到一张通行证,就可以过上这样的日
当前,许多地方性本科院校正在向应用型大学转型。写作课程作为应用型本科院校汉语言文学专业的主干课程,也应积极探索符合自身特点的教学改革。本文主要从课程目标、课程内容
十九届中央纪委二次全会强调,要深化运用监督执纪"四种形态",强化日常监督执纪。当前,国有企业在把握运用"四种形态"时,一定程度上存在监督对象不明确、形态使用不恰当、组织
随着教育改革不断深入,各种新的理念与技术也不断被应用。微课使传统教育模式得以打破,具有很强的针对性,内容也更加多样、具体。但当前微课在高中物理教学中的应用还存在一
面临企业新的发展形势,信息系统应着力把握“十四五”辽河油田公司信息安全发展,建立和完善立体的油田公司信息安全体系,提高信息安全防护能力,为实现信息技术与油田业务的深
《仪器分析》主要任务是使学生得到现代分析化学技术、现代仪器分析技术操作技术等的基本操作和技能的训练,也是应用性较强的重要的实验课程。通过本课程教学,可使学生根据研
【摘 要】阳江核电站电动主给水泵系统(APA系统)转速控制手/自动切换期间多次出现泵速异常波动,影响泵组运行稳定性,论文结合波动瞬态具体现象简析可能原因。  【Abstract】In Yangjiang nuclear power station ,the abnormal speed fluctuation of APA system has occurred frequently during