基于不完备信息系统的观众兴趣特征提取算法研究

来源 :电子世界 | 被引量 : 0次 | 上传用户:jfm98999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘要】目前人工智能在智慧博物馆建设领域中发展迅速,准确采集观众兴趣是为博物馆提供更好展示服务的前提,但智能化计算算法无法完全满足浮动巨大的观众兴趣数据分析。针对此问题,从一种粗糙集中导出不完备信息系统的模糊度,并讨论了其概念与性质,通过例子指出了其在智慧博物馆观众兴趣采集方面的应用价值。
  【关键词】粗糙集;不完备信息系统;兴趣特征;提取算法;隶属函数
  1.引言
  目前,智慧场馆是博物馆建设的主要方向,人工智能在智慧化场馆建设领域中占重要地位,其在大量非线性观众数据分析方面的作用尤为明显。在智慧场馆建设中,提取观众参观过程中的兴趣数据可以为场馆建设展示提供良好的数据基础,而观众兴趣数据的分析属于对不完备的信息的判断和总结。目前大部分智能算法在观众兴趣特征的提取上并不理想,所以,推导了一种由粗糙集导出不完备信息系统的模糊度来进行观众兴趣特征的提取,通过计算模糊度函数合理有效的将观众兴趣特征提取出来,以达到收集观众兴趣点的目的。
  2.基本概念
  设U=(X,ST)是一个信息系统,其中X为非空有限论域,X中的元素称为对象,ST是有限非空属性集,对于每一个s∈S,s:X→VS(VS不同于后文的Vs)且x∈X,s(x)∈V∞称VS为属性s的值域。如果信息系统中的某些属性值缺省或部分知道,这样的系统称为不完备信息系统,属性值函数s(x)可以定义为从X到VS的幂集的一个集值映射。
  一个不完备决策表U=(X,ST∪{d}),其中X={x1,x2,x3,……},ST={s1,s2……}代表病害特征的条件特征属性,d代表病害特征的决策特征属性,Vs={Vs1,Vs2,……}代表特征的指标。
  算法表示中以∧表示逻辑“与”。若v∈Vs∈S,属性对(s,v)称为是S的基本元。所有的S的基本元或者它的逻辑“与”∧连接成为S描述,設t为描述,若基本元(s,v)存在于t中,称(s,v)∈t,若s∈S,(s,v)∈t,则称t为S的全描述。‖t‖={x∈X:v∈s(x);(s,v)∈t}称为t的支持集。如果t和a是两个描述且S(t)∩S(a)是空集,可以得到‖t∧a‖ =‖t‖∩‖a‖。
  如果记DES(S)={t:t是S的描述;}。
  对于任意的t∈DES(S),如果S(t)=S,则t是完全的S的描述,记FDES(S)={t:t是S的完全描述}。设U={X,ST}是一个不完备信息系统,对于任意的s∈ST和v=Vs如果v∈s(x)∩s(y),即,x和y被称为关于属性s类似,同样,若,t∈FDES(S),x,y∈X,则x,y被称为关于S类似当且仅当,这些类似关系就把有限论域X分成了作为基本模块(称为描述集)的几个基本模块,这些描述集类构成了X的一个覆盖,记为X/S={‖t‖:t∈FDES(S)},包含x的描述集类记为S(x),即S(x)={‖t‖:t∈FDES(S)}
  3.粗糙集的构造
  定义,设和,XI关于S下近似和上近似分别记为和,其中:
  -称为XI关于S的边界(代表空集),记为。注:这里所定义的下近似和上近似集合,其中的元素师描述集类,而不是X的一个子集。
  把与集合X中元素x具有相同描述的元素构成的集合称为相似集,记为,则:
  4.模糊函数及其性质
  模糊函数定义为:
  称为关于属性集S属于集合Y的隶属度,直观意义为u属于集合Y的模糊度。
  性质1:
  (1)。
  (2)。
  反之则不成立。
  证明:
  (1)如果,根据定义有:,因为,于是。
  (2),根据定义有:。因为于是。
  性质2:如果,则有。
  证明:因为,则有:
  则:
  因此 。
  性质3 :
  (1)
  (2)如果或者,则:
  。
  证明:
  (1)可以从性质2导出。
  (2)如果,那么,且。
  则有:
  性质4:设,表示的补集。则。
  证明:
  所以:,也就是
  表1 不完备决策表
  X S1 S2 d
  x1 N N N
  x2 N、H N H
  x3 N N、H N
  x4 L L L
  x5 H N、H H
  x6 N、H H H
  x7 N、L N L
  5.应用
  设有关于观众样本和兴趣特征的不完备决策表U,U=(X,ST∪{d}),其中X={x1,x2,x3,……x7}代表不同样本集,ST={s1,s2}代表兴趣的条件特征,d代表该兴趣的决策特征(即判断观众兴趣表现的主要特征判断依据),Vs={Vs1,Vs2}代表特征的指标,如观众兴趣集Vs={L,N,H},L表示停留时间短、兴趣不大,N表示观众正常停留观看,H表示观众长时间停留、对该位置展品表现出极大兴趣。有Vs1={L,N,H}。属性表如表1所示。
  则根据表1、概念和粗糙集的构造方式:
  x2,x5,x6,的关于属性S1的值都具有“H”,则关于属性S1他们都应属于同一个描述累‖(a,H)‖,即‖(a,H)‖={x2,x5,x6}。用S1,S2,ST={S1,S2}的描述集类可表示一下分类:
  X/{S1}={‖(S1,N)‖,‖(S1,H)‖, ‖(S1,L)‖}={{x1,x2,x3,x6,x7},{x2,x5,x6},{x4,x7}}。
  X/{S2}={‖(S2,N)‖,‖(S2,H)‖, ‖(S2,L)‖}={{x1,x2,x3,x5,x7},{x3,x5,x6},{x4}}。   X/ST={‖(S1,N)∧(S2,N)‖,‖(S1,N)∧(S2,H)‖,‖(S1,H)∧(S2,N)‖,‖(S1,H)∧(S2,H)‖,‖(S1,L)∧(S2,L)‖,‖(S1,L)∧(S2,N)‖}={{x1,x2,x3,x7},{x3,x6},{x2,x5},{x5,x6},{x4},{x7}}。
  同时也容易看到:{S1}(x2)={{x1,x2,x3,x6,x7},{x2,x5,x6}}。
  设XI={x2,x5,x6},
  经计算可得:={{x2,x5,x6}},={{x1,x2,x3,x6,x7},{x2,x5,x6}}。
  ,={{x1,x2,x3,x5,x7},{x3,x5,x6}}。
  ={{x5,x6}},={{x1,x2,x3,x7},{x3,x6},{x5,x6},{x2,x5}}。
  ={{x1,x2,x3,x7},{x3,x6}}。
  相似集:
  {N}={x∈X:
  d(x)=N}={x1,x3},{H}={x∈X:
  d(x)=H}={x2,x5,x6},{L}={x∈X:
  d(x)=L}={x4,x7}。
  則{N},{H},{L}构成了X的一个划分,根据模糊度函数计算{N},{H},{L}的模糊度构成粗糙隶属度函数表,如表2所示。
  表2 粗糙隶属度函数表
  X N H L
  x1 1/2 1/4 1/4
  x2 2/5 2/5 1/5
  x3 2/5 2/5 1/5
  x4 0 0 1
  x5 0 1 0
  x6 1/2 1/2 0
  x7 1/2 1/4 1/4
  那么就可以从表2中的隶属度值清楚地看出每个样本元素是否正常,其判断标准为每个样本特征指标的函数值。当一个特征的函数值表现的很大时,就可以确定该样本的观众存在相应较大的兴趣,达到观众游览兴趣特征提取的目的。
  6.结论
  上述内容定义了不完备信息系统的描述集类,上下近似,构造了相应粗糙集。在不完备决策表中构造了模糊函数,以求得每个元素的隶属度得出结论,为实际问题的判断提供了依据。
  参考文献
  [1]向东,赵勇,陈阳.面向语义信息的案例知识表达与相似度计算方法研究[J].计算机工程与科学,2011(12).
  [2]周文,刘焕,王翼飞.改进的概率权重随机模拟算法[J].应用科学学报,2008(07):26-4.
其他文献
海信TG-1B系列彩电采用东芝单片小信号处理电路TB1227N,由于控制系统软件不同,分两种电路,两种电路存储电台的数量不同,总线系统的调整方法和调整项目也不同,但两种电路的总
在道路桥梁工程施工领域中,道路过渡段施工质量将对整体施工质量产生直接影响,为此,相关施工人员必须要提升对该阶段施工的重视程度,以提升道路行车的平稳性、舒适性和安全性
亲爱的妈妈:您好!您近来工作忙吗?身体还好吧?您的身体一向虚弱,请不要光顾干活,而不注意身体。要知道身体是最主要的,您一定要注意多休息。妈妈,弟弟学习怎么样?他是不是还那么顽皮?
随着人们对休闲旅游业的关注和实际需求,风景园林设计也面临更高的挑战,要融入人性化的设计思维和理念,分析和关注人们对风景园林的真实内心感受,在风景园林设计中突显人性化
由I 2C总线系统对被控集成电路进行检测和实施保护的电视机完全由CPU的总线系统来完成,与上期文章不同的是其外部单独设保护的检测和实施保护的引脚。该电路的检测和保护与传
“读书破万卷,下笔如有神”说明了读书对于提高激励的重要性。读书对人类的益处是大家都了解的,但是看看学校的图书室、阅览室,确是被忽视了的角落,甚至对一些学生来说还是个陌生
如今的手机已经越来越"不像"手机了,它既可以用作照相机,也可以当作MP3,手机还能如何发展呢?德国专家预测,一项名为"一键通"的技术将成为手机发展的新趋势,使用者只需要按一
某厂从1月2日8:45左右开始,31空预器一次风侧差压一直有增大趋势,本文从空预器堵灰机理分析、脱硝系统运行情况对空预器堵灰影响分析等方面分析空预器赌灰原因,并提出空预器堵灰
日前,德州仪器公司(TI)推出业界首款专为多通道应用而设计的模拟监视与控制电路AMC7820.在多通道应用中,高性能和小尺寸至关重要,如光放大器中的泵激光电流和热电致冷器(TEC)
城市封闭式小区是造成道路交通拥堵的主要原因之一。小区开放对优化路网结构、提高道路通行能力、改善城市交通状况的数据评估具有迫切的现实需求。本文首先借助主成分分析及