基于手机数据的半监督社会关系推断模型

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:haizhiren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着手机的普及以及手机中传感器的多样化,手机传感器产生了大量的无意识数据,基于这些传感器数据的关系推断在模式识别以及普适计算领域逐渐成为一个热点研究问题。现有的基于手机传感器数据的社会关系推断模型中,大多利用监督的机器学习方法,需要大量的社会关系标签信息,但是在实际中这些关系标签是难以获得的或者获得的代价是非常昂贵的。因此,如何利用手机通讯网络中少量的关系标签,结合大量的传感器数据来推断社会关系是关系推断中一个非常具有现实意义的问题。通过对传感器数据特征的分析,提出了一种基于手机数据的半监督社会关系推断模型,利用少量的标签信息、以及大量的手机传感器数据信息实现关系推断。在基于手机的通讯社交网络中,关系推断面临的最大的问题就是关系标签的稀疏性和关系类别间的不平衡性。通过挖掘手机传感器数据定义合适的属性是提高关系推断精度的方法之一;建立合适的关系推断模型也可以改善关系推断的精度。通过具体分析传感器的数据类型,定义了96个属性。为了解决关系标签稀疏问题和类别不平衡性,建立了结合支持向量机(Support Vector Machine,SVM)和朴素贝叶斯(naive Bayes,NB)的协同训练风范的半监督推断模型,为了进一步提高对社会关系推断的精度,在社会关系标签推断过程中引入了社交平衡理论。最后利用MIT实验室的Reality Mining数据集验证了提出的模型。通过对94个用户的手机数据进行分析,在已知关系标签为5%、关系标签严重不平衡的情况下,提出方法的类平均准确度可以达到85%的精度,与监督的SVM和NB相比类平均准确率分别有20%和5%的提升,与半监督的直推式支持向量机(Transductive Support Vector Machine,TSVM)相比有10%的提升。
其他文献
随着的计算机技术、数据库技术和网络技术的迅速发展,我们已置身于一个数据爆炸的时代。我们迫切需要新的、强有力的数据分析方法和技术以解决“数据丰富,但信息贫乏”的尴尬局
面对我国森林资源不足、森林质量不高的现状,采用先进的视频识别技术、建立优化的原木下锯理论、提高原木锯切加工质量与精度、实现制材工业的数控化和智能化,从而提高木材出材
在传统的环境中,用户把程序代码下载到自己计算机上,然后使用这个程序来处理自己的数据,所有操作皆在用户自己的机器上执行。而在云计算环境中,用户把数据上传到云端进行处理
近年来,随着系统仿真技术在纵深方向的不断发展及其应用领域的不断拓宽,仿真可信度研究越来越受到人们的重视。仿真系统的最终结果对于预期工程应用来说是否具有可用性,将直
负载平衡是影响系统有效运行的重要因素之一,对于P2P网络系统尤为如此。但由于P2P网络中各节点相互平等且没有中心存在,传统基于中心服务器调度的负载平衡算法不适用,需根据P2P
云存储是一种通过利用大量的存储设备组成集群,进而对外提供服务的技术,云存储主要融合了虚拟化、数据存储等技术。在已存在的众多云存储中,各个云存储提供的服务水平也是不
业务数据是企业中各种业务应用的基础,如何快速、有效地获取数据,是企业应用开发和集成的关键性问题。在传统的基于中间件的数据集成方案中,通常以XML作为全局数据模型,由于
随着云计算和大数据的兴起和发展,数据中心在规模和数量方面呈现爆炸式的发展。同时数据中心的能耗和散热问题也日益严重。2015年整个中国数据中心耗能占据整个中国耗电的2%,
图像压缩的目的是在保证一定的图像质量和满足任务要求的条件下,减少原始图像数据量,它可归结为一个复杂的优化问题。进化算法是解决复杂优化的有效手段,它属于进化计算应用
随着信息技术的进步和Internet网络技术的飞速发展,DL(DigitalLibrary,数字图书馆)应运而生。数字图书馆改变了以往信息存储、加工、管理、使用的传统方式,借助网络环境和高