基于轨迹数据的聚类算法和差分隐私保护算法研究

来源 :吉林大学 | 被引量 : 1次 | 上传用户:vangor
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着无线通信、传感设备、存储技术的快速发展,可以很便捷地获取用户当前的位置数据并保存至存储设备。而收集到的轨迹数据蕴含有丰富的个人信息,通过挖掘、分析和利用轨迹数据,能够为各类轨迹问题提供解决思路和方案。与此同时,如果对轨迹数据过度挖掘分析,或者对持有用户轨迹数据的互联网服务提供商不加限制,势必会导致用户个人隐私泄露的风险。本文基于轨迹数据,分别对聚类算法和差分隐私保护算法进行了研究。主要工作包括如下三部分。第一,在轨迹聚类算法方面,提出基于密度的K-means轨迹聚类算法(Density-based K-means trajectory clustering algorithm,DBK-means)。首先,以轨迹相似度为衡量标准,计算出所有轨迹对之间的距离;然后,利用t-近邻距离和eps邻域来统计每一条轨迹的密度值信息;接着,通过密度值排名过滤掉密度值较低的离群轨迹,综合考虑轨迹的密度信息和当前轨迹与已有簇中心轨迹的距离信息,计算得到每一条轨迹被选为初始中心轨迹的概率,从而选择概率最大的K条初始中心轨迹;最后,经过多轮迭代完成轨迹聚类。该算法可以最大程度避免离群轨迹和随机选择初始中心轨迹带来的不利影响。通过可视化的结果展示,以及在合成数据集、真实数据集的实验结果中表明,与现有方法相比,聚类准确性和效果更好。第二,在轨迹差分隐私保护算法方面,提出一种基于停留点隐私预算分配的差分隐私轨迹数据保护方法(Differential Privacy Trajectory Data Protection Method Based on Stay Point Allocation of Privacy Budget,DPSP)。该方法首先利用时间、距离、点数限制找出用户小区域内长时间停留的位置点;然后对单一用户的历史采样点聚类得到该用户常去的热点区域;接着计算用户的停留点到热点区域中心的距离,同时考虑热点区域的密度信息,得到每个停留点的重要性分数;最后,根据重要性分数为每个停留点分配相应的隐私预算,利用满足差分隐私机制的staircase机制对停留点加噪。通过在两个真实数据集上进行实验,结果表明所提方法具有更好的数据可用性。第三,针对于所提出的算法,完成桌面应用程序的设计与实现。对于轨迹聚类算法,采用了Java FX+Scene Builder框架的使用方案;利用Scene Builder组件来做界面UI的设计与布局,使用Java FX框架来完成各组件的响应事件。同理,对于轨迹差分隐私保护算法,采用Py Qt5+Qt Designer框架的使用方案;利用Qt Designer组件来手动拖拽和拉伸组件,使用Py Qt5框架来完成响应事件。
其他文献
基因测序是实现肿瘤精准医疗的基础手段,可辅助肿瘤诊断、判断患者预后、指导靶向药物治疗等。近年来,基因测序技术已广泛应用于甲状腺癌的临床诊治工作中。但截至目前,不同医疗中心对基因测序适应证的把控、报告解读水平,以及各测序平台的检测结果可靠性参差不齐。本文通过分析基因检测在甲状腺癌诊治中应用的现状与问题,结合笔者个人临床经验,探讨基因检测在甲状腺癌诊治全程管理中的特殊性及其价值。
期刊
推力滑动轴承在旋转机械中是一个重要的组成部分,轴承性能的好坏与旋转机械的工作性能、使用寿命、稳定性、运行效率、经济性息息相关,在节能减排和环保等方面起着至关重要的作用。随着机械装备向高效性、节能性、环保性与可靠性的快速发展,对推力滑动轴承抗摩擦磨损性能、高承载性能和低温升性能等方面提出了更高的要求。为此,研究提高推力轴承的承载性、抗摩擦磨损性能、降低其工作温升的新方法和新理论成为具有重要理论和现实
学位
阐述电力计量与电网检查管理的现状和意义,存在的问题,应对的措施,包括创新供电模式、加强输电线路的应急抢修能力、加强谐波治理。
期刊
报纸
根据一个人的行为和生物特性,通过自动化的方式来识别一个人的身份信息,这被称为生物识别技术。生物识别认证系统逐渐取代传统的密码和令牌认证,转而使用生物特征认证方式来验证个人的身份。这表明社会已经开始依赖生物识别认证系统。安全性和识别准确性是生物识别系统的两个重要因素。指纹、人脸语音以及虹膜等识别技术都是常见的生物识别技术。其中虹膜识别技术由于其可采集性、稳定唯一等特点,相较于它生物特征有其独特的优势
学位
“互联网+”教育管理,是新时期高校教育管理改革的新策略。以“互联网+”在高校教育管理中发挥的重要作用为主体,针对“互联网+”环境下高校教育管理变革需求及教育管理创新的意义等进行分析,并围绕“互联网+”教育管理的核心理念,提出加强高校教育管理人员线上管理培训、建立高校教育管理数据信息库、优化高校课程教学与教育管理双向互补机制、积极开展线上教育管理互动和管理沟通、开发大学生“互联网+”自主管理模式等创
期刊
城市土地集约利用与产业结构优化存在交互耦合关系,评价二者的耦合协调程度不仅对丰富城市相关理论科学认识有重要意义,而且对于促进城市经济高质量发展有实践意义。以湖北省咸宁市为研究对象,利用熵值法分别评价2003-2017年土地集约利用与产业结构优化子系统综合水平,在此基础上,运用耦合协调度模型测算两者之间的耦合协调度水平及其演变过程。结果表明:2003-2017年咸宁市土地集约利用综合评分呈持续上升趋
期刊
在近些年国家文化、教育部门强调“冷门绝学”,开展古文字学强基计划的背景下,部分有条件的高校已在原有院系、专业基础上对本科阶段相关领域教育教学和人才培养模式进行了试水。未正式开展强基计划的院校也在文史类专业内以开设专门的培养平台或选修课的方式进行探索。在这一发展方向下,各地区培养单位应综合规划学科建设,打好学生的专业基础,既不放松传统教学培养方式,也要结合现代化平台和技术手段,与相关专业、学科形成交
期刊
报纸
多源遥感数据为遥感图像融合的研究与发展奠定了基础。不同的成像原理所获得的图像侧重体现的信息也并不相同,单源图像所能展现的信息较为有限。因此,在同一地理坐标下,需要获取同时间点的多源遥感图像信息进行融合。全色图像与多光谱图像的融合是遥感图像融合的重点,目的是获得视觉效果清晰且色彩信息丰富的遥感图像。在图像融合过程中,算法的设计对融合结果质量有着至关重要的影响。在对传统算法所出现的问题进行研究分析后,
学位