基于位置数据的差分隐私回归分析方法研究

来源 :河南财经政法大学 | 被引量 : 0次 | 上传用户:pebblefanny
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着移动互联网技术的快速发展,在各种应用服务平台中移动位置的获取与收集变得尤为容易。为向用户提供更加人性化的服务,通过对搜集过来的空间位置数据进行分析与学习,通过分析出租车所产生的数据能够助力于交通规划、交通监控以及位置推荐等应用。若直接发布基于原始出租车数据训练出的模型可能会导致个人信息泄露,毕竟出租车数据包含着丰富的用户个人敏感信息。将训练出的模型不做任何保护措施直接提供给第三方数据管理者或搜集者分析与研究,用户个人信息可能会被泄露。针对上述问题,一种极为严谨的隐私数据保护差分隐私方法应运而生,差分隐私因不依赖攻击者所获得的背景知识且因具有极强的保护能力而受到广泛的研究。在差分隐私保护下的回归分析方法已得到研究者的广泛关注。回归分析是机器学习中一个重要的研究工作,回归分析能够预测用户打车时间、地点等行为。针对差分隐私模型下的回归分析问题,论文以出租车数据作为研究对象,在满足差分隐私下使用回归分析方法预测出租车费用与出租车需求量。针对出租车费用预测问题,论文提出了DPAA(Differentially Private All-attribute Algorithm)、DPDA(Differentially Private Distance-attribute Algorithm)、DPSA(Differentially Private Single-distance Algorithm)三种模型参数计算方法。DPAA方法把出租车起始位置与结束位置所对应的经纬度作为敏感属性,其余属性为非敏感属性且分别对其所形成的多项式系数添加噪音,结合噪音系数与目标函数求解模型参数;DPDA方法先在满足差分隐私条件下利用余弦定理与haversine公式把起始位置与结束位置的经纬度转换成球面距离,再把球面距离作为敏感属性且与剩余非敏感属性求解模型参数;而DPSA方法只使用球面距离作为敏感属性求解模型参数。实验结果表明,上述方法预测精度均优于同类算法。针对出租车需求量预测问题,论文提出了一种在差分隐私下的基于光滑敏感性与合成训练集的出租车需求量预测方法TDDP(Taxi Demand prediction with Differential Privacy),该方法包含OP(Output-based Perturbation method)与OFP(Objective-Function-based Perturbation method)两种线性回归模型参数方法,两种方法均先通过连接操作将多个数据集合成满足差分隐私的训练集,再利用geopy地理编码库将出租车的起始位置转换所对应的区域编码;最后结合含有区域编码属性的训练集计算模型参数。实验结果表明,上述方法其预测精度均优于同类算法。
其他文献
X射线相衬成像技术作为一种新的X射线成像方法,因其可对弱吸收物质实现高对比度衬度成像,与传统的X射线吸收成像技术相比,具有更高的灵敏度,因此成为X射线成像领域的研究热点
随着社会的不断发展,能源与环境成为摆在人类面前的两大突出问题。由于化石能源的枯竭和环境污染的加深,使得人们努力寻找清洁、可持续发展的新能源。而氢能作为一种公认的清
樟芝是一种台湾特有的食药两用真菌,其活性成分主要有泛醌类化合物、萜类化合物、马来酸和琥珀酸衍生物以及苯环衍生物等。从其子实体中分离的倍半萜类化合物antrocin具有很
辐射源信号分选是现代电子战中电子侦察的关键技术。辐射源信号分选是指将侦收到的电磁信号按照所属的辐射源进行分类。目前通常利用信号特征参数来实现辐射源信号分选,但事实上来自不同辐射源的电磁信号所含的信道特征同样具有较大差异。本文研究基于信道特征差异的辐射源智能分选方法,该方法分为两步:首先对电磁信号的信道特征进行提取,然后利用聚类技术对提取到的信道特征进行聚类从而实现辐射源信号的分选。针对本文提出的新
随着高新技术产业的快速发展,我国的电子与通讯设备制造业因缺乏核心竞争力而丧失了市场主导权。尤其在半导体行业,很多企业为提升核心竞争力进行技术研发的同时,除了面临巨大的原材料产能缺口,还面临复杂的制造工艺流程导致的双重产出不确定。这不但增大了企业的投入成本还对供应链运作带来了极大的影响。因此本文基于现实问题的考虑,构建了由一个供应商和一个制造商组成的上游单周期二级供应链系统,旨在研究供应商和制造商同
急性髓系白血病(Acute myeloid leukemia,AMIL)是髓系造血干/祖细胞恶性增殖性疾病,临床上多数患者进展迅速,预后较差,长期生存率仅30%左右。其中,MLIL重排的AML治疗更为困难
近年来,日盲探测器因其背景噪声低及灵敏度高等优势,在光电子技术领域发挥了其不可替代的作用。Ga2O3作为一种新型宽禁带氧化物半导体材料,其禁带宽度为4.45.3 eV,具有可见光
ZnO是一种透明氧化物半导体材料,室温下的禁带宽度为3.37eV。通过向ZnO中掺入Cd元素得到ZnCdO合金,可以有效减小ZnO的禁带宽度,从而调节ZnO的光致发光从紫外至绿光波段。然而
随着世界经济发展趋势的转变,服务业尤其是生产性服务业在我国产业中占比不断增大,对经济增长的贡献也日益增加,已经成为当前经济增长的主要推动力,而生产性服务业的集聚在增强区域竞争力、调整产业结构等方面起到重要作用。东北地区的经济发展曾一度陷入困境,经过一系列的产业结构调整后虽然取得了一定的成果,但生产性服务业的发展仍处于落后阶段,存在整体规模小、集聚水平低、结构不合理等问题。近年来,东北地区生产性服务
导航与位置服务(LBS)已成为继互联网之后发展最快的新兴产业,车载导航作为LBS的主要应用领域,近年来也持续高速增长,无人驾驶更是作为未来汽车的研究方向,是当前科技前沿研究