针对在校大学生的真实负调查及其重构算法研究

来源 :武汉理工大学 | 被引量 : 3次 | 上传用户:gz_firefox
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络和大数据技术的飞速发展,敏感数据和个人隐私泄露的情况也越来越严重。负调查是一种可以在收集敏感数据的同时保护参与者个人隐私的调查方法,已有的关于负调查的研究主要是基于特定假设的模型,例如负选项被选的概率服从均匀分布或者高斯分布,然而,在由用户手动填写的真实负调查中,负选项被选的概率可能不服从任何分布。并且,根据笔者的文献调研,负调查最初应用于网络数据的收集,在已有的负调查的研究中,还没有研究者通过参与者手动填写问卷的方式收集数据来实施负调查。本文通过在真实环境中实施由参与者手动填写的负调查,分析了由参与者手动填写的真实负调查在数据分布和数据重构方面的特征,并提出了两种较适合于由参与者手动填写的真实负调查的重构算法。本文主要工作如下:(1)在真实环境中实施了由参与者手动填写的负调查及其相对应的正调查。本文通过分析在校大学生在学习和生活中的隐私问题,同时结合负调查的特点,设计了包括匿名的正调查、实名的负调查以及实名的正调查三个部分的调查问卷,并在武汉理工大学和中国地质大学(武汉)两所学校实施了调查。在数据清理后得到各部分的有效数据分别为811、550、528份。在数据初步统计后,分析了由参与者手动填写的真实负调查数据的特点,并得出了一些有关由参与者手动填写的真实负调查在数据分布和数据重构方面的特征。(2)提出了一种基于背景知识的负调查重构算法NStoPS-M。本文通过分析实名的负调查和实名的正调查两部分采样的数据,得到采样矩阵,并以此为背景知识,提出了负调查重构算法NStoPS-M。实验结果表明,对于问卷中的大多数(10/15)题目,NStoPS-M可以取得比已有的重构算法NStoPS和NStoPS-I更准确的结果。同时,本文通过实验分析了NStoPS-M重构的正数据在采样数量和采样选项数方面的规律。(3)提出了一种基于最大似然估计的负调查重构算法NStoPS-MLE。由于NStoPS-M重构的正数据存在负值问题,本文通过分析负选项被选的特征,结合多项分布的概率公式和负调查本身的约束条件,提出了一种可以在负选项被选结果已知时,计算取得最大似然估计的某个正数据值的方法,并针对这一思想提出了负调查重构算法NStoPS-MLE。实验结果表明,对于问卷中的大多数(12/15)题目,NStoPS-MLE可以取得比NStoPS、NStoPS-I以及NStoPS-M更准确的结果,并且解决了NStoPS-M的负值问题。同时,本文通过实验分析了NStoPS-MLE重构的正数据在采样数量和采样选项数方面的规律。本文实施了由参与者手动选择的真实负调查,在分析了由参与者手动填写的真实负调查特征的基础上,提出了基于背景知识的负调查重构算法以及基于最大似然估计的负调查重构算法,通过实验验证了它们的准确性,并且分析了运用它们重构的正数据在结果准确度方面的一些特征。本文的工作可以给负调查的理论研究以及应用研究提供一些有意义的指导。
其他文献
设G是一个连通图.如果图中生成树的每条路是非分离的,则将这样的生成树叫做Tutte树;如果树的最大度,至多为k,则将这样的树叫做k-树.在本论文中,我们首先考虑了存在Hamilton路的图且当这条Hamilton路满足一定条件时图上存在Tutte树.其次给出了在图中生成k-树上指定顶点满足一定条件的充分条件:(1)设k和s是整数有≥ 3,k ≤ s,假设G是|G| ≥ 2s+1的(s+1)-连通图
基于金属-氧化物-半导体(MOS)晶体管的存储器(例如阻变存储器(RRAM)、铁电存储器(FRAM)和NAND闪存等)在半导体工业的发展中已经发挥了数十年的重要作用。其中以其构造简单、
G=(V,E)是一个以V为点集和E为边集的图.子集D(?)E是一个全边控制集,如果G中每一条边至少与D中的一条边相邻.全边控制集问题是找到G的一个最小全边控制集.图G的最小全边控制集
作为MEMS(Micro Electromechanical System,即微机械系统)传感器十分重要的组成部分,MEMS压力传感器广受关注。与传统压力传感器相比,MEMS压力传感器尺寸较小且大多数为批量生产,因此在其生产制造过程中不可避免的将会产生尺寸变差。由于尺寸效应,MEMS压力传感器的微小变差将会对其质量性能的稳定性产生一定影响。因此,本文将稳健设计方法应用于微器件的设计领域,对MEMS
机器人运动学是运动控制的关键,是机器人学研究领域中的难点之一。本文将共形几何代数(CGA)应用于并联机器人运动学中,遵循平面到空间,简单到复杂的原则,完成了几种典型的并联机构运动学求解,得到了各种类型的并联机构的单变量输入-输出多项式方程,获得了运动学的解析解。求解过程几何直观性强,避免使用旋转矩阵以及复杂的代数消元。探索了CGA在并联机器人运动学中的应用并为并联机器人正运动学分析提供了一种新思路
本文主要研究了Timoshenko方程组Cauchy问题及双极非等熵Euler-Poisson方程组周期区域问题光滑解的整体存在性.对Timoshenko方程组,将之化为一般对称双曲方程组形式,在Sobolev空间框架下,利用能量积分方法以及反对称化技巧,得到了解的能量估计和相应变量的耗散能量估计,再利用连续延拓的方法得到常平衡态附近解的整体存在性.对双极Euler-Poisson方程组,由于方程
从五粮液涉嫌关联交易事件到用友软件将大额研发费用资本化事件以及华力创通实施多项盈余管理以期实施股权激励等等,上市公司的盈余管理现象仍然比较普遍。对于盈余管理的治
图像插值技术作为图像处理中一个基础的、重要的分支,诸如在军事雷达图像、图像压缩、图像分辨率调整等领域中发挥着极其重要的作用。由于包括双线性插值、立方卷积插值(cubi
磁盘已经成为计算机存储系统的主要性能瓶颈,而固态盘是基于闪存的存储设备,具有读写性能高、能耗低和抗震性好等优点,近年来在个人电脑、移动设备、虚拟机服务器、高性能企
情感是一种和生理以及心理相关的过程,体现了人们对物体或事情的潜在反馈,在人与人之间的交流中有起到了重要的作用。我们既可以通过文字,也可以通过声音、面部表情和肢体动