隐私感知的多类型健康数据缺失值预测及应用

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:qq02040610
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着国家经济蓬勃发展,人民经济水平和生活质量有了很大提升。人们在追求高品质生活的同时,对自身健康状况的关注度也日益提高。在日常生活中,人们往往会通过健康数据来监测自己的健康状况,比如医院里的体检数据、运动手环里的数据、运动健康类软件里的数据等。这些数据是反映人们健康状况的重要依据。在大数据时代,人们获取自身健康数据的方式多样且日益简便,比如可以通过手机软件、穿戴设备来获取自身健康数据。因此,人们的健康数据在逐渐累积。健康数据的重要性不言而喻,但是在现实生活中,由于一些主观和客观原因,比如系统更新、设备故障、操作失误等问题,往往会造成部分数据丢失而出现缺失值。数据丢失是一个十分常见但又十分令人困扰的问题,缺失值的存在可能会使人们的健康信息不完整,从而导致人们的历史健康数据不可用。因此,预测和补全这些缺失值是十分必要的。而在预测和补全用户的健康数据缺失值的过程中,不可避免会涉及到两个主要问题:(1)在预测和补全健康数据缺失值时会用到用户的历史数据,这可能会泄露用户的健康数据,侵犯用户的隐私。(2)用户的健康数据是非常复杂的,这些健康数据一般是多维的,每个维度可能又包含不同的数据类型(例如连续型、离散型、布尔型等),这就给预测和补全健康数据缺失值带来了极大的挑战。针对以上两个问题,本文进行了一系列探索和研究,旨在保护用户隐私的前提下,对用户的健康数据缺失值进行预测和补全,并将这种方法应用于实际生活当中。以下是本文的具体研究工作:(1)本文将局部敏感哈希算法引入到复杂数据的处理以及缺失值预测补全问题当中。局部敏感哈希技术(Locality-Sensitive Hashing,LSH)是一种高效处理近似近邻搜索的技术,它能够将带有敏感信息的用户数据哈希成不包含隐私或者包含隐私很少的用户索引,从而保护用户隐私。另外,本文在WISDM数据集上将本方法与设计的对比方法进行实验比较,通过衡量几个常用的指标,证明了隐私感知的多类型健康数据缺失值预测方法的有效性。(2)在实际应用中,本文设计开发出一个健康管理系统,并将隐私感知的多类型健康数据缺失值预测方法应用于本系统。本文先对系统进行可行性分析、需求分析(功能需求分析和非功能需求分析),然后再对系统进行概要设计和详细设计,并利用Java语言和Eclipse开发环境进行软件的开发。
其他文献
人类细胞中包含大量的micro RNA(miRNA),它们通过与m RNA互补调控基因的表达,阻碍m RNA的翻译过程,或者降解m RNA,从而参与包括发育、细胞增殖和凋亡等在内的生物进程。研究表明,miRNA的异常表达与人类恶性肿瘤的发生与发展息息相关,因此,miRNA表达谱可作为肿瘤等疾病临床诊断、分类、分级甚至预后与治疗的指标,并为治疗提供新的靶点。通过生物实验研究疾病相关miRNA结果虽然
近年来,计算机视觉技术飞速发展,行人检测作为其重要研究领域也得到了巨大的进步,逐渐趋于实际应用。而现有传统检测算法仍存在特征提取片面、检测精度较低、时间复杂度较高等问题,随着深度学习算法在行人检测中的研究和应用,在卷积神经网络基础上衍生出了一系列深度学习检测算法。相比于传统检测算法,深度学习算法有更强的鲁棒性及泛化能力,能够更快、更准的检测到行人目标。得益于行人检测理论的不断创新和优化,行人检测为
无线传感器网络(Wireless Sensor Networks,WSNs)目前已经在军事、医疗、工业以及农业等各个重要领域得到了广泛的应用。有意义、有效的WSNs仿真平台可以为WSNs在上述领域的规划和设计提供科学的定量依据,大幅减少网络部署周期,使组网更加科学合理。更重要的是,WSNs仿真平台可以辅助验证无线网中的隐私泄露问题,从而实现在不暴露被监测对象的信息的情况下,提升网络系统的安全性。传
随着海洋工程作业的发展和进步,自主式水下机器人(Autonomous Underwater Vehicle,AUV)在海洋石油管道检测、船体检测、海洋测量、水下考古等领域都得到了广泛应用。自主式水下机器人系统具有非线性、耦合性、时变性等特点,且复杂多变的水下环境使其遭受着无法预知的外部干扰,因此对自主式水下机器人的轨迹跟踪控制提出了更高的要求。本文针对具有模型不确定性和外部干扰的自主式水下机器人系
排序问题又称时间表理论,是组合优化的重要组成部分.它和我们的生活密切相关,在运输,冶炼,制造等方面都有广泛的应用.随着市场经济的兴起和人民生活水平的不断提高,企业需要在相同的资源下获得较高的利润.而累积效应排序是一种现代排序新模型,本文研究这种排序问题.论文总共分为四章.第1章介绍了排序,算法,P类问题和NP类问题的相关知识以及符号.第2章和第3章讨论的工件累积效应模型为pj(π;r)=pj(1+
D-1,2,4-丁三醇(BT)为一种四碳多元醇,普遍应用于军事和医药等领域。为进一步优化生物法一步合成BT的合成代谢途径,通过对葡萄糖代谢途径(EMP途径)改造,强化供应NADPH有效促进了BT的合成。敲除EMP途径关键基因pgi后,结果显示pgi基因缺失菌株MJ135kp G胞内NADPH/NADP+增加了25%。摇瓶发酵结果显示NADPH/NADP+的增加也促进了BT的合成,BT产量由未调控N
黑线仓鼠(Cricetulus barabensis)是生活在北温带的小型啮齿类动物,体型小,繁殖能力强,在我国具有广泛的地域分布,是我国北方农牧业的主要害鼠之一。啮齿动物通常是生物群落中的关键物种,在维护生态系统的结构和功能中发挥重要作用。因此,了解啮齿动物种群波动的潜在机制具有十分重要的意义。黑线仓鼠是一种典型的季节性繁殖动物,其种群数量波动具有典型的季节性节律特征,而光周期是影响其季节性繁殖
在组合数学中,经常借助多项式研究相应系数序列的性质,因此,多项式是连接离散数学和连续数学之间的桥梁,它可以使我们借助连续数学的相关知识去解决离散数学中的问题.多项式序列的研究是组合数学中的经典问题之一,包括其Jacobi型连分式表达式、Hankel行列式以及单峰型性质等的研究.由于多项式序列的Hankel行列式以及单峰型性质都可以借助Jacobi型连分式表达式得到,因此Jacobi型连分式表达式的
近年来,学生的数学认识信念受到越来越多研究者们的关注,许多研究都表明数学认识信念对学生的数学学习过程起到一定的作用。关于个体认识信念的研究大多以教育工作者和大学生为研究对象,对中学阶段学生的认识信念的研究仅停滞在认识论信念的维度构成及测量上,对于如何培养中学生的数学信念或如何转变中学生的数学信念研究较少,笔者认为该领域的研究是非常有必要的。从1972年HPM组织成立开始到现在这40多年的时间里,数
高能重离子碰撞反应中产生的末态夸克胶子等离子体转变为各种强子的过程称为强子化过程,这是一个非常复杂的非微扰量子色动力学过程。由于非微扰困难,目前强子化还无法从第一性原理直接计算和模拟,只能采用唯象模型近似描写。强子化的研究需要紧密结合各类高能反应,利用不断丰富精细的实验数据检验现有模型、发现新规律。极端相对论重离子碰撞实验如RHIC和LHC能够在碰撞初期产生一种高温高密的夸克胶子物质状态—夸克胶子