跨域基因数据隐私计算研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:huojugjf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着基因测序和计算机技术的飞速发展,海量基因数据喷涌而出,成为生物医学领域中宝贵的信息资源。为充分利用不同区域海量基因数据蕴藏的巨大价值,行之有效的方法便是各区域基因库拥有者通过数据共享的方式对基因数据进行联合计算及分析,这样可以帮助跨域参与者从更多数量和种类的基因数据中做出更为准确的分析及判断,进而取得更富价值的成果并推动整个基因研究领域的快速进步。然而,现实中因基因数据独特的隐私性致使基因数据共享及联合分析并未得到有效实施,国内外学术界对此研究也极为有限。目前对基因计算的研究工作大多集中在提高基因计算准确率及运行效率上,少数考虑了数据隐私安全的工作主要围绕基因组序列比对方面的研究展开,鲜有涉及到多方跨域的基因数据共享及联合计算等内容。因此,针对如何实现基因数据隐私安全的跨域共享计算及联合模型训练问题,本文主要采用安全多方计算、同态加密及代理重加密等技术,设计了两方跨域联合执行费舍尔精确检验(FT)和连锁不平衡(LD)检测的安全计算方案,并接着提出了基因数据隐私安全的多方跨域联合执行模型训练的基础方案及提高方案。本文主要研究内容及成果总结如下:为解决数据隐私安全的两方跨域执行基因计算问题,本文利用基于安全计算混合协议的ABY开发框架,采用布尔共享及电路优化的策略,在原始的FT检验及LD检测算法上设计了保护基因数据隐私安全的跨域两方联合FT检验安全算法和LD检测安全算法。这两种安全基因检测算法不仅实现了基因数据间的关联性判断和等位基因间的非随机性检测,更重要的是保护了联合计算时基因数据的隐私安全。最后,通过实验测试证明了本文所设计的两个跨域用户联合基因安全检测算法是切实可行的。针对如何实现基因数据隐私安全的跨区域多用户联合模型训练的问题,本文首先采用秘密共享的安全多方计算技术设计了多方联合训练逻辑回归模型的基础方案。该方案不仅实现了跨域多基因库拥有者联合执行模型训练的需求,获得了能对基因数据做出较好的二分类预测的逻辑回归模型,而且确保了整个模型训练过程中原始基因样本数据的隐私安全。然而,由于基础方案中多用户间需要执行大量的模型参数秘密共享工作,故使得方案产生了较大的通信开销。为此,本文在基于多个分布式数据库的联邦学习模式中结合同态加密及代理重加密等技术设计了多方跨域联合学习的提高方案,该方案相较于基础方案显著地降低了用户间的通信开销。最后,本文分别对两个方案进行了安全性证明及实验分析,结果表明本文所提方案是安全高效的。
其他文献
模型预测控(Model Predictive Control,MPC)制能够整合优化建筑控制中多输入多输出的问题,在满足舒适度要求的前提下减少建筑能耗。与此同时,MPC具备人员作息预测的能力,结合人员作息预测进行新风变风量控制可以进一步挖掘建筑中的节能潜力。但是,普通工程人员在利用MPC算法面向建筑控制进行建模时,可能会遇到1)建筑自身及其与环境的物理关系复杂,难以描述为内部模型;2)对维度较高的
21世纪是知识经济飞速发展的时代,市场竞争日益激烈,企业生存愈发艰难,而客户资源愈发重要,大多数企业都不可避免地经历着从以产品为中心到以客户为中心的经营模式的转变。客户成为企业的核心资源,客户知识也随之上升成为企业发展的重要资源,客户知识管理成为企业获取核心竞争力和维护竞争优势的重要战略。烟台爱普森公司是典型的中小企业,成立发展至今已有20年,其主营业务就是通过为企事业单位提供设备和服务来赚取利润
钢筋混凝土框架体系在我国已经是被广泛应用的结构形式,其具有非常完善的设计技术和施工技术。但是这种结构体系的自身抗侧刚度较小,在强烈地震作用下,因为柱子底部的轴力和
随着我国制造业的升级,对相关产品或结构的变形和残余应力检测也会提出更高的要求,以保证制造过程的高效率和最终产品的高质量。数字图像相关法(DIC,Digital Image Correlation)作为一种新型的变形测量方法,具有非接触式测量、全场变形测量、操作简易、精度高和成本低等优点,在中国制造业的升级过程中将会发挥越来越重要的作用。本文以构建计算精度高、计算速度快、适用范围广的DIC软件为着手
红花玉兰(Magnolia wufengensis L.YMa et L.R.Wang)是由北京林业大学马履一教授所率研究团队于2004年发现于湖北省五峰县的新树种,在引种北方的过程中受困于严重的抗寒越冬
电力电子设备产生大量谐波电流注入电网,导致公用电网电压波形畸变,造成电能质量下降。为了减少电力电子设备的谐波污染、保证电网的供电质量和安全,需要对AC/DC变换器进行功率因数校正(Power Factor Correction,PFC),提高AC/DC变换器的功率因数(Power Factor,PF),降低总谐波畸变(Total Harmonic Distortion,THD)。近年来提出的多级脉
细菌纤维素作为一种理想的新型生物纳米材料,具有很多独特的物理性质,使其能广泛的应用于各个行业中。但是随着细菌纤维素的不断发展,对其结晶度、持水力和其它物理性质的要求也越来越高,其基本性质已经不能完全满足工业生产的要求。为了解决这一问题,通常利用改性的方法,但是化学改性难度较大且安全性较低。因此生物改性成为了研究的重点,如何能安全有效地调控细菌纤维素物理性能,将成为未来研究的必然趋势。本文以研究细菌
目标在谐振区时电磁散射特性明显,回波易携带目标谐振特征,其中的极点特征只与目标本身固有属性如大小、材料和形状有关,与雷达入射波的方向、极化方式等外在因素无关,是物体的一种本原信息。利用极点特征进行识别,可大大减少识别所需的特征库模板要求。本文通过对飞机目标回波建模与极点提取,得到目标极点信息并分析极点特性,然后利用极点实现目标的高效识别。本文首先通过电磁仿真软件进行目标的建模剖分与回波构建。而后选
矿下瓦斯数据在采集的过程中经常受到各种因素的干扰,导致采集到的瓦斯数据常含有大量的噪声,若直接使用未处理的瓦斯数据进行特征提取或者预测,将导致大量的错误和误判,不能准确的预测出瓦斯突出等隐患,不能及时的避免煤矿重大恶性事故的发生,因此瓦斯数据降噪对瓦斯防治工作至关重要。对含有“大数”数据和缺失数据的瓦斯噪声数据本文进行了预处理。首先使用不需要查表且能处理“大数”数据的拉依达准则来进行检测和剔除;使
近年来对超疏水表面的研究越来越多,超疏水表面同时具有自清洁、防冰、抗沾污、油水分离等优异性能,可用于航空、航海、电力、太阳能发电等领域。将超疏水性能与蚕丝基底结合,制备具有自清洁效果的超疏水蚕丝织物同样具有潜在的应用价值。本文以氧化镁无机纳米粒子为原料在蚕丝织物表面构建粗糙结构,以有机硅为原料在蚕丝织物表面构建低表面能,通过表面粗糙结构和低表面能复合,对蚕丝织物整理,获得具有超疏水效果的蚕丝织物。