基于安全多方计算的分布式基因序列相似性计算

来源 :西北农林科技大学 | 被引量 : 0次 | 上传用户:hanfenng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因组数据的共享与分析为人们理解生物机理、进行高水平医学诊断与治疗、促进临床医疗健康数据再利用,以及加速科学发现等提供了极为有效的途径。编辑距离作为一种重要的相似性度量方法被广泛的应用于人类基因组研究中。然而,基因数据中包含敏感的个人隐私信息,不加保护的传播会造成严重的后果。面对在不同区域不同单位的基因组数据集上进行隐私保护模式下的序列共享与分析这一挑战,本文提出了一个基于安全多方计算的分布式基因序列相似性计算模型,并利用GMW秘密共享协议上的最新技术进展实现了这一模型。本文的主要工作有以下三点:(1)设计并在GMW电路上实现分布式安全序列分析模型。本文首先对安全多方计算领域内当前流行的隐私保护技术进行了分析对比,得出采用了不经意传输扩展协议与不经意传输预计算等技术后GMW协议所具有的优势。然后,在实际需求场景下设计了一个不需要任何三方委托平台的分布式安全基因序列分析模型。最后,在GMW协议下用布尔逻辑电路实现了这一模型。(2)基因数据的预处理及结果的整合。为了提高运算效率而不丧失应用价值,本文采用一个近似编辑距离计算方案来度量基因序列的相似性。为了降低模型的运算负载,本文将生成的测试序列数据集对齐到一个公共参照序列并优化距离计算方案从而将模型中的部分运算移到了各参与方本地。为了尽可能降低电路复杂度,本文利用哈希算法DJB2将序列编码为二进制串。为了减少内存和带宽占用,本文提出数据分块策略来完成基因序列的对比并整合所有块上的输出以得到最终结果。(3)实验的设计与分析。本文在不同的参数和应用情景下分别设计了实验,详细分析了模型在运算效率、逻辑门数量、误差率,和网络带宽占用等各个方面的表现。同时,也与其他最新提出的安全基因序列编辑距离计算方案进行了对比并进一步证明本方案的优越性。相比于现存的方案,该分布式安全序列分析模型不仅在理论上支持任意多个参与单位在半诚实环境下同时进行序列对比而不泄漏任何一方的基因数据信息,而且能够在8s中完成两个参与单位各一条序列上5000个位点的距离计算,在320s中完成3个参与单位各5条序列上5000个位点的比较。
其他文献
<strong>Background:</strong><span style="font-family:;" "=""><span style="font-family:Verdana;"> Meconium aspiration syndrome (MAS) in the newborn is characteri
目的通过对婴儿新生儿患儿病原菌感染及部分医院环境,医护人员手分离的病原菌分析研究,为预防控制多重耐药菌在医院内传播和临床合理用药提供依据。方法查阅病历资料和患儿送
目的比较酶联免疫吸附实验(ELISA)、胶体金免疫层析实验(GICA)、微粒子化学发光检测技术(MEIA)和聚合酶链式反应法(PCR)检测慢性肝病患者血清标本的结果符合率,以了解四种方法的特异
患者女,66岁。因“发现左腋下肿物8天”于2015年3月4日入院。入院前8天无意中触及左腋下一枚肿块,到当地医院就诊。查乳腺及腋下彩超提示:左腋下淋巴结肿大;乳腺钼钯提示:左
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
鲁迅作为文体家、小说家,在其历史小说集《故事新编》中开创了“故事新编”体与“油滑”艺术,其核心为后现代主义的戏仿、拼贴等艺术手法,具体到技术层面则主要为古今杂糅,其
目的分析护理干预高血压患者生活方式对血压控制的影响。方法选取2012年7月至2014年7月在我院接受高血压治疗的患者56例为研究对象,根据患者的入院顺序随机分为两组,每组28例
目的进一步探讨急性百草枯中毒及时、有效的治疗方案。方法回顾分析5例百草枯中毒患者给予早期彻底反复洗胃,胃肠道吸附,导泻,血液灌流串联血液透析联合免疫抑制剂等全方位治
<strong>Objective:</strong> <span style="font-family:;" "=""><span style="font-family:Verdana;">To determine the prevalence of proteinuria in children living wi
目的对我院药品不良反应(ADR)报告进行分析,了解我院药品不良反应发生情况。方法对我院2009年至2011年上报国家不良反应监测网101例ADR进行分类统计和分析。结果 101例ADR中,男