论文部分内容阅读
对于云计算的时代的生物基因的总量之大,传统的生物信息学的生物信息基因数据如何分析与存储正在面临很大的的问题。传统的信息基因数据的存储方案不能检索与查询在密文状态下的个人的基因数据。计算机与生物学相结合,通过利用计算机的高效的计算的能力,针对问题构建各种加密模型,对生物数据的存储研究安全的存储方案。为了支持与帮助生物数据科学的研究,改进传统的生物数据的加密方案与检索方案是非常重要的。由于传统的方案没有在生物数据的存储中引入密文处理的方法,在比较大的规模的数据,若利用传统加密方法加密,对生物数据的检索需要对生物数据的密文进行解密再检索,由此带来一定的安全风险。针对这些问题,因此需要在生物数据的存储中考虑如何对处于密文状态的生物数据的运算,以及如何利用检索规则高效的检索处于密文状态的生物数据片段。为解决上述的问题,本文的研究工作主要为三项。首先是针对生物基因数据重复片段多,取值范围有限,序列片段长的特点,比较各同态加密方案的特点,提出了基于整数的生物数据文本同态加密方案,通过对生物数据集的同态加密处理建立生物数据密文库。下一步工作则是针对具有同态加密的生物数据,提出了使用正则表达式检索的方法对生物数据的密文进行在密文的检索的方案,并在大量的生物数据实验中确定该方案的复杂度。其次的工作是在前二项工作的基础上针对传统的生物服务器系统的响应没有考虑到用户的检索请求多存在相似关联程度的问题,本文在提出了具有支持对用户的检索语句进行分析与提供缓存检索功能的研究方案。最后的工作为基于上述的方案进行生物数据安全访问系统的设计,并完成系统开发的工作。该系统能够对用户提交的具体检索语句的关联度进行计算与分析,可以利用缓存将检索的生物数据序列的大小减小到数十至上百的缓存检索的长度。相对于传统的方案需要检索百万甚至千万的生物数据序列的长度,本文提出的方法不但提高检索结果的可靠性,而且缩短检索的计算的时间与压缩空间的需求。对本文提出的方案与实现的系统进行实验,得到的结果发现,与传统的方案进行比较,由于本文对生物数据进行同态加密并增加支持基于模式的密文检索的方案,针对用户的检索请求构建密文缓存系统,既能对生物数据密文进行基于模式的检索的操作,而且还可以减少检索操作的空间的复杂度与时间的复杂度,在可靠性上都超过传统生物数据的存储与检索的方法。本文提出的解决的方案,解决传统的生物数据的存储与检索的方案没有支持对于密文的操作、基于模式的检索、检索语句的关联度分析于缓存检索的方法的缺点,将为基于生物数据的科学的研究给予极大的支持。本文的实现的系统可以完善对密文的操作的支持的功能,对密文操作的结果也更可靠。