基因检测报告系统的开发

来源 :东华大学 | 被引量 : 0次 | 上传用户：ajimide001

【摘要】

：

背景:近年来随着国家经济的大力发展,所带来生活方式上的转变越来越大,人们不再一味地追求物质上的满足,转而更看重精神和身体上的健康。此时,基因检测技术,这个能够从人类最

【作者】

：

艾昊

【出处】

：

东华大学

【发表日期】

：

2019年01期

【关键词】

：

基因检测报告 python语言网络爬虫 LaTeX语言 Mysql数据库

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

背景:近年来随着国家经济的大力发展,所带来生活方式上的转变越来越大,人们不再一味地追求物质上的满足,转而更看重精神和身体上的健康。此时,基因检测技术,这个能够从人类最根本的遗传信息中,获得有用的信息,并加工处理,产生可阅读的,可理解数据的技术孕育而生。通过测序获得的大量遗传信息,运用实验和对比获得与特定性状相关的等位基因位点,这些等位基因位点因为各种原因,导致等位基因多态性的产生,进而影响相关性状的表达结果。基于这些表达结果不同,建立与之相关的基因数据库,将待检测者遗传信息与数据库比较获得基因控制性状的影响程度结果,进而在诊断疾病和能力基因的检测等方面,提供较为客观的建议。在这其中SNP起到了非同一般的作用。通过基因检测的结果,与SNP数据库比较,得出其相关的性状对于检测者所造成的影响结果,给出一份检测报告,能够直观的反映待检测者对于其感兴趣性状及其相关基因所带来的影响结果,并给与一定专业知识的解读和建议,这是该技术产业如此受到大力追捧的原因。但是基因检测报告在生产过程中还有很多问题,包括:(1)报告流程的不成熟,效率低速度慢。(2)给与的建议解释大相径庭,很难有信服力(3)报告排版模式单一,容易出现乱码状况。因此需要一个成熟的系统过程来满足这个技术产业的需求。基因检测报告系统开发解决的关键点是第一,报告的排版问题,采用LaTeX进行报告的编译,一次性解决好排版模式以及易出现的乱码现象,简单有效。第二,利用python语言结合爬虫技术从专业论文中获取报告所需的科学前沿的观点和相关知识数据支持,很方便的对报告进行更新修改。第三,将这些得到数据放入数据库,能够方便进行检测项目的查找,提高基因检测报告的产出效率和精确性。第四,通过python语言,将各模块,组合拼接,充分发挥其’胶水’的作用,使得基因检测报告系统更为整体,方便。一、报告模版的编译运用LaTeX语言进行大量报告模板的编写,需要进行的编译包括:(1)基本格式模块的编译处理,(2)基本信息模版编译,(3)基因检测结果所对应的检测结果模版。因为检测项目的数量较多,匹配结果产生的结果模板也需要相应数目进行满足。总共编译100个模板满足使用。模版的编译可以使用ATOM或者TEXlive软件。能够直接使用模版生成所需报告pdf格式,快速准确生成报告。二、SNP相关数据信息的获取进行检测结果模版的编译需要有大量相关生物学的知识技术支持,这些数据主要从MEDLINE(生物医学数据库)或者ncbi中的论文中获取得到。获取包括所需的:(1)SNP位点,其相关的性状是我们所需要的.(2)其位点的多态性会对相关性状乃至这个个体造成怎样的影响,所带来的生物医学上的意义。(3)结合获得信息给与较为专业的建议。需要将获取的数据在检测结果模版中体现。课题总共收集120中SNP位点和其相关性状。为了获取这些数据,采用python编写脚本结合网络爬虫技术,从PubMed数据库获得所需要的信息,按照数据库格式要求处理后,放在数据库进行储存使用,以达到在调用模版时起到‘过滤’的作用。三、数据库的构建数据库的建立使用的是Mysql进行建库,使用原因是(1)简单方便.(2)可以通过使用python语言进行交互操作。(3)能够快速方便查询数据库中的检测结果数目和个体,即可以快速查询是否有待检测者所需要的检测项目。(4)是通过数据库能够在调用检测结果模版时,简化调用过程,能够在调用所需模版前对所有检测结果模版进行‘过滤’,只将和检测项目相关的检测结果模版放在一起供输入信息匹配使用调用。这既缩短了调用模版的时间并且提高了效率,又能提升调用模版的准确性。结论:构建的基因检测报告系统,运用LaTeX语言,编译报告模版,能较好的解决word编译过程中出现的乱码问题,增加了模板样式,更加整洁美观,使用python语言编写网络爬虫技术脚本进行数据的获取和初级筛选,将所需的SNP和其相关性状及其影响信息获取储存,并将得到的信息按照一定格式储存在Mysql数据库中,方便查询和调用模版。使用简介:(1)确定输入文件的格式。(2)将输入文件分为基本信息部分和检测结果两部分,分别进入系统。(3)调用基本信息模版和检测结果模版,共同组成最终模版,生成pdf格式文件,产生报告。本报告系统可作为基因检测技术运用的良好补充。

其他文献

基层政府网络DNS隐蔽通道数据泄漏随机森林静态检测研究

数据泄露时时刻刻在我们身边发生,对我们造成极大的威胁。网络黑产将企业和个人信息以白菜价肆意抛售,2017年五角大楼的资料泄密,十八亿个人信息“裸奔”。DNS隐蔽通道是以DN

学位

Hadoop政府网络DNS隐蔽通道随机森林

Ba5（PO4）3F:Eu3+/Tb3+/Tm3+荧光粉和掺锂CaWO4:Eu3+/Tb3+/Tm3+发光特性

新一代光源LED具有发光效率高、寿命长、节能、无污染、显色指数高和生产成本低等诸多优势,因此有着广泛的应用前景。如何进一步提高LED的发光效率,特别是探寻新型的白光LED

学位

LED荧光粉Ba5（PO4）3F:Eu3+/Tb3+/Tm3+CaWO4:Eu3+/Tb3+/Tm3+锂离子CIE

面向软体机器人的液态金属柔性传感器的研究

在过去几年中,软体机器人成为机器人领域的研究热点,其在驱动方式、智能材料、仿生结构等方面取得了许多令人瞩目的成就。然而,相较于软体机器人的驱动、材料及结构来说,软体

学位

柔性传感器液态金属软体机器人微流道技术

基于无线商用设备的情境感知技术研究

情境感知技术研究是当前人机交互领域的前沿课题,即对人体行为的感知和理解,以及对生活环境的辨别。目前已有许多对人体行为识别的研究,大多数都是依赖于传感器以及视觉设备

学位

情境感知信道状态信息行为识别材料检验信号可视化

基于异步检查点机制的细粒度流分区负载均衡方法研究

在流计算系统中,数据倾斜通常会导致负载不均衡进而增加算子处理数据的延时,严重影响系统本身的运行效率。处理数据倾斜的方法是提出更好的分组策略,保证后续到达的数据可以

学位

负载均衡分组策略异步检查点机制运行时状态迁移机制细粒度状态迁移

悬挂式建筑机器人高空作业平台抑振方法研究

在人工对高层建筑的外墙施工中,悬挂式平台是保障作业安全有效实施的主要载具。在高层建筑施工中应用机器人技术有望提高工作效率和施工精度,改善安全性,但悬挂平台仍是目前

学位

建筑机器人高空作业平台振动分析主动抑振被动抑振

基于深度卷积神经网络的图像去噪方法研究及应用

图像去噪是减少数字图像中噪声的过程,是影响图像分割,边缘检测,特征提取等对图像进行后续处理的重要前提。深度卷积神经网络在图像识别、语音处理等方面取得了重大成功,通过

学位

三维剪切波变换协同过滤非局部相关性深度卷积神经网络生成对抗网络

一类高阶泛函微分方程解的渐近行为

微分方程在物理学、力学、生物学、工程学、经济学等众多领域有着广泛的应用.而微分方程的振动理论作为微分方程稳定性理论中的重要分支,近几十年来也得到了重要的发展,许多学者对微分方程振动理论进行了研究和探索,推广改进了一些结论,不仅具有重要的理论意义,而且也具有较高的实用价值.在本篇硕士论文中,我们运用Philos型积分平均,广义的Riccati变换和代数不等式理论等方法,研究了一类高阶时滞泛函微分方程

学位

泛函微分方程非线性振动Philos型积分平均广义的Riccati变换

光纤-无线网络中协同计算迁移策略的研究

随着智能移动设备和移动互联网的高速发展,移动用户及移动应用程序数量正以前所未有的速度增长。为了满足人们的需求,这些新兴的应用往往能耗高、计算密集,而现有的移动设备

学位

光纤-无线网络移动边缘计算任务迁移协同计算迁移策略

融合评分的深度学习推荐算法

随着分布式计算、人工智能、云计算等技术的迅速发展,各类网络服务的应用使数据规模与信息体量呈现指数级增长,推荐系统及其相关技术逐渐成为处理“信息过载”的重要工具。推

学位

推荐算法Word2Vec模型评分偏好注意力机制流派特征

基因检测报告系统的开发

与本文相关的学术论文