新一代测序数据的快速可视化方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:BecauseArc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着新一代测序技术的成熟,基因组测序数据持续迅猛增长。限制当前基因组数据研究的问题已经不是如何产生数据,而是如何快速地对基因组数据进行分析。把基因组数据进行可视化处理,有利于研究人员更好、更直接地对数据进行观察,发现基因组数据间的内在联系,以及基因组数据中有可能存在的突变等问题。对基因组及其相关注释数据采用可视化的方式进行处理可以很大程度上把研究人员从枯燥繁杂的基因组数据的字符文件中释放出来,节省时间成本,更便于集中精力进行数据的分析工作。以参考基因组数据的坐标为可视化系统的坐标进行展示,较直观地呈现不同序列数据之间存在的关系。现有的基因组可视化系统分为基于WEB和桌面程序两种形式,由于基于WEB的基因组可视化系统受限于网络带宽、传输速度等外在因素,影响可视化系统的速度与用户体验,本文将研究快速基因组可视化的方法,并实现基于桌面程序的基因组可视化系统,该系统小巧便捷,可以更好更快的对数据进行可视化处理,方便个人PC使用。本研究以人类基因组数据的可视化为中心展开,主要研究由变异引起的遗传信息的变化。实现了人类基因组数据、序列比对结构数据的可视化,针对基因组数据突变、反转等常见的变异类型进行可视化呈现的效果更加直观。有利于研究人员进一步研究相关疾病与药物的研制。本系统为研究人员等使用者提供了选择、查找、平移以及放缩等较为丰富的交互操作,并且提出了一种基于B树的存储结构和R树的空间分割理论的针对新一代测序数据文件的索引构建方法,配合文件随机读取算法完成数据的快速读取工作,运用Bresenham画线算法更好地完成了本系统的可视化工作,对可视化响应速度和大跨度进行数据查询时的响应时间提高了近一倍。
其他文献
日前,地处关山脚下的华亭县西华镇草滩村文化广场上热闹非凡,村民们自编自演的说唱《喜说农村新变化》,唱出了山里群众过上好日子的精气神。这是华亭县通过文化扶贫"点亮"农民
通过对烟台地区的地形和海陆分布特点,主要从天气学的角度统计和分析了该地区2001 ~ 2009年大风发生的范围以及不同范围大风的日数年代、季节变化规律,并利用现有的MICAPS资料
目的 研究严重急性呼吸综合征(SARS)患者感染后体内病毒特异性抗体产生规律。方法 收集临床确诊为SARS患者的血清和非SARS人群血清标本,用IgM捕获法、间接法和抗原夹心法三种
按照《会计法》规定,国务院财政部门主管全国的会计工作,县级以上地方各级人民政府部门管理本行政区域内的会计工作,因此对国家机关、社会团体、公司、企业、事业单位等各类
当前对IMS(IP多媒体子系统)技术的探讨主要集中在网络侧上,而缺少对IMS客户端的研究。本文针对IETF、3GPP、OMA(开放移动联盟)、JCP等国际标准组织中IMS客户端的相关规范进行了研
采用测试、问卷调查、访谈等方法,对湖南第一师范学院六年制免费师范生进行了随机抽样调查。研究表明:第一,他们整体英语基础较弱,与高招学生相比有一定差距,尤其在语法、词汇方面
文章运用中国16家财险公司1999—2007年的面板数据,考察财险产业组织规律及保险保障基金制度对财险产业组织的影响,结果显示,中国财险业的市场结构与竞争行为正相关,市场结构与绩
移动新闻传播在促进媒体转型、新闻质量提升,为用户带来定制化的便捷服务的同时也出现了许多问题。移动新闻传播客户端的竞争和不当的把关机制等原因使得移动新闻传播负面化
产业结构调整在西部开发中占据着十分重要的地位。开发西部经济、强区富民,改变落后的产业结构是主要着力点,该文分析了甘肃省产业结构的固疾,产业结构发展方向的选择和定位,并提
随着移动互联网的快速发展,手机新闻直播平台的普及,移动直播的新媒体技术日趋成熟,各种各样的传播模式与手段日新月异,已经从多方面影响着电视新闻的发展。本文通过分析新媒体的