基于RDF的肺癌医学大数据的药物治疗分析研究

来源 :宁夏大学 | 被引量 : 0次 | 上传用户:jojo0911216779
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,伴随着知识工程的持续发展,研究发现基于语义网的数据集规模呈指数级增长,尤其是在这些大规模的语义数据集中相当大一部分是生物医学数据集。这些生物医学数据集中蕴涵了丰富的语义信息,是面向生物医学领域进行深入数据分析的重要基础。但这些数据集侧重点不同,数据格式、标准不统一,需要进行有效的知识融合和组织表示。因此如何将这些生物医学数据集中的知识以统一的标准组织存储、挖掘知识并加以分析利用是我们研究的方向和主题。目前,肺癌不管是在国内还是国外都有极高的发病率及致死率,同时肺癌及心血管疾病一直是宁夏地区的医疗重点研究方向。本文以肺癌的药物治疗为视角,从多个生物医学数据集中获取与肺癌相关的基因,蛋白质,药物,代谢通路等信息,通过有效的数据融合方法建立语义丰富的肺癌医学知识网络,并在此基础上探索发现语义网络中的重要结点、计算结点的相似度、进行聚类分析,为疾病治疗的研究发展提供新的解决方案。本文首先介绍了近年来网络生物学的研究现状,介绍了非结构化语义数据的存储现状,总结了近年来关于网络链接分析方法的算法和研究现状以及其存在的问题等;接下来以医学领域中的肺癌RDF大数据为研究对象,探索在分布式系统下的大数据组织和存储方法,对于来自网络的生物信息数据集中获取的肺癌的相关数据进行数据预处理,根据数据之间的关联关系将数据组织成RDF三元组,构建肺癌知识网络,并在此基础上设计不同的存储方案实现数据存储;最后分别利用结点重要性、相似性及相关性的并行分析算法对肺癌医学相关数据进行分析,发现肺癌知识网络中的重要结点、刻画与肺癌基因相关的重要因素,为肺癌药物新用及发现新的治疗方法提供新思路。
其他文献
绩效考核是当下出版社普遍采用的对员工工作业绩进行评估的过程.虽然出版社与不同行业的其他企业相比,有其鲜明特点和不同之处,但其实质上已经转变成为国有企业,成为市场的经
伊斯梅尔·卡达莱是当代阿尔巴尼亚诗人、作家。早年卡达莱用诗歌歌颂社会主义政权,后来在小说中他一改歌颂态势,转而批判揭露。本文从小说中分析卡达莱对阿尔巴尼亚的精神建
在外加电场的作用下,材料的光学性能发生稳定可逆的变化,在外观上表现为颜色变化的现象即为电致变色。电致变色材料按照材料类型可分为无机电致变色材料和有机电致变色材料两
改革开放以后,山东省高等教育逐步实现“由小到大”发展,从精英教育发展到大众化、普及化。现如今山东省正处于新旧动能转换期间,应抓紧实施“高等教育强省”战略和“双一流”建设的契机,提高高等教育整体水平,进而推动区域经济的增长。本研究基于山东省与全国2002年至2016年间《山东统计年鉴》《中国统计年鉴》《中国教育经费统计年鉴》中的山东省高等教育经费投入总额、山东省高校教职工数、山东省GDP实际增长情况
<正>一、社会发展引致的农村保险需求随着城镇化进程的加快,农村人口老龄化和家庭小型化趋势的出现,中国农村的空巢家庭、失地农民增加,典型的家庭养老和土地养老功能弱化,农
本文评论、综合和拓宽现有祖籍国与离散族裔关系研究的理论基础,强调该领域现有大多数研究存在碎片化、个案研究倾向和非理论化的现象,指出在这一领域进行比较和理论化研究的
数学核心素养是:具有数学特征的、适应个人终身发展和社会发展需要的人的关键能力与思维品质。其内容包含数感、推理能力、空间想象等要素。结合"长方形和正方形周长的计算""
<正>肺不张又称"肺萎缩",是由多种原因引起的肺无气或肺内气量减少,伴有肺组织萎缩、肺体积缩小的病理形态学改变。而小儿肺不张更是儿科呼吸系统疾病的常见并发症,其病因主
用实例讨论函图象在求最值问题中的应用。
在中国的协商民主体系中,政党协商历史悠久,是贯穿我国协商民主实践的一条主线,具有高层性、战略性、引领性作用,政协协商有相对成熟的理论体系,并且制度化、规范化、程序化