我国主要恶性肿瘤危险因素知识图谱研究

来源 :内蒙古医科大学 | 被引量 : 1次 | 上传用户:doudouhuijia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的构建我国肺癌、胃癌、结直肠癌、食管癌、乳腺癌和卵巢癌等六种主要恶性肿瘤的危险因素知识图谱,将目前国内外研究已发现的可能为六种恶性肿瘤的危险因素纳入图谱,为国家和地方对我国主要恶性肿瘤干预提供理论依据。方法利用专家咨询法对前期研究的肺癌、胃癌、结直肠癌、食管癌、乳腺癌和卵巢癌等六种恶性肿瘤危险因素数据库进行评估,判断其是否可直接用于构建肿瘤危险因素知识图谱,并构建六种恶性肿瘤知识图谱本体框架。采用文献检索法系统梳理知识图谱构建模型及相关实验验证方法,对万方数据库、中国知网进行检索,筛选与六种恶性肿瘤及其危险因素相关的文献,为知识图谱的建立提供数据来源。利用人工智能法进行知识图谱构建,从筛选后的文献库中随机抽取部分文献,人工构建抽取规则并完成数据提取,对第一轮抽取结果进行标注并训练后,再次进行第二轮数据提取,最终对抽取的结果进行人工审核。将抽取的全部实体进行实体解析及分类,并依据危险因素分类完成知识图谱本体更新,进而构建知识图谱,并对该图谱进行平台测试及内容评估。结果通过对六种恶性肿瘤危险因素主题数据库进行评价,胃癌危险因素主题数据库构建过程及结果较为合理可靠,可直接用于构建知识图谱,肺癌、结直肠癌、食管癌、乳腺癌和卵巢癌的危险因素主题数据库的构建过程不够严谨,其结果中部分因素存在较大争议,不能直接用于构建恶性肿瘤危险因素知识图谱。文献检索结果中最终用于数据抽取的文献共2030篇,其中肺癌460篇,结直肠癌388篇,食管癌410篇,乳腺癌685篇,卵巢癌87篇。第一轮共抽取到危险因素实体518个,保护因素实体121个,高危人群实体14个,疾病实体5个,三元组769个。第二轮抽取基于第一轮的基础,共抽取到1062个危险因素实体,174个保护因素实体及9个高危人群实体,共得到关系对6235个。经人工审核并完成实体解析后,最终共识别危险因素实体956个,保护因素实体241个,高危人群实体4个。根据各危险因素特征对其进行分类,共包含8个类别,分别为行为及生活方式因素、遗传因素、理化环境因素、疾病因素、药物因素、社会心理因素、生殖因素及其他因素。完成两轮抽取及人工审核后,对抽取结果进行精确率、召回率及F1值计算,其中,乳腺癌相关文献中抽取的所有实体结果精确率最低,为47.47%,卵巢癌相关结果精确率最高,为77.06%;分癌种F1值计算结果中,乳腺癌F1值最低,为57.44%,卵巢癌F1值最高,为82.85%。通过对该知识图谱进行应用评估,认为该知识图谱在知识检索方面效率较高,能够直观展示不同癌种间及其与危险因素的关联,具有较大的使用价值。对现有监测系统与知识图谱进行对比,其中我国慢性病危险因素监测系统内容主要包括饮食、吸烟、饮酒、身体活动、家族史、疾病因素等,我国消化道肿瘤高发地区监测内容类别与其基本类似,但在饮食、家族史、疾病史等方面存在差别,在饮食方面,其更关注于摄入食物的制作方法,家族史与疾病史方面也只限于调查与消化道有关的影响因素。此外,两个监测系统中均未涉及与理化环境因素有关的内容。结论本研究采用专家咨询法、文献检索法和人工智能法构建针对肺癌、胃癌、结直肠癌、食管癌、乳腺癌和卵巢癌的危险因素知识图谱。该图谱以权威专家的经验知识对恶性肿瘤数据库进行评估并建立知识图谱本体框架,为构建知识图谱的核心内容提供了合理可靠的有效保障。利用文献这一较能展现该领域研究现状的途径作为数据来源,通过机器学习这一智能高效的手段,实现肿瘤危险因素知识图谱的构建,并从其知识检索、与监测系统内容对比及应用拓展三个方面进行评估。该图谱能够实现对疾病、因素及其关系的快速检索,并且随着研究者对肿瘤认识的深入,还可以对其内容进行不断更新,保证知识的循环。通过对其进行拓展可用于不同的人群中,在未来恶性肿瘤防控领域应用具有重要作用。
其他文献
目的:观察热敏灸配合针刺治疗神经根型颈椎病的临床疗效;观察神经根型颈椎病热敏现象。方法:1.分组:将64例患者随机分为热敏灸组和温和灸组各32例。热敏灸组采用热敏灸治疗;温和灸组采用温和灸配合针刺治疗。2.选穴:热敏灸组选用热敏点,温和灸组选用压痛点。针刺选穴:热敏灸组同温和灸组,双侧风池、颈百劳、肩井及阿是穴。3.操作步骤:热敏灸组与温和灸组均先采用针刺治疗。针刺20min后,热敏灸组予以热敏灸
随着我国经济规模持续增长,经济社会对能源的需求不断提升。同时,经济社会向可持续发展和能源高效利用方向的转型对能源结构调整提出更高要求。高炉煤气等低热值气体燃料由于产量巨大、利用率低等特点,成为目前亟需解决的热点问题。由于热值较低、不可燃组分多等原因,高炉煤气燃气轮机采用常规点火方式困难较大。等离子强化点火能够很好的解决这些问题,等离子点火时产生的高温、高速、高活性粒子的热射流能够提供稳定、持续、高
载氧体(OC)是实现化学链燃烧技术(CLC)中氧迁移的载体,对化学链燃烧循环和运行效率有非常重重要的作用。载氧体上碳黑的沉积是制约载氧体发展的重要因素。本文通过实验研究了在铁基载氧体(Fe_2O_3/Al_2O_3)的煤化学链燃烧过程中,CO_2气体的通入流量、煤的组分结构及载氧体循环使用次数对烟气中积碳前驱物多环芳烃(PAHs)和载氧体上积碳的生成影响,并分析其作用机理,以期得到最佳积碳抑制方法
湿地具有非常高的生物生产力,为人类提供着各种各样的福祉,被认为是不可或缺、不可替代的资源。然而,尽管湿地的生态重要性不言而喻,它们的价值却经常被忽视或低估。据统计,无论是发达国家还是发展中国家,湿地都出现了不同程度的丧失,尽管我国在湿地保护管理方面已做了大量工作,湿地保护也取得了一定效果,但总体而言,我国湿地退化的趋势在短期时间内依然难以有效遏制和逆转。以若尔盖湿地国家级自然保护区为例,近年来随着
目的:丹参提取物Sal B在CBA/J~((H-2k))×DBA/2~((H-2d))自然流产小鼠模型中的免疫调节作用。方法:本实验方案设计三个小组:第一个小组是正常妊娠模型小组CBA/J×CBA/J,第二个小组是CBA/J×DBA/2J模型基础上的Sal B100 mg/kg治疗小组,第三个小组是自然流产模型小组CBA/J×DBA/2J。Sal B治疗组的CBA/J雌鼠于妊娠第0.5天每日灌胃S
高尔夫是一项古老的休闲体育项目,起源于13世纪的英格兰,目前英国高尔夫球公开赛,是高尔夫史上最古老的也是最负声望的大赛,属于当今高坛四大满贯赛第三站,也是四大赛中参赛
口腔鳞状细胞癌(oral squamous cell carcinoma,OSCC)占口腔恶性肿瘤的90%以上,是全球第六大最常见的恶性肿瘤。OSCC侵袭性高,多侵犯邻近的骨组织,进而转移到局部淋巴结,易出现局部复发,而且具有高度异质性生物学行为,导致不同患者表现出不同的侵袭性和预后。目前OSCC的主要治疗手段是手术、化疗、放疗或这些治疗方式的结合,尽管在联合治疗方面取得了显著进展,但OSCC患者
天潢贵胄是古代社会的特权法主体,在清朝“首崇满洲”基本国策下,清皇族犯罪以圈禁折抵。起兵之初,努尔哈赤出于亲情本能和守住基业的考虑,将有罪诸子免死圈禁;皇太极、福临两朝时局未稳,对待皇亲亦无常法。玄烨效太祖优待亲属,圈禁之制初现雏形,这一既显优容又有极大皇权干涉空间的做法在雍正时期正式成制,胤禛将圈禁换刑制度推行于皇族全体,并逐渐在立法、司法中以爵职为标准对皇族法律地位重新划分,推动皇族由血亲贵族
螺栓连接被广泛应用于航空航天、核能、土木等领域。螺栓连接承受应力、温度等因素的作用,容易产生失效,常见的失效形式有螺栓松动、螺栓组受力不均和螺栓疲劳断裂等。螺栓失
学生在数学学习的过程不可避免地要进行解题,一个良好的解题思维习惯能让学生受益终身,因此在数学教学过程中教师要帮助学生养成良好的解题思维习惯,提高学生的解题能力,发展数学核心素养。本文首先利用文献法对相关研究进行梳理,阐述本文的理论基础,界定相关核心概念的内涵。再通过问卷调查法和访谈法,了解高一学生的数学解题思维习惯现状,得出以下结论:(1)在理解题意方面,大部分学生在做题之前都有熟悉题目的习惯,但