基于融合特征表示的癌症研究趋势分析算法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:wyzxfjjx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
癌症研究在生命科学和医学领域中至关重要,许多国家和组织每年花费在癌症研究的经费高达数十亿美元。随着大数据时代的到来,先进的设备和技术对于研究人员已是触手可及,但是随着海量信息的增长,医生及生物研究人员很难处理日益增长的信息过载问题。因此,随着生物医学研究论文的爆炸式增长,采用机器学习访求可以帮助研究者们在庞大的文本数据资源中快速获取信息,使他们更有效的了解近年的癌症研究重点和发展历程以提升人类医疗的集体经验。随着计算机技术的发展,自然语言处理的研究越来越火热,其在机器翻译、信息抽取、文本情感分析、自动问答和个性化推荐等领域都扮演着重要的角色。其中文本特征表示的相关研究是自然语言处理领域的重中之重。人类的文本语言逻辑无法被机器所识别,因此我们需要通过机器学习算法将文本转化为机器能够理解的形式。文本特征表示形式多种多样,一直以来是人们关注的重点,其对文本表示的准确性是下一步相关应用工作的基础。本文将自然语言处理领域与医学领域相结合,利用融合的特征表示方法对癌症研究趋势进行分析。首先,本文对传统的文本特征表示模型进行了融合改进,并通过机器学习分类与聚类算法对不同文本特征表示模型得到的文本向量进行相关实验,进而衡量不同向量对文本信息的表示准确性。实验结果表明Tr-W2v算法得到的融合文本向量在分类实验中表现效果最佳,而Ti-W2v算法得到的融合文本向量在聚类实验中表现效果最佳,本文对于此结果结合相关算法特点也进行了直观的解释。其次,本文基于融合改进的文本向量进一步提出了相似度趋势分析、关键词趋势分析和改进的关键词趋势分析等多种癌症趋势分析模型。其中相似度趋势分析模型分析了近年中国五大高发癌症的相似度走向趋势。随后,以肺癌数据为例,本文提出的关键词趋势分析模型分析了肺癌整体的研究方向和区域。为进一步解决关键词趋势分析模型的不足,本文提出的改进的关键词趋势分析模型从肺癌相关的基因蛋白、肺癌相关的治疗药物和方法以及肺癌相关的其他热点等多角度进行了更细致的分析。根据本文得到的癌症趋势分析结果,医生及生物医学研究者可以从大量癌症研究论文中了解到每年的不同热点区域差异和相关的联系趋势。这可以在很大程度上减少相关人士阅读大量论文和追踪热点的工作量,并在一定程度上辅助指导他们快速搜集信息和进一步开展工作。
其他文献
随着云存储的飞速发展,愈来愈多的数据所有者被激励将其数据进行外包,然而安全与隐私问题始终是阻碍云存储得到普及的主要原因。在云存储中,主要关注的是为终端用户提供安全性,以保护文件或数据不被未经授权的用户访问,以及云本身不能从数据中得到任何私密信息。为了满足上述安全需求,本论文采用代理重加密方案来保护云存储安全。在代理重加密方案中,一个半可信的代理人使用重加密密钥将授权者公钥加密的密文转换成被授权者私
土地是一切生产和生存的源泉,每一个国家的土地制度深深影响着一个国家的发展,每一次土地制度的改革也对社会发展产生极其深远的影响。合理的土地制度,能够稳定社会,促进国家
生产抗菌纺织面料的后整理工艺比较复杂,不仅需要使用毒害化学物质,而且会产生大量漂洗废水。为了发展绿色整理技术,减少有毒物质排放,人们越来越关注低毒性天然抗菌剂。甜菜
随着行政民主化趋势的不断增强,公共行政逐渐从单方治理的模式转变为合作治理,以行政约谈为代表的新型治理手段应运而生,推动了执法方式的创新,并在税收领域、食品安全领域、
翻译是重要的文化传播方式,文学翻译作为翻译的一种文体,在内容表达、艺术魅力等方面具有不同于非文学翻译的显著特征,而且往往还承载着浓厚的文化内涵,所以文学翻译对不同语言间的文化探究及学习至关重要。本次翻译实践的原文选自弗兰西斯·斯科特·菲茨杰拉德的短篇小说《橄榄球场》,翻译字数为1万字左右。本篇报告由两部分组成,即翻译实践报告和翻译实践内容。本篇翻译实践报告以语境理论为指导,重点对翻译实践中所采用的
驾驶员如何识别指路标志并形成路网空间表征是交通心理研究的热点问题。文字排版方式对阅读行为影响的研究发现,无论汉语还是蒙语,文字排版方式都会影响其认知加工。以往关于双语指路标志的研究只停留在横向排版方式下,信息量对驾驶员的影响,未深入理解文字排版方式对驾驶员指路标志识别及道路空间关系认知的影响。内蒙古是蒙古族居住的少数民族地区,指路标志为蒙汉双语并用。蒙语与汉语在文字排版布局及视觉认读理解等方面都存
本文以河南省濮阳县胡状镇敬老院老年人为研究对象,前期运用文献资料法查阅有氧运动对老年人身心健康的影响。通过访谈法,实地调查法了解敬老院老年人的身体健康状况,然后对
目标检测是指对图片中的目标进行定位和分类。目标检测是计算机视觉的核心,在图像识别、大规模场景识别等方面得到了广泛应用。深度学习方法在目标检测领域应用广泛,并取得了远超传统方法的效果。基于深度学习的目标检测方法可分为基于区域建议的方法和无区域建议的方法。区域建议方法在图片上生成大量候选区域,将可能包含物体的区域作为建议区域,之后再对建议区域进行分类,无区域建议的方法则直接回归得到物体的位置和类别。基
稀土在农业上的运用是一个重要课题,而从机理上解析氯化镧对水稻调控机制研究却鲜有报道。本研究以中嘉早17号为试验材料,研究不同浓度氯化镧对水稻幼苗叶绿素含量、叶绿素荧光参数、抗氧化酶活性系统和根系相关指标的影响,并进行转录组测序和分析,以期能解释氯化镧调控水稻幼苗的分子机理。主要结果如下:1.不同浓度氯化镧对水稻幼苗生长发育的影响存在一定的差异。长时间的氯化镧处理对水稻幼苗叶绿素含量和光合系统Ⅱ的活
抗生素在细菌感染类传染病治疗中发挥着重要作用,是人类伟大的发现之一。然而,抗生素的滥用导致细菌出现耐药性问题。多重耐药性细菌的日益增长,降低了抗生素的有效性,严重威胁人类的健康。为了解决耐药性问题,我们成功制备并研究了两种能有效改善细菌耐药性问题的纳米复合材料。第一种,使用生物相容性好和可生物降解的镁铝双氢氧化物作为载体,同时掺杂银纳米粒子和光敏剂二氢卟吩e6的纳米复合材料。制备的LDH-Ce6-