长非编码RNA的生物医学文本研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:2034912
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
长非编码RNA(long non-codingRNA,lncRNA)是一种长度超过200个核苷酸,且不翻译蛋白质的RNA。近年来,越来越多的研究揭示lncRNA在生理和病理过程中起着重要的调控作用。lncRNA的异常表达与许多严重危害人类健康的重大疾病(心脑血管、阿尔兹海默和癌症等)有着密切的关联。lncRNA的研究成为近年来新的研究热点。随着lncRNA的生物医学文本爆炸式增长,自动探索和挖掘海量的lncRNA生物医学文本,从中进一步挖掘和抽取出更有价值的信息,并进一步为lncRNA的后续研究提供更有效的辅助工具具有重大应用价值和挑战性。我们的论文使用基于文本分析和机器学习算法,从多个角度针对lncRNA生物医学文本,分析研究热点和趋势,为研究者提供自动高效的lncRNA知识抽取模型,以及lncRNA论文投稿推荐模型以及在线服务平台。本论文的主要工作包括以下四方面:(1)全面系统地分析了现有的lncRNA生物医学文本。综述了lncRNA的发表趋势和研究热点,利用动态主题模型挖掘lncRNA研究主题以及动态演化,利用聚类算法进一步细化lncRNA研究内容,并重点抽取已有的lncRNA与疾病的关联,特别是lncRNA与癌症的关联。(2)基于lncRNA生物医学文本构建了LncRNA与protein的相互作用关系(lncRNA-protein interaction,LPI)抽取模型。LPI对于理解lncRNA的分子机制和推断其功能至关重要。随着生物医学文本的不断增加,直接从文本中提取LPI将具有巨大的潜力。目前还没有从文献中提取LPI关系的工具。从海量生物医学文本中自动挖掘LPI是一个很有前途和挑战性的课题。因此,我们构建了基于多种文本特征(语义词向量,句法结构向量,位置向量和词性向量)和逻辑回归分类器的识别LPI的机器学习的模型。(3)基于lncRNA生物医学文本构建了一个基于多尺度语义特征融合的分层注意力网络的lncRNA论文投稿的期刊推荐算法模型。目前,推荐系统已广泛应用于商品推荐、广告推荐和数字产品推荐,但很少应用于期刊推荐,尤其是专门针对lncRNA的论文推荐系统。随着深度学习(deep learning)理论及其应用的发展,基于深度学习的论文推荐系统越来越具有实用性。为此,我们构建了基于多尺度语义特征融合的分层注意力网络的lncRNA论文投稿的期刊推荐模型。(4)开发了一个lncRNA生物医学文本研究的综合性在线服务平台。在本论文前三个主要工作基础上,我们开发的lncRNA生物医学文本研究的综合性在线服务平台主要包括三个功能模块:(1)lncRNA生物医学文本分析的展示,(2)基于多种文本特征lncRNA-protein互作关系抽取的在线服务系统,(3)基于多尺度语义特征融合的分层注意力机制的lncRNA论文投稿期刊推荐在线服务系统。这三个功能模块涵盖了基于文本的lncRNA研究热点,在很大程度上方便科研人员使用。科研人员可以通过这个平台直观地了解当前lncRNA发展趋势和研究热点的综述,通过提交Pub Med中的PMID、PMCID或生物医学文本来很方便地提取LPI以及通过提交论文的标题和摘要来获取适合自己研究成果投稿的期刊候选列表。此外,我们在线服务平台中提供了一个经过人工筛选且实验验证的LPI语料库,这为全面开展LncRNA与protein互作关系抽取研究提供有力的数据支持。
其他文献
随着工业社会快速发展,人类面临严重的能源危机与环境问题,以氢能为代表的清洁、可再生、安全高效的新能源形式日益受到人们的广泛关注。近年来,对氢能转化利用装置,尤其是氢燃料电池的研究如火如荼。氢燃料电池在运行时,除了对外部负载提供电能外,还会产生大量废热,如果不能及时将这些废热排出,电池温度会持续升高,导致其输出性能和使用寿命降低,甚至无法正常运行。本文以质子交换膜燃料电池的热管理系统为研究对象,通过
复合材料因其优异的力学性能广泛的应用在汽车、航空领域。随着复合材料的制造工艺的完善,应用在车身、机翼上的复合材料结构件也随之增加。因此,复合材料因结构的特殊性而表现出的材料的应变率相关性也需要进一步的研究。在低应变率工况下,复合材料的失效理论及有限元仿真方法较为完善。但是,在高应变率时,材料力学性能会根据应变率的数值实时更新,降低了传统失效判据和有限元仿真的可靠性。为了提高在高应变率下对复合材料有
针对动车组牵引逆变器工作频率接近二次脉动频率时会产生拍频现象,影响牵引电机稳定运行的问题,基于国内外研究现状,阐述动车组电传动系统直流侧二次脉动电压引起牵引电机产生拍频电流的原理,分析电机参数对拍频电流的影响;分析频率补偿法在工程应用中存在的计算失真问题,提出一种频率补偿优化方案,设计基于频率补偿无拍频控制的方波区矢量控制系统,在dSPACE半实物仿真平台上进行了仿真验证。研究表明:电机电流的低频
闭环控制的并网逆变器作为分布式发电单元与电网的互联接口,其稳定可靠运行对保障其安全运行是十分重要的。若电流传感器出现故障,则系统将面临停机或开环运行的状况,可控性显著下降,因此,研究并网逆变器无电流传感器的控制策略具有重要意义。针对这一问题,本文提出一种基于控制模型和电感模型的电流重构方法,该方法结合控制过程变量、直流侧电压及交流侧电网电压,重构交流侧电感电流,并应用有源阻尼技术优化重构电流。在电
高中生物的分层教学是在对传统班级授课形式改革的基础上施行的个别化的教学方法。分层教学的应用尊重学生的个体差异,可能改变传统教学中的弊端,从某种程度上激发学生之间的合作力和竞争力。本人所在的学校生源情况复杂,既有内地西藏班,又有本地班级,为开展跨民族性分层教学研究提供了适宜的对象。西藏族班的学生由西藏牧区及援藏干部的子女组成,汉族班和藏族班班内学生都存在不同程度的差异,除语、数、外以外,其他科目教师
投资要点本土品牌有望凭借快速学习能力、灵活应变能力突围崛起。预计至2025年面部功效护肤市场中,单一龙头品牌终端零售规模有达到260亿元的可能性(抗衰+皮肤医学级),四大方向有助延展边界:1)品类扩张:有助拓宽用户范围。2)收购整合:欧莱雅陆续收购薇姿/理肤泉/修丽可/CeraVe建立品牌金字塔矩阵;
期刊
随着网络的发展及多方面的需求,卫生职业学院学生(以下简称卫职院校学生)中上网已经成为一种普遍现象。对于卫职院校学生来说,其人生观、价值观尚未真正定型,因此上网过程中难免会存在一些不利于其健康成长的现象。本文在研究过程中就当前卫职院校学生网络生活现状及其管理情况进行了分析,并基于网络生活角度对卫职院校学生管理提出了几点建议。
猪流行性腹泻(Porcine Epidemic Diarrhea;PED)的病原体是猪流行性腹泻病毒(Porcine Epidemic Diarrhea Virus;PEDV),该病具有传播快、流行性广和仔猪致死率高等特点[1]。PED的暴发和流行已给我国乃至全球的养猪业造成毁灭性的打击。目前针对该疾病的主要的防治手段为口服/肌肉注射疫苗、病料反饲等,效果仍然有限。因此,急需开发出新型的病毒防治策
路径规划是人工智能领域的一个重要研究方向,一个好的路径规划算法需要满足两个基本的要素:第一,算法应规划出一条能在飞行过程中绕过障碍物的路径;第二,算法规划出的路径应该是最佳路径,并满足所涉及的各种约束。然而,传统的路径规划算法把所涉及的约束固化在程序中,不方便修改、添加新的约束,因此,本文采用XCSP3语言对路径规划过程中所涉及的约束进行表示,从而实现约束的可动态修改与删除。*算法是一种经典的启发
针对目前高品质番茄价格昂贵,大众需求无法满足的问题,根据番茄对水分和氮素营养的需求规律,研究高粱伴生以及植株生长发育的某个阶段水分胁迫对番茄品质的影响。本试验以品种“铁皮”和“普罗旺斯”为研究对象开展试验,通过盆栽试验研究栽培措施对果实糖酸含量的影响,在此基础上探究水分胁迫和高粱伴生对番茄糖代谢、植株生理特性及土壤微生物的影响。揭示水分胁迫和高粱伴生模式下果实糖代谢、植株生理代谢以及土壤微生物的变