基于情感和异源异构数据融合的潜在关系发现模型研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:striveformonen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物医学数据的数量正在爆炸式地增长,如此海量的数据给医学科学家研究新药带来丰富的理论支持,但研究者们通宵达旦地阅读文献也不及其增长速度,更不用说抽取出隐藏在其中的信息。因此从生物医学数据中自动提取和分析信息的系统变得越来越重要。本论文对科学文献中生物本体间的情感关系表达、潜在关系抽取以及异源异构数据融合三个方面进行研究。随着信息存储多样化的发展,从单一的数据源中抽取信息有时不能满足科研工作者的知识需求,因此要求异源异构数据能实现集成信息服务,达到跨异构库知识发现的目的。为了解决该问题,本论文研究了基于数据融合和基于结果融合的两种潜在语义分析模型,前者将预处理后的数据源进行集成为一个数据集,然后继续对其进行分析。后者先独立地分析各数据源最后将结果集成。本论文通过实例验证,验证了两种集成方法的可行性和有效性。本论文利用基于图的半监督学习算法,即标注传递算法,来自动识别出生物实体之间的情感关系表达。目前,大部分研究都采用有监督学习方法,而且通常能取得较好的性能,但是基于有监督学习的关系抽取模型需要大量有标签的训练数据作为样本集,这将需要花费大量的人力和时间,降低效率。而标签传递算法把标签信息从图中的任意一个节点通过加权的各边循环地传递到附近的其他节点,最终达到全局稳定从而推导出未标签节点的标注信息数据,实现当训练数据不足时改善学习性能。本论文利用基于上下文环境的ABC模型去发现潜在关系,该模型能够挖掘多层级实体的潜在关系,从而获得更全面的结果数据。而且本论文跨越传统的数据构建方法,不用疾病-药物之间的关系直接检索,而是采用非相关关系的数据集作为数据源,即疾病-基因、基因-药物之间的关系,从而能够更全面的分析出疾病与药物之间的非相关潜在关系。
其他文献
目前,在我国建筑工程领域中,由于建筑工程行业的法律体制建立仍未完善,同时合同双方都向利益看齐,缺乏必要的契约信用风险意识,针对合同的履约意识也不强,再加上较多单位利用
政治文化的现代化是政治现代化的先导,在我国这样一个农业和农民大国建设社会主义民主政治,农村政治文化的建设无疑具有重要意义.改革开放以来,农民的政治文化经历了一场深刻
随着国内船用保税燃油市场的开放,近年来船舶燃料供应市场的竞争变得越发激烈和残酷,为了适应不断变化的市场形势,确保公司在船舶燃料供应行业中的优势地位和竞争力,提升公司
十六届四中全会提出了“建设社会主义和谐社会”这一重要概念.知识分子凭借知识、智慧、能力上的优势,要顺应和谐社会发展要求,在构建和谐社会历程中扮演好批判者和建设者两
美国反托拉斯的行政程序经历了国家主义统治和司法至上两个阶段,最后以合作性的制衡整合制度折中而结束。美国民主政治成为多元利益中介,完成了美国民主在工业化社会里的新飞
为了使服装教学适应企业自动化、数字化和智能化需求,本研究以方形贴袋为例,利用常规缝制法和3种不同模板制作法进行比较。研究结果表明:智能化模板制作工艺方法所需时间更短
当前,构建和谐社会的新形势需要信访工作发挥更大的作用。本文在对信访作用进行重新定位之后,对当前信访作用发挥中存在问题进行了探讨。在此基础上思考了构建和谐社会中信访作