基于深度学习的复杂结构识别与推断研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:dashanLau
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实场景很多数据具有复杂结构,如分子结构、数学公式、社交网络数据等。具有复杂结构的数据,其组成元素之间往往存在复杂关系。例如,数学公式中存在的上下标关系,化学分子中原子间的连接。然而,复杂结构关系与逻辑关系的识别与推断十分困难。近年来,深度学习在处理结构关系上展现出巨大的潜能。因此,本文基于深度学习分别研究复杂结构的识别和推断问题。针对复杂结构识别问题,本文对数学公式识别及化学结构识别两个具体任务展开研究。数学公式识别及分子结构识别是将包含复杂结构的图像转换成对应的文本序列。现有方法普遍存在两个问题:(1)未针对图像中的结构关系进行处理;(2)未在序列级别上考虑文本的复杂性。针对上述问题,本文提出一种序列级别的复杂结构识别方法。具体地,本文设计一个结构感知模块来处理图像中复杂的结构关系。此外,为了更好地对生成的序列进行评估以指导模型学习,本文设计序列级别建模,将生成过程建模成马尔可夫决策过程并利用强化学习进行求解。本文在数学公式识别任务上,对比现有方法在EM指标上提升1.73%;在分子结构识别任务上EM指标提升0.66%。大量实验验证了本文方法的有效性。针对复杂结构推断问题,本文在分子性质预测任务上开展研究。分子性质预测是对分子的化学属性进行推断,是一个非常具有代表性的复杂结构推断任务。分子中原子间连接关系复杂且通常包含多个化学属性。现有方法大多利用单个深度网络对所有性质进行预测,其中各性质的权重需要人工的干预与调节。为了更好地捕捉原子间的结构关系,本文通过注意力机制加强分子结构信息的理解。同时,本文基于模型对不同性质预测的不确定性,在网络学习的过程中自动调整各预测性质的权重。本文方法在MLQM数据集的五个目标上对比基线模型平均均方误差减小1.19e-3。在QM数据集的12个目标中的10个目标上预测结果优于现有模型,平均MAE减少0.31。大量实验验证了提出方法能够有效提升分子性质预测的准确性。
其他文献
近年来,我国社会经济不断发展,同时人民的出行需求在也不断增加,造成城市道路交通问题进一步恶化。社交媒体已经成为交通研究的重要数据来源,因为社交媒体内容具有丰富的语义,所以社交媒体数据不仅可以用于识别交通异常发生的时间和地点,还可以识别交通事件背后的原因,即交通事件的具体类型。因此通过社交媒体提取出的交通信息为交通管理部门提供交通舆情,为交通治理提供交叉验证、后评估的作用,可根据此数据分析不同交通事
《青藏高原生态保护法》需要国家发挥高地生态宏观调控机制,从全局上对青藏高原生态保护提供战略性、全局性和宏观性的指导和引导,实现青藏高原可持续发展。高地宏观调控机制是《青藏高原生态保护法》立法的必然选择,我国现行《宪法》为其提供了正当性依据。在具体实施路径上,应明确高地生态宏观调控的权力主体、央地事权划分标准,制定由中央发挥高地生态宏观调控机制的事权清单,规范宏观调控工具,并注重差别性和特殊性的制度
目的:心肌纤维化以细胞外基质合成与降解失衡为特征,是多种心血管疾病的重要病理过程,进一步进展会导致心力衰竭的发生,目前其发病机制尚不明确。成纤维细胞生长因子(Fibroblast growth factor,FGF)具有广泛的生物学作用,FGFs中的FGF2、FGF16、FGF21、FGF23被发现参与了心肌纤维化的调控。目前尚未有文献报道FGF7对心肌纤维化的作用,FGF7的作用可能一直被忽视,
随着我国城镇化水平的持续提升,民用建筑能耗问题逐渐成为各界关注的热点问题,而热水系统能耗在民用建筑总能耗中占据较高的比例,缺乏合理的系统控制策略是导致热水系统能耗较大的一个重要原因。研究热水系统运行特性、负荷预测与控制策略、推广热水系统节能降耗技术对实现建筑节能、保护环境和改善民生具有重大意义。实际热水系统的控制策略调控方式较为粗放,系统制热量存在一定的设计余量,热泵和太阳能之间的配合也缺乏科学方
医学诊断技术的进步与我们每个人生命健康息息相关,随着科学技术的发展,许多研究学者对人工智能技术在医疗诊断领域的应用非常关注。其中癌症是对人类极具威胁的一大病种,患者预后治疗效果备受关注,一般通过五年生存率来衡量癌症患者经过治疗后的治疗情况。根据柳叶刀全球健康数据统计,目前大部分癌症的五年生存率仍然较低,例如肺癌、肝癌、胆囊癌和胰腺癌等等,其五年生存率均不足20%。也因为医学治疗过程的特殊性,仍然存
作为手机屏幕的重要组成部分,手机玻璃盖板具有保护触摸屏、保证透光率的功能。在其生产过程中,由于生产生成过程中不可避免的会存在包括划伤、凹凸点,墨渍、点污等产品缺陷和质量问题。为提升产品良率,对生成后的手机玻璃盖板进行有效的质量检测成为必须。针对手机玻璃盖板缺陷检测问题,本文以深度学习图像处理理论为基础,展开了如下研究:(1)搭建了针对手机玻璃盖板缺陷检测的双侧远心线阵视觉图像采集系统,并对成像模型
有机气凝胶因其极小的密度和优异的隔热性能,在建筑装饰、交通运输和航空航天等领域具有广阔的应用前景。然而,大多数有机气凝胶主要由碳、氢元素构成,遇火极易燃烧,严重威胁人们的生命和财产安全。目前,主要依靠添加阻燃剂来提高有机气凝胶的阻燃性能。然而,阻燃有机气凝胶在使用过程中,特别是应用于高温隔热领域时,依然存在着闪燃和助长火灾蔓延的风险,无法满足日益提高的消防安全要求。因此,本论文将有机气凝胶与蒙脱土
随着我国“一带一路”合作倡议的逐步深化,我国在西非地区的道路援建项目也逐步增多,西非地区广泛分布着红土粒料等我国少见甚至没有的特殊筑路材料,红土粒料在矿物组成、力学性质等方面存在较大变异性,当地也没有通用的红土性能标准。研究针对西非区域内的多种红土粒料,进行了材料特性分析、力学性能分析、数值模拟试验、强度形成机理分析和工程应用推荐,旨在为道路设计和工程建设提供一定的参考。首先,对西非地区十几种天然
稻谷、小麦和玉米是中国的三大主粮,以其为原料制成的米面制品含有丰富的营养物质,但其在加工、储藏、销售的过程中均容易被食源性微生物污染。据调查,大肠杆菌(Escherichia coli O157,E.coli O157)、沙门氏菌(Salmonella)、金黄色葡萄球菌(金葡菌,Staphylococcus aureus,S.aureus)和乳酸片球菌(Pediococcus lactis,P.l
传统二烯类橡胶及其复合材料的高弹性和化学稳定性得益于硫磺交联形成的稳定立体交联网络,而该交联网络的不可逆性导致橡胶废弃制品不能得到有效的回收利用而导致环境污染问题,可见目前传统的橡胶交联技术已成为橡胶工业循环经济发展的瓶颈问题。目前基于可逆共价键的高分子网络得到了国内外众多研究者的高度关注,成为世界高分子科技的前沿研究热点。本文将开发多官能度氮氧自由基交联剂在二烯类橡胶及其复合材料中构建热可逆化学