【摘 要】
:
有机化合物广泛存在于自然界中,和人类生活紧密相关。对有机化合物进行结构解析确定其分子结构,在有机化学、代谢分析以及药物合成等领域具有极其重要的应用价值。目前,解析有机化合物分子结构主要使用质谱、红外谱图和核磁共振(Nuclear Magnetic Resonance,NMR)谱图等技术,而精确高效地识别出谱图中吸收峰对应的分子结构片段(即官能团)是其中的关键步骤。因此,有机化合物NMR谱图官能团识
论文部分内容阅读
有机化合物广泛存在于自然界中,和人类生活紧密相关。对有机化合物进行结构解析确定其分子结构,在有机化学、代谢分析以及药物合成等领域具有极其重要的应用价值。目前,解析有机化合物分子结构主要使用质谱、红外谱图和核磁共振(Nuclear Magnetic Resonance,NMR)谱图等技术,而精确高效地识别出谱图中吸收峰对应的分子结构片段(即官能团)是其中的关键步骤。因此,有机化合物NMR谱图官能团识别引起了研究人员的广泛关注。在计算机辅助有机化合物结构解析中,NMR谱图因可重现性高、样品制备过程简单以及样品可重复使用等优点被广泛采用。目前,主要通过NMR谱图中吸收峰出现的位置和吸收峰的面积来推断官能团类别,然而NMR谱图数据量大,传统上采用对吸收峰手动积分的方法对研究者的谱图解析水平要求较高,耗时耗力且解析准确度较低。因此,探索自动化官能团识别方法,有助于提高使用NMR谱图解析有机化合物结构的效率和准确度。本文以NMR谱图为基础,针对有机化合物中官能团的识别,主要开展了以下研究工作:(1)在一维卷积神经网络(Convolutional Neural Network,CNN)中引入了长短期记忆网络(Long Short-Term Memory,LSTM)和时间卷积网络(Temporal Convolutional Network,TCN),对NMR谱图中官能团进行识别取得了良好的效果。通过不同算法对比,表明使用CNN+TCN比只使用CNN可以提取到更加完整的耦合裂峰特征,从而提升模型的官能团识别效果。此外,以往研究通常仅使用NMR氢谱进行官能团识别,本文将NMR氢谱与NMR碳谱数据进行融合作为训练数据,使用本文提出的模型均取得了优于单谱图的识别效果。其中,CNN-Bi LSTM模型的F1分数达到95.75%。而相比CNN模型,本文提出的CNN-BOTCN模型在NMR碳谱官能团识别中F1分数提升了6.66个百分点,达到94.53%;该模型在NMR氢谱和碳谱融合数据上得到最好的官能团识别效果,F1分数达到97.54%。(2)使用Mest Re Nova软件生成了72942张NMR谱图,制作了模拟NMR谱图数据集,并对数据集中包含的官能团信息进行了自动化标记。(3)设计了一种基于排序的官能团类别标记方法,有效解决了有机化合物分子结构中官能团包含1、子结构重叠2的问题。(4)使用本文提出的CNN-BOTCN模型,在真实NMR谱图数据集进行官能团识别的F1分数为87.67%,表明了该模型的有效性。本文提出的方法能够取得良好的识别效果,对计算机辅助结构解析在有机化合物结构研究中的进一步应用具有一定的参考价值和推动作用,也可作为今后相关研究的工作基础。
其他文献
肇始于工业革命,人类社会生产力突飞猛进。中国以短短几十年的时间取得了举世瞩目的发展成就,离不开工业化的快速推进。在社会经济迅猛发展的背景下,发展的不平衡不充分和资源环境问题日渐凸显。工业是经济增长的重要推动力量,工业发展不平衡必然会加剧区域发展两极分化。从人地关系系统看,工业发展需要直接或间接从自然获取资源,并返回一定的污染物。因此,工业的区域差异以及与资源环境的协调问题是关乎地区协调、可持续发展
灞河流域是西安市农副产品供应以及生态调节的重要区域,随着流域内城镇的发展,无人干扰的自然景观逐渐减少,景观演变会导致环境因子的变化,进而对生态风险造成影响。从时空尺度,对灞河流域景观演变及其生态风险进行研究,了解研究区内景观的空间分布规律,利用生态指标建模的方法以“地理一张图”的方式量化流域综合生态风险,探究自然和人为干扰下灞河流域人居保障区、产品供应区和生态调节区的生态风险变化,为未来区域土地治
设H是复Hilbert空间,E(H)是由H上的正压缩算子组成的效应代数.对于λ∈[0,1],定义AολB=λA1/2 BA1/2+(1-λ)B1/2 AB1/2,VA,B ∈E(H),称ολ为E(H)上的凸序列积.本文研究了E(H)上凸序列积的代数性质,刻画了凸序列积效应代数的自同构,并进一步研究了保持凸序列积范数的映射的结构.本文的主要内容如下:第一部分,利用Uhlhorn’s定理刻画了维数不小
近年来,以区块链为底层技术的比特币、Libra等密码货币掀起了数字经济的浪潮。基于公有链的比特币和基于联盟链的Libra在进行货币交易过程中,均采用数字签名来确保交易的可验证性和完整性,其中签名私钥确保了密码货币资产的所有权,若签名私钥丢失或被盗,密码货币资产的安全将受到巨大威胁。椭圆曲线数字签名算法(ECDSA)在同等安全强度下,因其签名长度短而被应用于比特币交易单的签名。然而,斯诺登事件揭露了
逻辑代数结构是逻辑系统研究中的一个重要内容,为了进一步揭示伪相等代数的特性,本文从多个方面对其进行了再研究.首先,研究了一些特殊类型伪相等代数之间的关系.然后,讨论了伪相等代数与其它逻辑代数(伪剩余格,伪MV-代数,差分格)的关系.最后,分别利用蕴涵正规滤子、极正规滤子、素正规滤子和布尔正规滤子作商得到了商伪相等代数的结构.所得主要结论如下:1.引入了对合伪相等代数的概念,研究了有界伪相等代数、格
LC-MS技术是目前测定微量成分含量最常用的技术之一,具有分析速度快、高灵敏度、高准确度等优点,因此常用于快速定性、定量分析。该技术在研究药物成分在体内的药代动力学具有显著的优点。玉竹为百合科植物玉竹的干燥根茎,为药食两用传统中药,具有降血糖、降血脂及抗肿瘤等作用,广泛用于药品、保健食品及化妆品等行业。玉竹的化学成分主要包括多糖类、皂苷类、黄酮类及氨基酸等。玉竹醇提物具有较好的药理活性,富含20余
<正>综合实践活动是具有发展特征的幼儿课程,通常以活动为主要形式,注重幼儿的自主性。引导幼儿积极的参与到各类活动当中,通过各类活动引导幼儿发现并解决问题,获得更好的学习体验。不仅要让幼儿有完善的生活体验,还要给幼儿提供个性发展的空间,能亲身体验大胆实践。通过多种活动形式转变学习方式,得到全面发展。
霉菌及霉菌毒素对畜牧业和人类健康的危害巨大,减少霉菌毒素对饲料、畜产品的污染,提高畜产品品质是当前养殖行业的热点之一。牛至精油(Oregano essential oil)是从天然植物牛至中提取的一种挥发油,具有较强的抑菌和抗氧化作用,对动物和人体均无副作用。本研究通过向夏季奶牛全混合日粮(total mixed rations,TMR)中添加牛至精油,评价牛至精油对在夏季TMR的应用效果,为牛至
胰腺癌是一种恶性程度极高的消化道肿瘤。患者通常临床症状不明显,使得确诊胰腺癌变得十分困难,患者就诊时往往已经失去了手术治疗的最佳机会。同时胰腺进展、转移极快,放化疗治疗效果欠佳,造成胰腺癌患者的死亡率居高不下,并使其成为癌症相关死亡的一个主要原因。目前,手术治疗、免疫治疗等多种治疗方法尚未获得较好地治疗效果,因此深入研究胰腺癌发生发展的分子机制将会为未来的临床靶向治疗提供新的思路。长链非编码RNA
羌活胜湿汤记载见于金代医学家李东垣所著《内外伤辨惑论》,主要功效是祛风胜湿,治疗风湿在表,头痛项强,腰背重痛,一身尽痛,难以转侧,恶寒发热,脉浮有独特疗效,在临床以汤剂治疗风湿寒性颈椎病、类风湿性关节炎、骨质增生症、强直性脊柱炎等疾病都取得了很好的效果。汤剂制备耗时(需临用时新制)、久置易发霉变质、不便携带、服用困难、味苦等诸多缺点,在临床上应用非常不方便。本文在汤剂基础上研发羌活胜湿滴丸剂,改善