基于SMILES结构的中药寒热药性随机森林算法建模及验证

来源 :中国中医科学院 | 被引量 : 0次 | 上传用户:ISE7ENAK
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
1目的将中药化合物的SMILES结构引入寒热药性研究,并通过MACCSkeys密钥将寒热属性中药化合物转化为分子子结构,然后采用随机森林算法基于分子子结构构建中药寒热属性判别模型,再结合体外实验进一步探索中药寒热药性的物质基础,以期为中药寒热药性研究提供研究思路和参考依据。2方法2.1算法研究2.1.1寒热属性中药数据收集及建模首先,通过2020版《中国药典》筛选出寒性和热性中药的相关化合物,其筛选原则包括:药典中明确规定中药的属性是“寒性”或“热性”,若出现“凉性”或“温性”则不考虑纳入;(1)临床上经常采用的植物类中药;(2)对《中国药典》中纳入的药性不太明确的中药,从中药属性、是否为植物类中药两方面考虑,由中医从业人员投票进行筛选。其次,完成筛选后,通过TCMSP、TCMID检索寒性中药和热性中药的化合物,建立寒性药物和热性药物化合物关键数据集,然后将两个数据集中重复化合物删除,再通过TCMSP和PubChem数据库检索寒性药物和热性药物关键化合物的SMILES结构。最后,采用MACCSkeys密钥将两个数据集中的化合物SMILES结构转化为计算机可识别的二进制语言,分算为167x266维的矢量数据,通过随机森林算法对每味中药的化合物结构数据进行分类,进而建立中药寒热药性判别模型。2.1.2寒热属性中药判别模型的验证为避免人工选择典型寒热属性中药带来的差异,本课题采用文本挖掘技术对SinoMed,CNKI,PubMed数据库中发表的与寒性药物和热性药物相关的文献进行采集,记载文献中提及的中药药性和该味药物发表的文献研究数量。再根据两本国内外均出版的中药古籍《神农本草经》和《本草纲目》核对中药药性,最终筛选出用于验证的典型的寒热属性中药。通过TCMID、TCMSP和PubChem数据库检索典型中药的化合物及其SMILES结构用于验证寒热属性中药判别模型。2.1.3寒热属性中药靶蛋白功能分析经过TCMSP以及其他中药化合物数据库,收集典型寒热属性中药的化合物,去除重复后,查询化合物对应的关键靶蛋白。采用Cytoscape 3.7.2软件构建寒性药物和热性药物的靶蛋白群组,去除重复蛋白后,根据寒性药物的靶蛋白数纳入数量相近的热性药物靶蛋白,导入IPA软件中分析寒性药物和热性药物各自作用的生物关键通路和疾病,以此探索寒性和热性中药在生物关键通路、治疗疾病上的差异。2.2实验研究2.2.1寒热属性中药单体对细胞增殖率的影响对A549细胞加入典型寒性和热性中药的化合物,分别设定不同梯度的药物浓度来培养细胞24小时,并观测细胞的存活率和增殖率。然后选取药物作用的最佳剂量,观察最佳剂量下寒性药物和热性药物作用24小时后细胞的生长和增殖变化,从而从细胞层面研究寒性药物和热性药物的作用差异,最后采用GraphPad Prism 8软件进行数据分析和处理。2.2.2寒热属性中药单体对细胞中能量代谢关键基因表达的影响采用实时荧光定量PCR技术研究寒性和热性药物对能量代谢关键靶点的基因相对表达量,并使用GraphPad Prism 8软件分析实验所得数据。3结果3.1算法研究结果3.1.1中药寒热属性药物数据收集及建模结果通过2020版《中国药典》筛选出148味寒性中药和118味热性中药,然后通过TCMSP和PubChem数据库检索到5196个热性中药化合物和5366个寒性中药化合物,其中有多个活性成分由多味中药所含有。去除重复后,共纳入5323个中药化合物用于构建中药寒热药性判别模型,最终模型的AUC值为93.3%,模型准确率为93.3%,并且发现CH2=A、ACH2AACH2A和CH3>2分子子结构在寒性药物中占比均小于20%;OCO、CH3AACH2A和CH3ACH2A在寒性药物的分子子结构中占比高达42%,是寒性药物的关键分子子结构。CH3AACH2A、ACH2AACH2A、CH3AACH2A和CH3>2分子子结构在热性药物中占比高达48%,是热性药物的关键分子子结构。3.1.2中药寒热属性药物判别模型的验证文本挖掘共筛选出10味典型寒热属性中药,其中寒性药物3味,热性药物7味。检索10味寒性和热性中药化合物并导入中药寒热属性模型中进行验证,10味中药中有9味中药的属性判断均准确,判断的准确率为90%,与构建模型的准确率93.3%相近,表明该模型能有效判断中药的寒热属性。3.1.3寒热属性中药靶蛋白功能分析结果典型寒性中药成分共检索到417个靶蛋白,典型热性中药成分共检索到1081个,构建了寒性和热性药物靶蛋白群组。去除重复后,得到寒性和热性药物各自特有靶蛋白,对热性药物靶点进行均衡筛选,以保持寒性和热性药物纳入数量相近的靶蛋白,其中寒性药物靶蛋白265个和热性药物靶蛋白296个。IPA分析发现TP53在寒性药物作用网络中处于中间位置,表明该分子与其他寒药靶蛋白联系密切;热性药物中TP53,ESR1,CONA2,MFKBIA,MDM2,GSTR1,CDK2,MMP9,EGPR,AR,GAPDHPPARG,ESR2,BIRC5,CREK1 蛋白与热性药物蛋白群中其他蛋白相互作用更为紧密。经典生物通路分析发现寒性药物作用于褪黑素降解经典通路、安非他酮降解、雌性激素生物合成、丙酮降解Ⅰ(制乙二醛)、尼古丁降解通路Ⅲ、褪黑素降解通路Ⅰ、尼古丁降解Ⅱ、白三烯生物合成、褪黑激素Ⅱ、瓜氨酸-硝酸氧化周期通路;热性药物作用于锥体素降解的经典路径、安非他酮降解、雌性激素生物合成、丙酮降解Ⅰ(针对甲基乙二醛)、褪黑素降解通路Ⅰ、脂肪酸β氧化Ⅰ、缬氨酸降解Ⅰ、超氧自由基降解通路以及尼古丁降解主要通路Ⅰ和Ⅲ。疾病相关生物分析发现典型寒性药物侧重于治疗肥胖、淀粉样变性、进行性神经紊乱等疾病;典型热性药物侧重于治疗阿尔茨海默病、心血管系统形态学、淋巴系统肿瘤、白细胞肿瘤等疾病。毒理功能分析发现,寒性药物毒理作用的疾病或信号通路为心肌肥厚、芳基烃受体信号、肾结石或细胞死亡等;热性药物毒理作用的疾病或信号通路为肾结石或细胞死亡、肝坏死或细胞死亡等。3.2实验研究结果3.2.1寒热属性中药单体对细胞增殖率的影响结果CCK-8实验结果表明,A549细胞在加入寒性药物黄连单体黄连素和生地黄单体豆甾醇后细胞存活率降低,5个药物浓度下细胞的存活率均低于80%,细胞的增殖率均在100%以下,同时,随着药物浓度的增加,细胞的存活率、增殖率呈现明显的下降趋势。热性药物附子单体乌头碱和吴茱萸单体芝麻素使用后细胞的存活率升高,5个药物浓度下细胞的存活率均大于100%,细胞的增殖率均在110%以上,同时随着药物浓度的增加,乌头碱作用下的细胞增殖速率下降,芝麻素作用下细胞的增殖率仍处于上升趋势。3.2.2寒热属性中药单体对细胞中能量代谢关键基因表达的影响结果实时荧光定量PCR技术检测结果表明,与空白对照组相比,寒性和热性药物单体使MAOA基因表达量呈现下降趋势;与热性药物单体对比,寒性药物单体豆甾醇对MAOA基因的相对表达量有明显的促进作用(P<0.05),表明MAOA可能是典型寒性药物的特异性靶点。与寒性中药对HADHB和EHHADH基因的影响相比,热性药物单体乌头碱和芝麻素单体对HADHB和EHHADH基因的表达呈现促进作用(P<0.05),其中附子单体乌头碱作用后HADHB的表达量超过空白对照组(P<0.05),芝麻素单体作用后EHHADH的表达量超过空白对照组(P<0.05),同时与典型寒性药物相比,HADHB和EHHAD在热性药物作用下表达量均高于寒性药物(P<0.05),这表明HADHB和EHHADH可能是热性药物的特有靶点。与能量代谢相关的基因cox-5a、UCP-1、AMPK在加入热性药物后,其整体表达量上调(P<0.05),同时寒性药物黄连单体黄连素、生地黄单体豆甾醇对cox-5a、UCP-1、AMPK的基因表达量整体下调(P<0.05)。4结论中药寒热属性药物可以通过化合物SMILES结构表征中药寒性和热性的差异,并且基于化合物SMILES结构构建的中药寒热属性判别模型对于药物的寒热属性有较高的准确度和可靠性。典型寒性和热性中药的关键靶蛋白在生物通路和作用疾病以及毒理作用上存在差异。实验研究表明典型寒性中药能抑制细胞的生长率和增殖率,热性药物能促进细胞的生长率和增殖率;同时寒性药物能抑制能量代谢相关基因的表达,热性药物能促进能量代谢相关基因的表达。
其他文献
目的 基于虚拟现实技术探索布老虎非物质文化遗产保护与传承的创新设计实践。方法 分析布老虎传统技艺的发展现状与艺术特征等,结合虚拟设计的特点,对布老虎虚拟体验设计进行研究。结果 提出了民间布老虎在虚拟体验设计实践的新方法。结论 虚拟现实技术在民间布老虎传承与传播中的应用具有独特优势,是非遗文化发展的必然趋势。
随着碳达峰、碳中和目标的提出,大庆油田大力推动新能源业务发展,确定了“清洁替代、战略接替、绿色转型”三步走战略,“十四五”期间力争实现可再生能源利用总量达到油田总耗能量的35%以上,地热资源是实现“清洁替代”的现实领域。松辽盆地北部平均地温梯度3.8℃/100m,是中低温传导型热盆,纵向上发育三种热储层类型,第一种类型以青二三段和姚家组含水砂岩为主,深度1000~2000m,地层温度40℃~80℃
<正>支付清算体系是金融市场基础设施的重要组成部分,其稳健运行对于畅通货币政策传导、促进经济增长、维护金融稳定具有重要意义。近年来,随着经济发展和科技进步,消费者支付清算服务需求日益增长,国际社会对于支付清算体系的重视程度不断提高。支付清算行业发展日新月异,呈现出电子支付蓬勃发展、科技企业进军支付领域、支付基础设施不断完善等态势,同时给支付清算体系有效监管带来了新挑战。
期刊
为研究不同深度对柠条繁殖的影响,分别设置3 cm、5 cm、7 cm和9 cm 4个扦插深度,研究了柠条生根特性、酶活性和贮存物质含量的变化特征。结果表明:随着扦插深度的增加,生根数量、生根条数和生根率呈先增加后降低的趋势,在扦插深度为5 cm时达到最大值。POD和PPO活性在扦插深度为5 cm时达到最大值。可溶性糖含量在扦插深度为5 cm时最高,淀粉和可溶性蛋白含量在扦插深度为5 cm时最低。综
电影《树上有个好地方》,以中国上世纪90年代末的陕西关中农村为背景,讲述学校儿童教育与自我成长的故事。影片主题新颖,重在尝试探索怎样的教育理念,才最有利于孩子们的身心健康成长。影片创新的视听语言,让观众在回忆自己童年生活的深思中,潸然泪下,仿佛又回到了曾经幸福的童年时代。
随着当前社会发展水平的不断提升,乡村建设已经成为提升我国社会发展稳定性的重要内容。而美丽乡村建设过程中的乡村住宅设计是体现乡村风貌、凸显本土文化、营造良好生活环境的主体。文章阐述了当前美丽乡村建设的实际要求,分析了乡村住宅的基础功能以及未来发展前景;依托具体的案例,阐述了美丽乡村建设过程中乡村住宅设计的具体内容,综合整体布局、房屋围护结构以及生态性格局的调整展开论述,确保可以为美丽乡村住宅体系优化
目的 研究出生后第1天血清血管内皮生长因子(vascular endothelial growth factor, VEGF)的表达水平在早产儿新型支气管肺发育不良(brochopulmonary dysplasia, BPD)中的临床价值。方法 将符合入组条件的早产儿分为BPD组(18例)和非BPD组(24例),所有研究对象均在出生后第1天收集外周血清,ELISA法测VEGF的表达水平,并记录和
本文介绍了微机电系统(MEMS)压力传感器及其专用集成电路(ASIC)信号调理电路的校准和烧录系统设计,提出一种新型的自适应通讯设备,在接口复用前提下,能够自动检测多种数字通讯协议。在此基础上,整合了对传感器的校准和烧录,并基于工业通信协议,连接外围设备后可组成一套完整的自动通信系统,最后展示了此系统可达到的测试精度和结果。实现了低成本,高可靠性,容错率高的自动压力传感器校准,烧录系统。具有广泛的
2006年由墨西哥导演冈萨雷斯·伊纳里多执导的影片《通天塔》斩获了包括戛纳电影节最佳导演奖在内的许多奖项,也获得了观众的广泛好评。电影把四个处在不同时空的故事用非线性叙事的手法融合在了一部电影里,向观众展示了一个错综复杂的叙事迷宫,并在摸索线索的同时体悟作者想传达的人文主旨,这种叙事结构无疑是影片成功的关键。本文旨在剖析电影的结构脉络,梳理其想传达的社会问题,给其他影片提供借鉴