【摘 要】
:
由于计算机技术的发展,数据挖掘(包括线性和非线性回归、人工神经网络、模式识别算法等)已成为处理化学化工数据,总结经验规律,据以预报未知或控制生产过程的常规手段.但是,
论文部分内容阅读
由于计算机技术的发展,数据挖掘(包括线性和非线性回归、人工神经网络、模式识别算法等)已成为处理化学化工数据,总结经验规律,据以预报未知或控制生产过程的常规手段.但是,传统的机器学习算法都以经典统计数学的渐进理论为依据.该理论的大数定理规定,统计规律只有在已知样本数无限多时才显露出来.但化学化工实际工作中已知样本总是有限的.同时,化学、化工领域中多数数据处理问题属于数学中的"不适定问题"(ill-posed problem),而传统的化学计量学算法忽略了这一特点,将其作为"适定问题"(well-posed problem)求解.忽视这些矛盾是造成实际计算中"过拟合"弊病的重要原因.针对经典统计数学这一弱点,Vladimir N.Vapnik及其合作者提出了"统计学习理论"和"支持向量机"算法."支持向量机"(SVM)算法是特别适合于用有限已知样本训练建模,进而预报未知样本属性的数据挖掘新算法.由于它根据严格的数学理论,同时考虑了拟合精度和对"过拟合"的抑制,故能基于小样本集作较可靠的计算机预报.且因采用核函数算法,故能有效处理非线性数据集.本文简要描述了统计学习理论和支持向量机的主要理论成果和框架,并根据文献编写了基于新算法"支持向量机"的软件"ChemSVM".同时,我们的研究进一步表明:该算法在新材料制备的实验设计(如纳米氧化钛在水中的分散效果与磨砂参数之间关系的建模与预报,镍氢电池阴极材料设计)、相图和新化合物的计算机预报(如KNO<,3>-KBr系,KNO<,3>-KI系和Cs,Li,Er|Cl系等若干熔盐系中间化合物形成规律的建模与预报)、有机毒物的建模和预报(如多环芳烃的环化指标与其分子几何参数之间关系的建模与预报)等领域的应用都有良好的效果.笔者认为,"支持向量机"算法具有很好的应用潜力,将会成为化学、化工领域数据处理广泛应用的新计算工具.
其他文献
正面人物报道曾在新中国的历史上起着非常重要的作用,它不仅意味着一种新闻报道方式,还曾为新中国的受众提供了崭新的价值观念和丰富的精神象征。但长期以来,正面人物报道总
β-环糊精(β-CD)及其衍生物以其特有的结构和性能在药物改性、分子识别、手性分离等领域成为广大科研工作者广泛研究的对象.β-环糊精具有疏水的空腔和亲水的表面,可以选择
由于可同时具备良好的生物相容性与优异的机械力学性能,磷酸钙盐/金属复合材料被认为是最有希望应用于硬组织修复与替换的体系之一。目前所开发的技术,如等离子喷涂、离子束辅助
微流控分析(Microfluidic analysis)技术自兴起以来,一直受到化学、生物、电子、机械等领域的科学家们的广泛关注.在分析化学领域,基于芯片上各种检测技术的分析体系得到了产
氧气是人类生存和大部分化学反应不可或缺的成分,因此氧气的测量显得尤为重要。氧传感器在氧气的测量当中发挥着重要的作用,在环境保护、化工、医学、冶金和航空技术等领域有着
膦配体是一类多用在催化领域的有机功能化合物。其理化性质深受其分子结构(包括电子结构和空间结构)的影响。对配体分子进行结构改性已经成为调控分子性质的重要方法。目前关于膦配体的研发工作已经屡见不鲜,但是在ScCO2中,极性的膦配体及其催化剂溶解度并不好。催化剂在均相催化体系中的溶解度直接关系到催化剂的催化效率进而影响反应效果。目前,增加配体在二氧化碳中的溶解度的方法多以在分子结构中引入含氟基团为主。含
硫属化物作为重要的无机功能材料,不但具有传统的微孔材料自身所共有的性质,还在光电导体、光致发光、非线性光学等方面广阔的应用空间。因此,微孔硫属化物的合成和性质研究已经收到广大工作者的重视。近年来,利用溶剂热(水热)法合成了多种微孔硫属化物。其中,大多都是以主族金属元素与硫属元素为主体的三元微孔硫化物,过渡金属的硫化物由于在水中或者其他溶剂中的溶解度很低易形成沉淀,因此过渡金属少有能容易参与化学反应
仿生天然酶对底物的特异性识别和作用越来越成为生物医药领域研发廉价、高效、低副作用新型靶向药物的一大法宝。因此,通过人工设计生物酶的结构和功能模型来探究天然酶的活性位点和作用机制成为近年来生物无机化学领域的研究热点。为在分子水平上模拟不同活性中心和底物的取代基效应对于对羟基苯丙酮酸双加氧酶(4-hydroxyphenylpyruvate dioxygenase简称HPPD)的影响,本文主要做了以下工
软刻蚀是一类以自组装和复制模塑为基础进行微米、纳米微加工的非光刻技术手段.它使用一个表面带有微图形的弹性印章作为印模或掩模来制备尺寸从30nm到50nm范围的微图形或微