论文部分内容阅读
摘要:本文根据常见气体的热力学性质(包括标准摩尔生成焓、标准摩尔熵、摩尔定压热容),利用R软件对氧气、氮气、二氧化碳等常见的10种气体进行了系统聚类分析和动态聚类分析,其中系统聚类法使用了最长距离法、类平均法、重心法和ward法。计算结果表明,相似的结构是物质被分为一类的主要原因。
关键词:热力学性质;常见气体;聚类分析
中图分类号:O659.1 文献标识码:A 文章编号:1000-8136(2009)33-0017-02
1背景知识
标准摩尔生成焓是计算化学反应的标准摩尔反应焓的基础热数据。在压力为100 KPa,温度为298.15 K的标准态下,由最稳定的纯态单质生成单位物质的量的某物质的焓变,称为该物质的标准摩尔生成焓。[1]标准摩尔生成焓用Δf H符号表示。
熵是热力学中表征物质状态的参量之一,通常用符号S表示。熵是描述物质混乱度大小的物理量,可以把任何纯净的完整晶态物质在0 K时的熵值规定为零,把某单位物质的量的纯物质在标准态下的熵值称为标准摩尔熵(Sm)。[1]
当某一系统由于加给一个微小的热量δQ而温度升高dT时,δQ/dT这个量就是热容。[2]热容的符号为C。单位物质在恒定压力的条件下的热容称为定压热容,用Cp,m表示。
每一种物质都有唯一的ΔfHm、Sm和Cp,m与其对应。本文将在这些数据的基础上,对一些常见气体进行分类,从中找出规律。
2聚类分析
聚类分析是一类将数据研究对象进行分类的统计方法。这一类方法的共同特点是:[3]事先不知道类别的个数与结构;据以进行分析的数据是对象之间的相似性或相异性的数据。将这些相似或相异的数据看成是对象之间的“距离”远近的一种度量,将距离近的对象归为一类,不同类之间的对象距离较远。
2.1系统聚类法
系统聚类法基本思想是:[3]首先是n个样本各自成一类,然后规定类与类之间的距离,选择距离最小的两类合并成一个新类,计算新类与其它类的距离,再将距离最小的两类进行合并,这样每次减少一类,直到达到所需的分类数或所有的样本都归为一类为止。系统聚类法是分类数据处理中用得最多的一种方法。有关该方法的研究内容相当丰富,许多统计软件(如SAS)中都有专门的程序。
本文应用R2.7.2软件,分别使用了包括最长距离法、类平均法、重心法和ward法。用这些系统聚类法,本文研究了10种气体的分类情况。选取气体为:1氧气;2氮气;3一氧化碳;4二氧化碳;5氯化氢;6氨气;7二氧化氮;8二氧化硫;9甲烷;10乙烯。
系统聚类分析的R计算程序如下:
> library(cluster)
> x=read.table("C:/data.txt")
> dist(scale(x))
> d=dist(scale(x))
> long=hclust(d, method = "complete")
> plclust(long,hang=-1)
> average=hclust(d,"average")
> plclust(average,hang=-1)
> centroid=hclust(d,"centroid")
> plclust(centroid,hang=-1)
> ward=hclust(d,"ward")
> plclust(ward,hang=-1)
最长距离法的分类结果是:
第一类:4二氧化碳;8二氧化硫。
第二类:1氧气;2氮气;3一氧化碳;5氯化氢;6氨气;9甲烷。
第三类:7二氧化氮;10乙烯。
类平均法的分类结果是:
第一类:4二氧化碳;8二氧化硫。
第二类:1氧气;2氮气;3一氧化碳;5氯化氢;6氨气;9甲烷。
第三类:7二氧化氮;10乙烯。
重心法的分类结果是:
第一类:4二氧化碳;8二氧化硫。
第二类:1氧气;2氮气;3一氧化碳;5氯化氢;6氨气;9甲烷。
第三类:7二氧化氮;10乙烯。
ward法的分类结果是:
第一类:6氨气;9甲烷。
第二类:1氧气;2氮气;3一氧化碳;5氯化氢。
第三类:7二氧化氮;10乙烯。
第四类:4二氧化碳;8二氧化硫。
2.2动态聚类法
本文在系统聚类法的基础上进行了动态聚类法。动态聚类法的基本思想是,开始粗略的分下类,然后按照某种最优原则修改不合理的分类,直至类分得比较合理为止,这就形成了一个最终的分类结果。这种方法具有计算量小,占用内存小,方法简单的优点。[3]
利用动态聚类法将10种气体物质分为4类。R软件的运算的程序为:
> km=kmeans(d,4,nstart=10); km
> sort(km$cluster)
动态聚类分析结果如下:
第一类:4二氧化碳;8二氧化硫。
第二类:7二氧化氮;10乙烯。
第三类:1氧气;2氮气;3一氧化碳;5氯化氢。
第四类:6氨气;9甲烷。
3分析讨论
本文先后进行了最长距离法、类平均法、重心法、ward法、动态聚类法的聚类分析。5种不同的方法对应着5种不同的分类结果。然而,无论这5种结果有多么大的差异,其中还是有一些共同的规律。本文将这些规律总结如下:
(1)1和2都是分在一类,即氧气和氮气一类。氮气和氧气都是非金屬元素构成的单质气体,它们都是双原子分子。它们的分子式如下:
(2)4和8都是分在一类,即二氧化碳和二氧化硫一类。二氧化碳与二氧化硫都是非金属元素的二氧化物,中心元素C和S都是+4价,C和S与氧之间的共价键都是双键。它们的分子式如下:
O=C=OO=S=O
(3)6和9都是分在一类,即氨气和甲烷一类。氨气和甲烷都是活泼非金属元素与氢化合生成的共价化合物,也就是说它们都是氢化物。它们的分子式如下:
(4)7和10都是分在一类,即二氧化氮和乙烯一类。二氧化氮和乙烯的分子中都有活泼的双键,都有活泼的π电子。它们的分子式如下:
物质的热力学性质是由其分子的性质决定的,分子的性质又是由其结构决定的。分子结构相似的气体决定着它们具有比较相近的热力学性质。通过以上所述分子的化学式,可以看出每组分子具有明显的结构相似性。以上的讨论中便充分说明了结构的相似性导致了热力学性质的相似性。进而说明,聚类分析是验证分子相似性的有效手段。
参考文献
1 天津大学无机化学教研室.无机化学(第三版).北京:高等教育出版社,2002
2 天津大学物理化学教研室.物理化学•上册(第四版).北京:高等教育出版社,2003
3 薛 毅、陈立萍.统计建模与R软件.北京:清华大学出版社,2007
Common Gas Cluster Analysis
Liu Zhiyong
Abstract: This article according to the common gas the thermodynamic property(including a standard mole of enthalpy of formation, a standard molar entropy, mole of constant pressure heat capacity), using the R software to the oxygen, the nitrogen, the carbon dioxide and so on common 10 kind of gas has carried on the system cluster analysis and the dynamic cluster analysis, the system cluster law has used the most long distance law, a kind of method of average, the gravity model approach and the ward law. The computed result indicated that the similar structure is the material is divided into a kind of primary cause.
Key words: thermodynamic property; common gas; cluster analysis
关键词:热力学性质;常见气体;聚类分析
中图分类号:O659.1 文献标识码:A 文章编号:1000-8136(2009)33-0017-02
1背景知识
标准摩尔生成焓是计算化学反应的标准摩尔反应焓的基础热数据。在压力为100 KPa,温度为298.15 K的标准态下,由最稳定的纯态单质生成单位物质的量的某物质的焓变,称为该物质的标准摩尔生成焓。[1]标准摩尔生成焓用Δf H符号表示。
熵是热力学中表征物质状态的参量之一,通常用符号S表示。熵是描述物质混乱度大小的物理量,可以把任何纯净的完整晶态物质在0 K时的熵值规定为零,把某单位物质的量的纯物质在标准态下的熵值称为标准摩尔熵(Sm)。[1]
当某一系统由于加给一个微小的热量δQ而温度升高dT时,δQ/dT这个量就是热容。[2]热容的符号为C。单位物质在恒定压力的条件下的热容称为定压热容,用Cp,m表示。
每一种物质都有唯一的ΔfHm、Sm和Cp,m与其对应。本文将在这些数据的基础上,对一些常见气体进行分类,从中找出规律。
2聚类分析
聚类分析是一类将数据研究对象进行分类的统计方法。这一类方法的共同特点是:[3]事先不知道类别的个数与结构;据以进行分析的数据是对象之间的相似性或相异性的数据。将这些相似或相异的数据看成是对象之间的“距离”远近的一种度量,将距离近的对象归为一类,不同类之间的对象距离较远。
2.1系统聚类法
系统聚类法基本思想是:[3]首先是n个样本各自成一类,然后规定类与类之间的距离,选择距离最小的两类合并成一个新类,计算新类与其它类的距离,再将距离最小的两类进行合并,这样每次减少一类,直到达到所需的分类数或所有的样本都归为一类为止。系统聚类法是分类数据处理中用得最多的一种方法。有关该方法的研究内容相当丰富,许多统计软件(如SAS)中都有专门的程序。
本文应用R2.7.2软件,分别使用了包括最长距离法、类平均法、重心法和ward法。用这些系统聚类法,本文研究了10种气体的分类情况。选取气体为:1氧气;2氮气;3一氧化碳;4二氧化碳;5氯化氢;6氨气;7二氧化氮;8二氧化硫;9甲烷;10乙烯。
系统聚类分析的R计算程序如下:
> library(cluster)
> x=read.table("C:/data.txt")
> dist(scale(x))
> d=dist(scale(x))
> long=hclust(d, method = "complete")
> plclust(long,hang=-1)
> average=hclust(d,"average")
> plclust(average,hang=-1)
> centroid=hclust(d,"centroid")
> plclust(centroid,hang=-1)
> ward=hclust(d,"ward")
> plclust(ward,hang=-1)
最长距离法的分类结果是:
第一类:4二氧化碳;8二氧化硫。
第二类:1氧气;2氮气;3一氧化碳;5氯化氢;6氨气;9甲烷。
第三类:7二氧化氮;10乙烯。
类平均法的分类结果是:
第一类:4二氧化碳;8二氧化硫。
第二类:1氧气;2氮气;3一氧化碳;5氯化氢;6氨气;9甲烷。
第三类:7二氧化氮;10乙烯。
重心法的分类结果是:
第一类:4二氧化碳;8二氧化硫。
第二类:1氧气;2氮气;3一氧化碳;5氯化氢;6氨气;9甲烷。
第三类:7二氧化氮;10乙烯。
ward法的分类结果是:
第一类:6氨气;9甲烷。
第二类:1氧气;2氮气;3一氧化碳;5氯化氢。
第三类:7二氧化氮;10乙烯。
第四类:4二氧化碳;8二氧化硫。
2.2动态聚类法
本文在系统聚类法的基础上进行了动态聚类法。动态聚类法的基本思想是,开始粗略的分下类,然后按照某种最优原则修改不合理的分类,直至类分得比较合理为止,这就形成了一个最终的分类结果。这种方法具有计算量小,占用内存小,方法简单的优点。[3]
利用动态聚类法将10种气体物质分为4类。R软件的运算的程序为:
> km=kmeans(d,4,nstart=10); km
> sort(km$cluster)
动态聚类分析结果如下:
第一类:4二氧化碳;8二氧化硫。
第二类:7二氧化氮;10乙烯。
第三类:1氧气;2氮气;3一氧化碳;5氯化氢。
第四类:6氨气;9甲烷。
3分析讨论
本文先后进行了最长距离法、类平均法、重心法、ward法、动态聚类法的聚类分析。5种不同的方法对应着5种不同的分类结果。然而,无论这5种结果有多么大的差异,其中还是有一些共同的规律。本文将这些规律总结如下:
(1)1和2都是分在一类,即氧气和氮气一类。氮气和氧气都是非金屬元素构成的单质气体,它们都是双原子分子。它们的分子式如下:
(2)4和8都是分在一类,即二氧化碳和二氧化硫一类。二氧化碳与二氧化硫都是非金属元素的二氧化物,中心元素C和S都是+4价,C和S与氧之间的共价键都是双键。它们的分子式如下:
O=C=OO=S=O
(3)6和9都是分在一类,即氨气和甲烷一类。氨气和甲烷都是活泼非金属元素与氢化合生成的共价化合物,也就是说它们都是氢化物。它们的分子式如下:
(4)7和10都是分在一类,即二氧化氮和乙烯一类。二氧化氮和乙烯的分子中都有活泼的双键,都有活泼的π电子。它们的分子式如下:
物质的热力学性质是由其分子的性质决定的,分子的性质又是由其结构决定的。分子结构相似的气体决定着它们具有比较相近的热力学性质。通过以上所述分子的化学式,可以看出每组分子具有明显的结构相似性。以上的讨论中便充分说明了结构的相似性导致了热力学性质的相似性。进而说明,聚类分析是验证分子相似性的有效手段。
参考文献
1 天津大学无机化学教研室.无机化学(第三版).北京:高等教育出版社,2002
2 天津大学物理化学教研室.物理化学•上册(第四版).北京:高等教育出版社,2003
3 薛 毅、陈立萍.统计建模与R软件.北京:清华大学出版社,2007
Common Gas Cluster Analysis
Liu Zhiyong
Abstract: This article according to the common gas the thermodynamic property(including a standard mole of enthalpy of formation, a standard molar entropy, mole of constant pressure heat capacity), using the R software to the oxygen, the nitrogen, the carbon dioxide and so on common 10 kind of gas has carried on the system cluster analysis and the dynamic cluster analysis, the system cluster law has used the most long distance law, a kind of method of average, the gravity model approach and the ward law. The computed result indicated that the similar structure is the material is divided into a kind of primary cause.
Key words: thermodynamic property; common gas; cluster analysis