基于扩展熵的无监督聚类的中医辨证

来源 :中国中医基础医学杂志 | 被引量 : 0次 | 上传用户:king95
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是目前数据挖掘中非常重要的研究内容,目前已经形成了很多有效的聚类方法,常用的有K-均值法、k中心点法、自组织神经网络、Bayes神经网络等[1、2]。但他们大多是有监督聚类,Bayes神经网络聚类是将隐含单元看作聚类数,但该方法需要一定的先验经验确定其先验概率分布,并且当变量很多的情况下很难得到最优的聚类结果。无监督聚类是从样本的特征向量出发,研究通过某种算法将特征比较相似的样本聚集在一起,从而达到区分具有不同特征样本的目的。由于无监督聚类没有专家知识的监督,分类的准确性有限[3],因此很多学者长期以来不断探索新的聚类方法以解决不同的实际问题,挖掘数据中人们期望的相关规律。信息瓶颈理论是由Tishby等人在1999年根据Shannon熵信息失真率理论提出的数据压缩方法[4],该方法是从变量合并前后信息损失量一个全新的角度来分析变量的聚类问题,是一种适合于复杂聚类问题的新方法,由于该方法是基于Shannon熵的,因此必须通过统计分析得到变量的概率分布情况,当特征变量只是一个数值而无法统计出其概率时,该方法无法使用,针对这种情况,提出基于扩展熵的无监督聚类方法。扩展熵是基于数值比值的一种熵的定义形式[5],适合于分析一组正数集合的不确定性问题,如药物配比、数值分组等问题。下面以冠心病心绞痛的证候聚类为例,对扩展熵的无监督聚类进行分析。
其他文献
<正>澳大利亚的环保闻名于世,而大堡礁的环保又是澳大利亚的典范。记得有一篇文章是这样描述大堡礁的:平行于澳大利亚东北沿岸的大堡礁Great barrierreef水域,有着绮丽的热带
为充实和加强军队科技干部队伍,促进国防科技事业的发展,3月28日,沈阳军区颁发实行《关于特招地方专业技术人员入伍工作的实施意见》,还专门设立了“科技人才交流中心”,为
期刊
基于精细化的结构模型和物理引擎技术,实现城市区域建筑震害的准确预测和真实感显示。采用多自由度的精细的结构模型,通过非线性时程分析方法准确地预测城市区域大规模建筑的
目的 研究超声在监测不孕症患者子宫内膜及卵泡大小的价值.方法 从我院选取的2010年3月至2011年2月收治的54例不孕症患者,所有患者均进行卵泡监测,统计卵泡排出率和妊娠率.结
<正>很长一段时间,利率市场化都是我国金融领域关注的热点。现今经济发展越来越快,利率市场化的改革也逐步迈入了深水区。因此,商业银行的风险控制能力也面临着越来越高的要
目的观察手术结合中药坐浴治疗糖尿病并肛周脓肿的疗效。方法选取2010年1月—2014年6月该院肛肠科收治的2型糖尿病合并肛周脓肿患者共45例,通过控制血糖,根据血糖水平及肛周
作为世界上最大的烟草生产国,烟草行业对于国民经济的重要性不言而喻。目前,很多国家对烟草行业实行了专卖制度,建国以来我国的烟草行业也形成了一定的管理体制,使得烟草行业
为了适应外部环境变化和组织内部发展的要求,组织变革成为一条必经之路。基于组织变革的当前、过渡和未来三状态,本文提出了状态—路径—阶段—反馈SDPF模型。并对组织变化后
<正>若不是这次集体的家访,我们就不能知道孩子们在某个学科上的困惑,若不是这次温暖的家访;我们就无从知晓孩子们的心结;若不是这次给力的家访,我们就不会明白孩子们的潜力
期刊
随着我国社会环境、经济环境、技术环境以及法律环境的变化,当前企业在市场营销中所出现的危机也日益频繁。对营销危机做出有效的管控,能够避免营销危机对企业的正常发展产生