论文部分内容阅读
中医药是医学上智慧的结晶,中药组方的配伍规律至今仍是不解之谜。传统的中医药研究方法通常是基于事物项的挖掘,研究症药关系、药物频繁项集挖掘、关联规则挖掘等方面,而方剂的配伍规律挖掘却鲜有人涉及,这对中医药的发展也至关重要。挖掘药物网络的结构和药物社团发现已经成为了一个迫切需要研究的方向。这些年来国际社会对中医越来越重视的态度也推动着其发展。 传统的中医药数据挖掘方法只研究了药物与药物在组方里的关系而忽略了药物自身具有的属性(如性味、归经、功效),而这些属性在中医药数据挖掘里作为一些隐藏的属性对研究起着至关重要的作用。本文采用了一种考虑药物属性的组网模型来对中医药组方进行建网,并在此工作基础上引入了随机游走模型以及层次聚类方法,选用了性能更佳的非重叠社团发现算法,从肺痿数据集中建模得到了一些药物社团的组团规律,从而为肺痿方规律挖掘提供了新的思想。主要工作如下: 1)对中药肺痿数据预处理,针对“功效术语不规范”的问题进行了相应的数据预处理。 2)提取药物的“性味”、“归经”、“功效”三个药性字段,建立药性向量空间模型,并定义了药性相似度。 3)提出了一种加入药物权重改进的药物组网算法,定义了一种新的组网模型,按照该模型组建药物组方网络。 4)提出了一种药物节点加入药性节点建网并进行非重叠社团发现的算法Random Walk and Hierarchical Clustering algorithm(RWHC),在药物组方网络中加入药性节点扩展为新的网络,在此基础上结合随机游走用层次聚类算法挖掘药物社团。