论文部分内容阅读
文中提出了一种二元表示聚类方法。首先,将要研究的实体以属性串的方式表达,并通过二元树转化为二进制串。其次,采用改进的海明距离代替欧氏距离计算二进制串之间的相似度。该方法通过属性加权,使计算结果更加贴近现实,并将实体以‘01’编码方式表示,简化了计算,提升了运算效率。最后,选取1796家上市公司的73个财务指标进行实验,结果表明,该方法对海量数据的处理表现良好。