【摘 要】
:
K-prototypes算法只适合处理对称标称型数据、序数型数据和区间型数据,对于用户兴趣等非对称型数据之间的相异度计算,如果采用对称标称型数据间的计算方法,则误差较大,而且设
【机 构】
:
安徽财经大学工商管理学院,复旦大学管理学院
论文部分内容阅读
K-prototypes算法只适合处理对称标称型数据、序数型数据和区间型数据,对于用户兴趣等非对称型数据之间的相异度计算,如果采用对称标称型数据间的计算方法,则误差较大,而且设定的分类属性权重调整系数不容易确定。在考虑多种属性数据特征的基础上,对K-prototypes算法加以改进,提出一种简单的各类属性权重系数计算方法,即按属性比例初步计算各类属性权重,并分别配以微调系数进一步微调。同时扩展其算法,使其可以更好地处理非对称标称型数据,提升聚类效果。最后在实际的客户细分应用中验证其有效性。
其他文献
目的建立测定蒲金散结胶囊中绿原酸含量的方法。方法采用DiamonsilC18(150mm×4.6mm,5μm),流动相为乙腈-0.4%磷酸(14:86),流速为1.0mL/min,检测波长为327nm。结果绿原酸质量浓度在8.056
以PAN基碳纤维针刺整体毡为预制体,经化学气相渗透法制得C/C多孔坯体,采用反应熔体浸渗法制备了C/C-Si C摩擦材料。用XD-MSM型定速摩擦试验机测定摩擦磨损性能,研究了不同Si
通过DPPH·清除能力、·OH清除能力、O2-·清除能力和还原力抗氧化模型,测定富硒菜籽粕蛋白及普通菜籽粕蛋白抗氧化活性.所选4种抗氧化体系中,富硒菜籽粕蛋白的
为了提高聚类算法的全局搜索能力,提出了一种融合改进的粒子群算法(IPSO)和K-调和均值聚类(KHM)的混合聚类算法(IPSO-KHM)。该算法为了改进PSO算法容易陷入局部最优的缺点,提出了一