K-均值文本聚类算法在智能答疑系统中应用

来源 :科技广场 | 被引量 : 0次 | 上传用户：BruceLee_123

【摘要】

：

本文将数据挖掘算法应用于智能答疑系统中，提出了一套基于数据挖掘算法的答疑设计方案并加以改进，传统的K-均值算法聚类虽然速度快．在文本聚类中易于实现。但其同样依赖于所有变

【作者】

：

程铃钫何月顺

【机构】

：

东华理工大学信息工程学院

【出处】

：

科技广场

【发表日期】

：

2009年1期

【关键词】

：

文本聚类 K-均值变量加权子空间 Text Clustering K-means Featuresweight Subspace

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文将数据挖掘算法应用于智能答疑系统中，提出了一套基于数据挖掘算法的答疑设计方案并加以改进，传统的K-均值算法聚类虽然速度快．在文本聚类中易于实现。但其同样依赖于所有变量．聚类效果往往不尽如人意。为了克服这一缺点，提出一种改进的K-均值文本聚类算法．它在K-均值聚类过程中。向每一个聚类簇中的关键词自动计算添加一个权重，重要的关键词赋予较大的权重。经过实验测试，获得了一种基于子空间变量自动加权的适合文本数据聚类分析的改进算法。它不仅可以在大规模、高维和稀疏的文本数据上有效地进行聚类。还能够生成质量较高的聚类

其他文献

我国成人高等教育人才培养模式的研究

本文从成人高等教育人才培养模式内涵出发,总结了我国成人高等教育人才培养模式及存在的问题。并对建立创新型成人高等教育人才培养模式进行了阐述。

期刊

成长高等教育人才培养模式创新性

试论古代城市与河流的关系——以古都洛阳为例

河流对于一个城市选址和发展有着至关重要的地位,处理好河流与城市发展的关系,才能使这个城市接受历史的考验.洛阳作为中国古代最著名的大都市之一,它的兴衰与其洛阳盆地的河

期刊

洛阳伊洛河网城市布局河流水源Luoyang Yiluo fiver network urban layout fiver and water so

静脉留置针在小儿科输液中的应用及综合护理研究

[目的]研究在小儿科输液中行静脉留置针之后予以综合护理干预的临床疗效果。[方法]依据随机数字表法将本院参与纳入的60例样本进行随机分组,将实行常规护理的30例患儿作为对

期刊