模糊聚类在中文文本分类中的应用研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:AliceXQ
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
将基于等价关系的模糊聚类技术应用于中文文本分类,提出了基于模糊聚类的中文文本分类算ATCFC。该算法利用基于二级字索引的正向最大匹配算法对文本分词,建立模糊特征向量空间模型,使用贴近度法刻划文间的相似度。利用算法ATCFC对文本集合进行动态聚类实验,实验结果表明算法ATCFC对于中文文本分类是可行、有效的。
其他文献
人们都记得,半个世纪前的隆冬时节,在这片广袤的黑土地上曾发生过一场名载世界军事史的辽沈战役,并取得了伟大胜利。半个世纪后的1998年第四季度,还是在这方热土上,共和国的税官们又打
采用隐马尔可夫模型(HMM)进行语音声学建模是大词汇连续语音识别取得突破性进展最主要的原因之一,HMM本身依赖的某些不合理建模假设和不具有区分性的训练算法正在成为制约语音
从丰镇发电厂水源地变压器分析入手,对Y/Y0-12接法变压器进行了分析和探讨。
青霉素是建立癫痫动物模型最常用的药物之一,许多学者将青霉素腹腔注射或在脑皮质表面应用,成功地诱导出类似于人类皮质癫痫的动物模型,为癫痫的发病机制和药物、手术治疗方
针对粒子群优化算法中出现的早熟收敛问题,论文提出了一种带自变异算子的粒子群优化算法。该算法在运行过程中增加了随机变异算子,通过对当前最佳粒子进行随机变异来增强粒子群
在过程工业的数据采集和通讯领域中,数据帧是较为常见的一种数据形式。对于同一应用领域来说。建立在数据帧基础上的操作要求通常是相同的,但在不同的具体工程项目中,需要处理的
给出了一组关于分类问题的自足而严密的形式化描述,并远用精确和覆盖两种准则,将类的特征明确划分为充分特征和必要特征。在此基础上,结合“约简”方法和“聚焦”机制,提出了一种
高速公路交通量预测时于高速公路建设和管理具有重要的指导作用.针对传统预测方法准确性低、预测时间长等问题,提出了将BP神经网络和遗传算法有机结合起来的遗传-神经网络预测
当今世界经济竞争剧烈,但经济竞争实际上是高科技的竞争,生物、环境技术是高科技的一种,今后谁在这方面能够领先,谁就能在国际市场的竞争中处于有利地位。21世纪将是环境世纪