基于FVSM的核聚类算法在文本聚类中的应用

来源 :长江大学学报自然科学版：理工卷 | 被引量 : 0次 | 上传用户：xiaohongm

【摘要】

：

针对信息挖掘中的文本自动聚类问题,提出了一种基于模糊向量空间模型的核聚类算法。首先对聚类文本进行模糊特征提取得到模糊特征项集,然后依据模糊特征项集对每篇文本计算特

【作者】

：

杨延锟许少华

【机构】

：

大庆石油学院计算机与信息技术学院

【出处】

：

长江大学学报自然科学版：理工卷

【发表日期】

：

2010年1期

【关键词】

：

模糊向量空间模型文本聚类核聚类算法 data mining fuzzy vector space model Document clustering

【基金项目】

：

黑龙江省普通高等学校骨干教师创新能力资助计划项目（1055G002）,黑龙江省自然科学基金项目（ZA2006-11）,黑龙江省科技攻关项目（GZ07A103）.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对信息挖掘中的文本自动聚类问题,提出了一种基于模糊向量空间模型的核聚类算法。首先对聚类文本进行模糊特征提取得到模糊特征项集,然后依据模糊特征项集对每篇文本计算特征项的文档频数,进而得出每篇文本的模糊特征向量。最后利用高斯核函数将每篇文本的特征向量映射到高维特征空间,在高维特征空间中利用核聚类算法实施文本聚类。该方法在特征提取时充分考虑了特征项在文档中的位置信息,使自动聚类原则更接近手工聚类方法。以中国期刊网全文数据库部分文档数据为例验证了该方法的有效性。

其他文献

大学生网络伦理教育主题网站设计与实现

为了给广大师生提供伦理教育交流的平台，设计了大学生网络伦理教育主题网站。阐述了该网站的总体设计，详细介绍了网站功能模块设计，并对网站实现进行具体分析。该网站试运行后，效

期刊

网络伦理教育主题网站设计

宋词札记二则

【正】一、苏轼词《水龙吟·楚山修竹如云》编年辨误苏轼词《水龙吟·楚山修竹如云》一阙,付莯《东坡纪年录》将其作年定在熙宁八年(乙卯,1075),原题下注云:“赠赵

期刊

札记熙宁辨误校笺岭南苏轼词水龙吟秦观苏州致仕

储液罐抗震的研究

综述了储液罐抗震研究的发展历史.重点回顾和总结了国内外在不同阶段的研究成果,指出了现阶段的研究状况并提出了尚需进一步研究的某些问题.

期刊

储液罐抗震研究提离耦合

铁刹山

【正】铁刹山,又名九顶铁刹山。有元始顶、真武顶、灵宝顶、玉皇顶、玄武顶、太上顶等诸峰,名虽日九顶,实则数不足九,盖从东、南、北三而仰视,皆见三顶,三三合而为九,故有九

期刊

玉皇乾坤道教太子河本溪市车站文献材料甸子真武铁路

兼顾人民生活和经济建设——学习《陈云同志文稿选编》

在安排好人民生活的基础上进行建设,兼顾人民生活和经济建设,是贯彻《陈云同志文稿选编》(以下简称《文稿》,引文凡来自《文稿》的,只注明页数)中的一个十分重要的经济思想

期刊

改善人民生活社会主义经济建设陈云同志社会主义基本经济规律社会主义制度经济思想客观要求社会主义生产文稿社会主义经济规律

一类典型的非线性需求条件下的变折扣率研究

在一类典型的非线性需求条件下，分别研究了垄断厂商在二段定价、三段定价以及n段定价情形下最优变折扣率的确定问题，并且给出了垄断厂商在实施变折扣率时收益最大化的条件，进一

期刊

非线性需求二级价格歧视变折扣率typical nonlinear demandssecond price discriminationunfixed

优界原则在非线性分析中的应用

对优界原则在非线性分析中的应用进行了探讨。利用优界原则证明了Caristi-Kick不动点定理，利用Caristi-Kick不动点定理证明了Ekeland变分定理；通过引入标量函数法，利用Ekeland变

期刊

优界原则非线性分析Caristi-Kick不动点定理Ekeland变分定理Phelps引理药瓣定理Dane~下降定理

中文系编写《冰心研究专集》已经完成

【正】最近,由我校中文系当代文学教研室编辑的《冰心研究专集》已经完成.本书详尽地汇集了冰心生平、创作及有关研究的资料,并附有冰心著译系年、研究资料索引等等,特别是

期刊

冰心中文系当代文学资料索引研究者教研室系年生平编辑创作

高校体育教学中陈式太极拳教学方法研究

在高校体育的陈式太极拳教学中，采用激发学生兴趣、根据教学需要创造改编套路、因材施教、保持课堂活跃度、给学生及时纠错、注意动作细节的讲解、让学生将陈式太极拳融入生活

期刊

高校体育陈式太极拳教学方法

小刚度门式刚架型钢劲性水泥土支护结构有限元分析

小刚度门式刚架型钢劲性水泥土支护结构具有挡土和止水双重功能,运用有限元软件ADINA模拟分析得知,水泥土材料性能、型钢型号、水泥土挡墙厚度和刚架宽度均在不同程度上影响

期刊

小刚度门式刚架水泥土基坑支护有限元ADINAsmall rigidity portal framecement-soilfoundation pi

基于FVSM的核聚类算法在文本聚类中的应用

与本文相关的学术论文