基于FVSM的核聚类算法在文本聚类中的应用

来源 :长江大学学报自然科学版:理工卷 | 被引量 : 0次 | 上传用户:xiaohongm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对信息挖掘中的文本自动聚类问题,提出了一种基于模糊向量空间模型的核聚类算法。首先对聚类文本进行模糊特征提取得到模糊特征项集,然后依据模糊特征项集对每篇文本计算特征项的文档频数,进而得出每篇文本的模糊特征向量。最后利用高斯核函数将每篇文本的特征向量映射到高维特征空间,在高维特征空间中利用核聚类算法实施文本聚类。该方法在特征提取时充分考虑了特征项在文档中的位置信息,使自动聚类原则更接近手工聚类方法。以中国期刊网全文数据库部分文档数据为例验证了该方法的有效性。
其他文献
为了给广大师生提供伦理教育交流的平台,设计了大学生网络伦理教育主题网站。阐述了该网站的总体设计,详细介绍了网站功能模块设计,并对网站实现进行具体分析。该网站试运行后,效
【正】 一、苏轼词《水龙吟·楚山修竹如云》编年辨误苏轼词《水龙吟·楚山修竹如云》一阙,付莯《东坡纪年录》将其作年定在熙宁八年(乙卯,1075),原题下注云:“赠赵
综述了储液罐抗震研究的发展历史.重点回顾和总结了国内外在不同阶段的研究成果,指出了现阶段的研究状况并提出了尚需进一步研究的某些问题.
【正】 铁刹山,又名九顶铁刹山。有元始顶、真武顶、灵宝顶、玉皇顶、玄武顶、太上顶等诸峰,名虽日九顶,实则数不足九,盖从东、南、北三而仰视,皆见三顶,三三合而为九,故有九
在安排好人民生活的基础上进行建设,兼顾人民生活和经济建设,是贯彻《陈云同志文稿选编》(以下简称《文稿》,引文凡来自《文稿》的,只注明页数)中的一个十分重要的经济思想
在一类典型的非线性需求条件下,分别研究了垄断厂商在二段定价、三段定价以及n段定价情形下最优变折扣率的确定问题,并且给出了垄断厂商在实施变折扣率时收益最大化的条件,进一
对优界原则在非线性分析中的应用进行了探讨。利用优界原则证明了Caristi-Kick不动点定理,利用Caristi-Kick不动点定理证明了Ekeland变分定理;通过引入标量函数法,利用Ekeland变
【正】 最近,由我校中文系当代文学教研室编辑的《冰心研究专集》已经完成.本书详尽地汇集了冰心生平、创作及有关研究的资料,并附有冰心著译系年、研究资料索引等等,特别是
在高校体育的陈式太极拳教学中,采用激发学生兴趣、根据教学需要创造改编套路、因材施教、保持课堂活跃度、给学生及时纠错、注意动作细节的讲解、让学生将陈式太极拳融入生活
小刚度门式刚架型钢劲性水泥土支护结构具有挡土和止水双重功能,运用有限元软件ADINA模拟分析得知,水泥土材料性能、型钢型号、水泥土挡墙厚度和刚架宽度均在不同程度上影响