一种基于LSA与FCM的文本聚类算法

来源 :山西大同大学学报:自然科学版 | 被引量 : 0次 | 上传用户:simonhill
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在文本聚类中,基于向量空间模型(VSM)的文本特征空间存在高维度和稀疏空间、同义词与多义词干扰等问题;而K-means算法依赖于初始聚类中心,聚类结果随不同的初始输入而有所波动。针对这些问题,本文提出了一种基于潜在语义分析(LSA)与优化的模糊C均值(FCM)的文本聚类算法——LF。该算法首先采用一种新的词特征提取方法建立词-文本矩阵;然后对该词-文本矩阵进行奇异值分解在潜在语义空间进行降维;接着用优化的模糊C均值聚类算法实现对文本的聚类分析。最后通过实验,结果表明LF算法能更好地改善了文本聚类的结果,提
其他文献
胡道静先生(1913-2003)百年诞辰之际,《胡道静文集》(虞信棠、金良年编,2011年12月)由上海人民出版社编辑出版。文集凡7卷,约400万字,分编为《上海历史研究》、《农史论集·古农
[摘要]:被孔子称为“大孝”、“纯孝”的舜,之所以备受后世尊崇,列为二十四孝之首,不仅仅具有一般人的能爱亲、尊亲,更能“事难事之父母”,甚至无知的父、母(后母)、弟加害于他,也仍以孝养之、敬之、顺之,以父母兄弟之忧而忧、之乐而乐。从他的孝行传说中,我们看到中华民族的传统美德——孝文化的产生与发展。  [关键词]:舜帝 孝行 传说    孝是一种家庭美德。家庭是人类活动和繁衍的最小单位。家庭虽小却反
不同的情感体验对学习、认知等活动有一定的影响。当人们处于轻松愉快的情绪体验中时,一般的认知效果较好,思维和想象活动更为活跃。如今,素质教育得到了广泛的提倡。情感教育作
回顾了类域论的早期发展,尤其是希尔伯特的研究;以谢瓦莱引入的伊代尔概念为核心,深刻挖掘伊代尔概念的重要性,重新评价了谢瓦莱类域论工作的历史价值。指出正是借助伊代尔的
小浪底工程地下厂房永久支护,在国内首次采用DSI系统双层保护锚索。锚索体内锚固段有双层防腐保护,第一层为水泥浆或水泥砂浆,第二层为锚索体外封闭的PVC波纹管。根据地下厂房顶
1996年汛期,黄河流域平均降雨量比多年同期均值偏多3.6%,但干支流来水来沙量普遍偏少,属枯水沙年份。黄河上游主要水库蓄水量偏少。花园口站出现洪峰流量大于3000m^3/s的洪水共3次,其中最大洪峰流量
本文主要通过对畜牧产业发展现状及存在的问题进行分析,结合现有的生产实际,提出了乡镇畜牧产业发展的对策和建议,为今后乡镇畜牧产业发展提供科学的理论依据和支撑。
兴趣是最好的老师。当今学生特点是好奇,好新,好趣,教育系统论告诉我们,有兴趣就容易接受新鲜事物,敢于创新,开拓进取,塑造新型人才。引导学生积极参与探索知识的奥秘是激发
在三维显示领域中,机动目标实时显示问题始终是研究的热点,为了进一步提高机动目标显示的效果,在保证画面分辨率的前提下,减少时延。针对于Unity3D引擎和Visual C++6.0平台的实时通信问题,以舰载机起飞着舰的实际过程为背景,研究实现了舰载机的三维显示系统。重点讨论了Unity3D和Visual C++6.0的通信连接方法,实现了发送数据包来驱动三维模型的过程,以此来实时显示舰载机飞行的状态
【摘 要】《国家英语课程标准》就“教学中应注意的问题”指出:“在教学过程中,要始终体现学生的主体地位,教师应充分发挥学生在学习过程中的主动性和积极性,激发学生的学习兴趣,营造宽松、和谐的学习气氛。”初中英语教学要使学生在学习英语基础的过程中逐渐明确学习英语的目的,提高其自主学习和合作学习的能力,形成有效的英语学习策略,从而培养学生的语言综合运用能力。  【关键词】探索;教学;策略;初中英语   《