基于网络舆情的K-Means算法的改进研究

来源 :电脑开发与应用 | 被引量 : 0次 | 上传用户:wutiepeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的K-Means聚类算法只能保证收敛到局部最优,从而导致聚类结果对初始代表点的选择非常敏感;凝聚层次聚类虽无需选择初始的聚类中心,但计算复杂度较高,而且凝聚过程不可逆。结合网络舆情的特点,深入剖析了K-Means聚类算法和凝聚层次聚类算法的优缺点,对K-Means聚类算法进行改进。改进后算法的核心思想是,结合两种算法分别在初始点选择和聚类过程两个方面的优势,进行整合优化。通过实验分析及实际应用表明,改进后的文本聚类算法在很大程度上可以提高网络舆情信息聚类结果的准确性、有效性以及算法的效率。
其他文献
饮用水水源的污染日益严重 ,对人类的健康和传统净水工艺都构成了较大的威胁 ,更加剧了水资源的危机。文中阐述了近年来我国处理微污染水源水的主要技术 :强化混凝处理技术、
目的:探讨雌激素受体(ER)、孕激素受体(PR)在葡萄胎组织中的表达及临床意义。方法:采用免疫组织化学(SP)法,检测20例早孕正常绒毛、20例流产绒毛水肿、28例部分性葡萄胎、35例完全性
【正】 潘先生离开我们而去了!他的一生,是不尚虚华勤于治学的一生,是严于律己,宽厚待人的一生。在生命的最后时刻,还悬念着他的《易》学手稿及召开一次《易》学盛会的事。我
系统地介绍了一个传统人才测评模型的计算机实现方案以及系统优化的途径。并通过与传统测评方式的比较 ,进一步阐明了新系统的灵活性、扩展性、适应性。文末分析了该人才测评
文章针对建设工程项目在招投标过程中存在多项指标且难以统一、定量评估不足等问题,引入AHP层次分析法,根据项目的具体情况建立起层次结构模型,结合定量与定性分析法,可在一
通过硝酸溶解样品,可溶有机试剂对ICP-AES测定水质铁的影响,用三种有机试剂对铁浓度变化结果的对比。结果表明,得到含5%正丙醇的溶液试剂用量及仪器检测性能条件最佳。ICP-AE
近些年来水泥工业取得不断发展的同时混凝土的材料亦具有越来越多的品种,而土木工程的领域中新型的混凝土材料具有越来越重要的作用。其同传统的混凝土相较而言具有更高的耐
科技企业孵化器,是以促进科技成果转化、培育和扶植高新技术中小企业、培养自主创新企业和企业家为宗旨的科技创业服务机构。科技企业孵化器是一种资源能力的集合,主要通过开
保险系统性风险及其宏观审慎监管问题是国内外理论界与实务界普遍关注的问题。本文遵循从一般系统性风险到保险系统性风险的逻辑,分析了保险系统性风险及其宏观审慎监管的理
根据WIOD数据库1995-2011年数据,本文对中国纺织服装业出口贸易增加值进行核算,并通过GVC指数和RCA_GVC指数对中国纺织服装业出口贸易增加值进行合理评价,发现中国纺织服装业