基于EM算法的文本聚类优化研究

来源 :信息与控制 | 被引量 : 0次 | 上传用户:zhaoliping1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对现有的文本聚类算法难以取得满意结果的问题,以EM算法为基础,提出能分别描述相似、不相似聚类对的相似性分布以及重要、不重要文档的重要性分布的文本聚类优化模型(text clustering optimization model,TCOM).基于该模型,设计一种通过合并不同的文本聚类结果以获取最优性能的方法.实验结果表明,利用该方法同时改善了聚类精度和召回率,其性能优于单独使用现有的硬、软聚类算法.
其他文献
针对鄂州电厂负压气力除灰系统出力下降的问题,进行了技术分析,提出了改进建议.
全面阐述了加入WTO对我国电力改革、市场、人才、投融资及电力安全等方面的总体影响和对我国发供电企业的具体影响.
自2000年起,吉木萨尔林场开始实施天保工程,林场的中心工作转移到天然林保护上,通过几年的探索实践,总结出一套行之有效的管护办法,现介绍如下。
1998年特大水灾后,根据<中共中央国务院关于灾后重建、整治江湖、兴修水利的若干意见>,关于"全面停止长江、黄河流域上中游的天然林采伐,森工企业转向营林管护"的精神,国家先
新疆天山南北麓以及大小盆地周围山前倾斜平原的较高部位,分布着大面积的砾质戈壁,面积为2.84&#215;10^5平方公里,约占全疆总面积的17.08%。这种地类土壤含量少,肥力低,透水性强,保水
加强“三农”工作,扎实推进建设社会主义新农村建设,中心任务就是促进农民稳定增收。木材经营加工产业作为林业建设的重要组成部分,不仅可以促进农民增收,调动农民造林绿化的积极
以中国新疆和田地区维吾尔自然长寿人群为例,探索一种基于人工智能(artificial intelligence,AI)的生命信息系统新的建模方法.在建模过程中,由于引入人工智能和数据融合技术,能够高
改革开放20多年来,我区林业企业员工继续教育与培训得到加强,员工素质得到了不同程度的提高.据不完全统计,全区4万余名林业从业人员,20年成人教育提高学历达45%以上,继续教育
<正>~~
期刊
重点介绍、总结了20年来湖北电网继电保护稳定措施工作,并提出存在问题和建议.