基于共识和分类改善文档聚类的识别信息方法

来源 :计算机应用 | 被引量 : 3次 | 上传用户:helen_00_00
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不同的聚类算法用于设计各自的策略,然而,每种技术在执行特定数据集时都有一定的局限性。选择恰当的识别信息方法(DIM)可确保文档聚类的进行。针对这些问题提出一种基于共识和分类的文档聚类(DCCC)的DIM。首先,选择识别信息最大化聚类(CDIM)作为数据集生成初始聚类的解决方法,并使用两种不同的CDIM方法生成两个初始聚集;其次,使用不同的参数方法对两初始聚集再进行初始化,通过簇标签信息间的关系建立共识,最大限度地提高文档的识别数总和;最后,选择识别文本权重分类(DTWC)作为文本分类器给共识分配新的
其他文献
我院开展血液透析8年多来,在平时的工作中,通过不断反复地与患者接触和深入交流沟通,发现尿毒症患者行血液透析时普遍存在以下心理状态。
面对多类别且标注数量有限的样本,为进一步提高车脸图像的识别准确性,提出一种基于改进非负矩阵分解(NMF)的车脸识别算法。首先,采用方向梯度直方图(HOG)算子提取车脸图像局部区域形状特征,并将其作为车脸图像的初始特征;而后,提出具有多权重、正交性、稀疏性约束的NMF模型,并基于该模型获得了描述车脸图像中关键区域的特征基,实现了特征的降维;最后,利用离散余弦距离计算特征间的相似性,进而对车脸图像是否
沟通是建立良好护患关系的桥梁,是进行护患信息交流的一种重要形式。沟通是指人们在社会实践中彼此传输概念、思想和感情的过程。沟通的成功与失败常常影响人的情绪和精神面貌
通过论述加快现代农村小城镇发展的重要意义,分析加快推进现代农村小城镇发展过程中存在的问题,并提出加快推进现代农村小城镇发展的对策建议,以期使农村小城镇与整个社会经济建
目的:比较度洛西汀与帕罗西汀治疗伴有广泛焦虑障碍的抑郁症的疗效。方法:对59例抑郁症及广泛焦虑障碍患者随机分为度洛西汀组和帕罗西汀组,疗程8周。于治疗前及治疗1、2、4、8
<正>地点/北京朝阳设计/2011-2013年/竣工/2015年Design Stage 2011-2013 Completion 2015业主北京绿地京华置业有限公司设计团队中方设计团队:金鼎、曲秉直(建筑);范重、彭
地球上最古老的生命究竟起尖兵地什么时间?火星上究竟有没有生命?过去一年里,新发现的化石证据起了科学家的热烈争论和普遍质疑。
话语权是每个学生的权利,在学生生活的主要场景——课堂中,作为教师应该给予他们话语的权利,特别是富有灵性和激情,富有诗性和人情的初中语文教师。可是这种显而易见的权利却被轻易地剥夺了,有事实为证:那是一节公开课,上课的老师显然是经过精心准备的,他带着少数学生完成了一个又一个精彩的任务,这些学生的回答准确到位、异彩纷呈;教师的过渡语、总结语巧妙自然、激情洋溢,课堂在“完美”中结束了。而笔者却陷入了思索: