一个基于关联规则的多层文档聚类算法

来源 :计算机应用 | 被引量 : 8次 | 上传用户:yulekan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种新的基于关联规则的多层文档聚类算法,该算法利用新的文档特征抽取方法构造了文档的主题和关键字特征向量。首先在主题特征向量空间中利用频集快速算法对文档进行初始聚类,然后在基于主题关键字的新的特征向量空间中利用类间距和连接度对初始文档类进行求精,从而得到最终聚类。由于使用了两层聚类方法,使算法的效率和精度都大大提高;使用新的文档特征抽取方法还解决了由于文档关键字过多而导致文档特征向量的维数过高的问题。
其他文献
国家卫生健康委员会主管中日友好医院主办大爱有方,良药在心。《中老年保健》以中日友好医院知名专家原创科普文章为核心,科学严谨、通俗易懂.慧生活,懂健康,我们提供科学、
在对预期违约制度和不安抗辩权比较分析的基础上,结合我国<合同法>立法实际,指出了<合同法>存在不足,提出了改善建议.
讨论了图像去噪的扩散方程模型中所存在的最优停止时间选取问题。通过对图像点乘一个与梯度成反比的作用系数来构造一个新的去噪后的图像与去掉的噪声之间的相关系数,最优停止时间的选取就等价于极小化该相关系数。该准则能有效抑制图像中高频信息的存在对相关系数计算的影响,获得准确的最优停止时间,并无需预先知道图像中的噪声水平。仿真计算结果表明采用该准则所得的停止时间非常接近于基于最优峰值信噪比所得的停止时间,且广
期刊
针对标准BP网络学习算法收敛慢的问题,提出了两种权值更新的快速收敛算法,即基于梯度变化率的快速传递算法和基于梯度方向的弹性传递算法,并在煤矿事故救援游戏式训练系统中进行仿真和比较,让游戏角色根据井下空气成分学习判断危险程度,以便受训人员或仿生机器人采取相应的措施。仿真结果表明,所提算法的收敛时间比标准算法有一定改善。
RT -Z是由Z和经实时扩展的通信顺序进程timedCSP集成的用以描述实时系统的规格说明语言,它将Z对状态描述的优点和timedCSP对时序关系和并发描述的优点相结合,具有强大的描述能力;而基于时序转化系统的Z扩展适合描述系统状态的转化。给出了Z实时扩展的分类原则并从讨论了其应用特点,最后在分析RT- Z的语义集成的基础上提出了Z实时扩展的多视点应用模式。
优秀教练员必须具备的“十心”曲阜师大郭庆兵教练员的任务就是率领全队夺取比赛的胜利,为此教练员要做大量的工作,花费大量的时间研究本队和对手的实际情况,并有针对性地进行技
提出了图书馆面对信息市场应走信息服务产业化道路,论述了图书馆人在信息服务产业化中应具备的主要观念.
创造和推进有中国特色的新型的社会主义电视文化,必须努力实践江泽民同志关于"三个代表"的重要思想,坚定不移地坚持党性原则,继承和发扬中华民族优秀的文化传统,充分展示电视
介绍志愿者计算环境下应用的研究现状,根据该环境下科学计算应用的类型,分析应用的任务关系图,包括静态任务关系图和动态任务关系图。描述了电力系统潮流计算和生物信息学的序列比对。提出这两个应用在志愿者计算环境下的任务划分方式、分析并行粒度和应用特点。通过在计算平台P2HP上对两个应用进行实验和性能分析,总结了适合在志愿者计算平台上运行并取得高性能的科学应用的特点及对平台的要求。