一种统计降维和Kohonen网络相结合的文本聚类方法

来源 :计算机应用 | 被引量 : 7次 | 上传用户:zhang444051115
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于词条互信息(WM I)值的统计降维和Kohonen网络(SOFM网)相结合的文本聚类方法,WM I值的方法侧重考虑文本特征项之间的互信息进行降维,可提高特征选择的效率,并使其更趋实用化。采用Kohonen网络进行文本聚类,其学习率函数是随时间单调下降的退火函数,实验结果表明了这种结合方法较一般的降维方法得到的聚类结果具有较高的聚类精度。
其他文献
描述了基于TMS320DM642DSP平台的H.264高性能视频编码器的设计和实时实现。首先提出了H.264视频编码器硬件结构设计,包括DM642的DSP芯片选择,继而描述了编码算法的移植,以及基于DM642结构和专用操作指令的算法优化,重点讨论了像素插值与运动估计的优化算法。实验结果表明,该优化算法可以在DM642上实现实时的H.264编码器,并且保持了很高的压缩效率和图像质量。
针对基于背靠背PWM变流器的永磁同步发电机(PMSG)风力发电系统,从能量平衡角度出发,分析了引起直流侧能量波动的2个主要因素,即风机能量波动和电网电压波动,并基于小信号模型分
今年是我参加工作的第十二个年头,在同事的眼里,我是一个满怀激情、充满干劲的“年轻人”;在学生的眼里,我是一个爱好广泛,乐观开朗的“阳光老师”……其实,从参加工作那会儿的美好
对于进一步加强和改进思想政治教育,在"人的全面发展"理念的指引下,提升高职思想政治教育亲和力,是增强思想政治教育针对性的必然要求。通过对思想政治教育亲和力的诠释,着重
目的 探讨锁定钢板内固定结合中药治疗肱骨近端骨折患者的临床疗效。方法 本文选择本院2013年4月至2016年4月收治的121例患者随机分为观察组(n=61)和对照组(n=60)。对照组给予锁
黑碳(Black Carbon,BC)是生物质和化石燃料在不完全燃烧条件下产生的高度难熔性碳质颗粒物,因其涉及到气候变化、碳循环、空气质量和公共健康等诸多问题,已成为当前气候和环
移动通信节点要做到永远在线(alwaysonline),需要大量的IP地址。IPv4向IPv6的过渡需要一定的时间,作为连接两代IP协议桥梁,地址的转换机制需要适应过渡时期网络的任何情况;而现今的转换机制都没能做到这一点。文中基于无线通信的原理,提出了一种IP过渡时期通用的地址转换机制,并应用于无线网络。
后真相时代信息失实与新闻失范现象频发,事实核查平台迎难而上,获得大量机遇的同时,也面临着传播效果困境的难题。本文以传统媒体人民网"求真"栏目、行业巨头子平台腾讯"较真
近日,广西玉林市福绵区农民宁春激动地从玉柴动力公司管理人员手中接过田园搬运机(俗称“爬山虎”)的钥匙,高高兴兴地把田园搬运机开回家,成为玉柴动力公司田园搬运机的第一位用户
四川凉山州甘洛彝族传统刺绣以工艺精湛、纹饰繁复细腻、色彩艳丽冠绝凉山,于2010年入选四川省第二批非物质文化遗产保护项目。文章梳理归纳了甘洛彝族刺绣的特殊工艺,并提出