基于Chameleon算法的文本聚类技术研究

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:echo19
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本聚类是聚类的一个重要的研究方向,是聚类在文本处理领域的重要应用。但是,传统的聚类算法在文本聚类应用中的表现并不能让人满意。文中将一种新的聚类算法——Chameleon算法引入中文文本聚类领域中。在构建中文文本聚类模型的基础上结合了分词、文本向量化等技术进行了相关实验。实验的结果表明Chameleon算法可以应用在中文文本聚类领域中,同时也解决了传统算法在聚类形状发现方面的不足。相关实验说明了这种算法在中文文本聚类领域应用中的有效性和实用性。
其他文献
为简化伺服机器人内部通信结构,增强机器人通信能力,提升处理速度,解决多轴协调控制问题,介绍了一种基于NIOSII处理器和FPGA(Field Programmable GateArray)的面向伺服机器人内部通
日前,国务院新闻办公室在新闻发布厅举行中外记者见面会,邀请4位基层农业工作者围绕“农民丰收”与中外记者见面交流。《中国农资》记者就基层合作社如何更好地发挥这种示范带
在IP网络中,当某链路或者节点发生故障时,通过路由协议的收敛来绕开故障的链路或节点。对OSPF路由协议,这个时间至少为5秒,期间经过故障节点或链路的流量将会被丢弃,绝大多数
在现有格式的基础上要提高偏微分方程数值解的分辨率,自适应移动网格技术是一种有效而且可行的方法。文中将文献[1]提出的自适应移动网格技术推广到三角形网格,并将该方法用于
当前,伴随角膜屈光技术研究的不断深入,角膜屈光手术得到较为快速的发展,手术的安全性、有效性、可预测性及屈光稳定性均有显著提升,逐渐被广泛应用于眼科疾病的临床治疗中。
针对当前现状下人们对能够实现个性化营养评估并提供营养配餐保障服务的迫切需求问题,设计实现一个基于web的个性化智能营养评估保障系统。在对当前营养配餐软件或系统现状研
提出从整体上考虑三角网格模型的简化误差的方法。该方法综合考虑了三角网格模型上所有采样点对误差的贡献,较以往方法只考虑最大误差更加准确。利用CUDA实现了高度并行化的网格模型简化误差计算算法。算法采用平均单元格来组织三角片,以便快速空间查询。同时设计了相应的数据结构,克服了CUDA没有指针、不能动态申请资源、尽量避免同步操作等问题。最后通过实验证明了本算法在速度和数据量上的优越性,并且阐述了GPU相
随着地理信息系统的普及,越来越多的用户希望在线获取空间服务和空间数据。P2P技术为矢量地理数据的处理提供了充分的计算能力和服务能力,在P2PGIS系统中,索引网络的路由效率是
CAR是一种二进制构件技术,Elastos是CAR的运行时环境,Elastos支持一种类似于Java虚拟机的二进制构件虚拟机,这个虚拟机对外提供JNI接口,即外部程序通过类似JNI接口规范的方式访问
理论是实践的先导,思想是行动的指南。药品监管工作既是行政执法活动,也是研究处理各类监管问题的活动;药品监管人员既是法规制度的执行者,也是政策规定的制定者或建议者。因