一种基于Ontology的中文Web文本聚类算法的研究

来源 :福建电脑 | 被引量 : 0次 | 上传用户:a67273271
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文引入HowNet本体,重构中文Web文档集特征向量,实现特征降维,提高聚类分析的效率;引入粗糙集属性约简对文档未登陆词集进行二次反馈学习,修正HowNet的不完备性。最后,通过两个实验,评测了该聚类分析算法优缺点。
其他文献
科学发展观是人类经济社会发展经验的总结,是我党执政理念的一次新的飞跃。坚持以人为本,强调全面、协调、可持续发展,是科学发展观的基本要求。要贯彻和落实科学发展观,不仅
结合工作实践对这两种类型的硬盘保护系统在机房管理中的应用进行分析比较,并给出建议。
期刊
数字签名技术是信息安全与电子商务的核心技术之一,椭圆曲线密码体制的安全性是基于椭圆曲线离散对数问题,被认为是当前替代RSA公钥系统的最佳选择。本文介绍了椭圆曲线密码体
语法分析存储结构的设计与直接关系语法分析和操作算法的执行效率。本文讨论了语法分析的存储结构设计对操作算法的影响以及并行识别存储结构的分析与设计。并以实例给出建立
信息隐藏技术既隐藏信息的内容又隐藏信息的存在,它作为确保计算机网络信息安全的一个重要手段正成为信息安全领域的研究热点之一。根据Word文档的特点,提出了一种在Word文档
2006年中国实行个人申报个人所得税制度到2010年已经走过一段时间,但是在我国普通工薪阶层仍是个人所得税的主力军,占到了个人所得税额度的半壁江山。这个现状说明我们的个人
加强材料的质量控制,是提高工程质量的重要保证,也是创造正常施工条件的前提。材料质量控制的内容包括:材料的质量标准,材料的性能材料取样、试验方法,材料的适用范围和施工要求等
公司治理结构是为了保证企业民主管理、科学决策而进行的制度安排与设计,这种制度安排和设计本身就是一个结构和机制的有机集合。而内部财务控制则是这种制度安排与设计下的
本文根据A*算法的基本特点分析了影响A*算法效率的原因,通过在A*算法中引入二元堆,从而达到提高算法效率的目的。模拟实验结果证明了基于二元堆的A*算法比标准A*具有更高的执行效率。