一种基于语义的中文文本特征降维技术研究

来源 :情报杂志 | 被引量 : 0次 | 上传用户:bbaaccd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统特征降维方法忽略特征项本身的语义信息,提出一种基于潜在语义索引和词聚类的特征降维方法,通过对原始特征词-文档矩阵进行奇异值分解,根据特征词在语义空间中的相似度进行词聚类,在考虑特征词的语义信息的同时实现特征词维度的降低。实验结果表明,基于潜在语义索引和词聚类的中文文本降维方法对文本分类效果有一定的提升。
其他文献
讨论如何构建社区网络系统模型,通过P2P知识共享网络来支持互动协作。研究结果表明,采用这种社区网络模型实现互动协作和知识共享,可以帮助人们发现所需的网络资源内容,也可
期刊
深入分析了IT治理的涵义,同时全面综述了美国、英国、澳大利亚和有关非政府组织等为典型代表构建的IT治理相关标准和模型,并从侧重点、范围和目标三个方面深入分析这些标准的
【话题一】Animals in danger在进行话题写作之前,首先让我们来个赛前热身。下面这些题都是Module 9的重点短语,让我们先来完成这些小练习,了解并掌握它们的用法后再去写作文,这
提出一种新颖的基于特征融合的灰度图像检索算法,该算法将图像按一定步长量化并映射为n阶频率矩阵,然后融合矩阵第一、第二奇异值向量的信息得到图像复特征向量,最后以余弦相似度作为图像检索的相似度度量。实验数据分析表明,算法在检索性能上优于传统的颜色直方图法。
高等教育的发展重心之一是学科建设,而学科建设的健康发展离不开科学客观的学科评估。以美国大学为研究对象,利用网络计量学中的链接分析方法,对计算机科学、生物医学工程和
提出了一种基于多层次模糊综合评判的相关方向研究热点等级判断方法,从而实现对文献资料的高效组织和智能文献检索。首先,介绍了模糊综合评判的基本原理,通过分析选取了5种研