潜在语义索引在文本分类中的应用

来源 :电脑与信息技术 | 被引量 : 0次 | 上传用户：ten_wang

【摘要】

：

传统的文本分类都是根据文本的外在特征进行的，最常见的就是基于向量空间模型的方法，使用空间向量表示文本，通过相似度比较来确定分类。为了克服向量空间模型中的词条独立性假设

【作者】

：

伍建军康耀红

【机构】

：

海南大学信息科学技术学院

【出处】

：

电脑与信息技术

【发表日期】

：

2006年5期

【关键词】

：

潜在语义索引文本分类奇异值分解 latent semantic indexing （LSI） text classification singular

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

传统的文本分类都是根据文本的外在特征进行的，最常见的就是基于向量空间模型的方法，使用空间向量表示文本，通过相似度比较来确定分类。为了克服向量空间模型中的词条独立性假设，文章提出了一种基于潜在语义索引的文本分类模型，通过对大量的文本集进行统计分析，揭示了词语的上下文使用含义，通过奇异值分解有效地降低了向量空间的维数，消除了同义词、多义词的影响，从而提高了文本分类的精度。

其他文献

清洗不彻底导致原油标准体积管的附加误差

用于流量计检定的标准体积管一般应每３年标定１次。标定前通常采用水驱法来清洗体积管，清洗过程的完善与否。会直接影响标定的精度。在多年现场经验的基础上，运用大量的第一手数据

期刊

体积管流量计计量油气计量油田

基于SOA的数据集成研究与应用

随着企业信息化的发展，企业需要对大量异构、分布、自治数据源进行集成。以SOA架构和Web Services技术为支撑，采用XML技术进行集成，实现了一个统一的数据平台，为系统的其他部分提

期刊

面向服务数据集成XML异构数据源service-oriented data integration XML heterogeneous data sou

环形低碳钢滞后阻尼器的研究

针对框架－核心筒体结构体系的特点和低碳钢的优良性能，在吸收国内外学者有关研究成果的基础上，开发研制了一种新型的耗能减震器－环形低碳钢滞后阻尼器。这种减震器的优点是耗能区

期刊

阻尼器低碳钢环形阻尼器ringlike hysteretic/steel/energy absorber/study

Windows和Linux动态链接库研究及应用

动态链接库技术是实现和设计程序常用的技术.文章分析和比较了Windows和Linux两种操作系统动态技术,并给出了将Visual C++编制的动态库移植到Linux上的方法和经验.

期刊

WINDOWSLINUX动态链接库技术应用Visual设计程序动态技术操作系统C^++动态库Dynamic Link LibraryShar

对氨水泵机械密封失效原因的分析及处理

针对４ＰＡ－６×４型氨水泵机械密封频繁失效的问题，通过对该泵机械密封的失效原因进行综合分析，找出了其主要原因是由于原密封选型不合理，轴套结垢，泵振动大及安装精度低等原因造成的，对

期刊

氨水泵机械密封故障处理氨水输送系统

原油的胶凝结构特性研究

根据热油管道的运行特点，在室内用旋转粘度计做模拟实验，研究了管道停输后，胜利原油的胶凝结构特性与剪切历史、停输时间、启动温度及启动剪切率等因素的关系。

期刊

原油胶凝结构模拟实验输油管道管道运输

对Wyle符号游程编码方法的改进

文章指出了用于二值图像游程编码的 Wyle符号法对码字的潜力利用还不充分 ,提出了一种可以使编码的压缩比明显提高的改进方法。

期刊

游程编码图像编码Wyle符号二值图像binary imagerun length codingWyle-symbol methodimprove

基于校园网的远程多媒体教学系统探讨

国家教委目前特别重视远程教育在我国的发展。文章根据我国高校校园网的发展状况，探讨了基于校园网的远程多媒体教学系统的若干相关问题，分析了目前我国远程教学系统所存在的主

期刊

多媒体远程教学系统远程多媒体教学国家教委远程教育中国高校校园网交互性多媒体数据设计方法传输campus networklong distan

社会保险信息系统中基金征缴算法

社会保险基金的征缴是社会保险信息系统中的关键环节,按时、足额征收社会保险基金将保证社会保险正常和安全运行,促进社会和谐和稳定。文章着重介绍了社会保险基金的统一征缴

期刊

社会保险社会保险基金基金征缴social insurance social insurance funds fund collection

DiffGram结合中间件的网络应用方法

文章利用XML DiffGram及中间件技术,通过网络实现了对SQL数据库表的删除、插入和更新等操作.与一般操作数据库方法不同,该方法直接使用XML文件对SQL Server2000的数据进行操

期刊

DiffGramSQLXML中间件DiffGramSQLXMLmiddleware

潜在语义索引在文本分类中的应用

与本文相关的学术论文