基于潜在语义索引和遗传算法的文本特征提取方法

来源 :情报科学 | 被引量 : 0次 | 上传用户：winterryliang

【摘要】

：

本文采用潜在语义索引（LSI）和遗传算法（GA）进行文本特征提取。在采用潜在语义索引将语义关系体现在VSM（Vector Space Model）中，通过奇异值分解（SVD，Singular Value Deccvaposition）可以

【作者】

：

郝占刚王正欧

【机构】

：

天津大学系统工程研究所

【出处】

：

情报科学

【发表日期】

：

2006年1期

【关键词】

：

特征提取潜在语义索引遗传算法 KOHONEN网络 feature selection latent semantic index genetic algor

【基金项目】

：

国家自然科学基金资助项目（60275020）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文采用潜在语义索引（LSI）和遗传算法（GA）进行文本特征提取。在采用潜在语义索引将语义关系体现在VSM（Vector Space Model）中，通过奇异值分解（SVD，Singular Value Deccvaposition）可以有效地降低向量空间的维数，但通过维数约简后的文本特征仍要保持在数百维左右，因此本文采用遗传算法在此基础上继续降维。实验结果表明，这两种方法结合可以极大的降低文本向量空间的雏数，并能提高分类准确率。

其他文献

信息素

都内平凡一室研究所室内高家具调度品所狭置主初老男事所着秘男任案内奥部屋部屋中政治家待挨名刺交换在都内一所平凡的公寓里，有一间房子是研究所。室内挤挤插插地摆满了高级

期刊

5—羟色胺在心血管疾病及其治疗中的作用

<正> 本世纪五十年代发现的5-羟色胺(5-HT),由于其受体进一步被分成不同的亚型而再度受到重视。已发现对该受体亚型有选择性的激动剂和拮抗剂5-HT和5-HT能药物与类癌瘤综合症

期刊

心血管疾病原发性高血压外周血管疾病受体激动剂拮抗剂冠状动脉狭窄冠状血管痉挛

另一场风暴袭击美国墨西哥湾沿岸,油价上涨

(2020年10月27日)美国安全和环境执法局(BSEE)周二下午表示,在热带风暴“泽塔”到来之前,美国墨西哥湾沿岸近一半的石油生产已经关闭。石油市场对此感到振奋。今年大量风暴袭

期刊

油价上涨石油市场停产状态原油价格石油产量墨西哥湾执法局生产中断

五重螺旋创新生态系统协同创新机制研究

创新是引领发展的第一动力,创新驱动发展战略是我国实现转型发展、建成现代化强国的重大战略。创新生态系统是以生物学隐喻的方式研究形成的创新系统范式,被看作是创新3.0时

期刊

五重螺旋创新生态系统协同创新驱动要素

纤维素基多孔碳膜的制备及其电化学性能研究

以α-纤维素分散液为前驱体,采用简单的抽滤和热处理工艺制备多孔超薄碳膜。采用扫描电子显微镜、透射电子显微镜等方法对其结构进行了表征;采用循环伏安、恒流充放电、交流

期刊

超级电容器Α-纤维素多孔碳膜电极材料supercapacitorα-celluloseporous carbon filmelectrode mater

天花疫苗的研究现状和进展

目的对现行天花疫苗和天花疫苗的研究进展进行综述,为天花疫苗的研究和应用提供参考。方法通过查阅近年来与天花疫苗有效性和安全性研究相关的国内外文献,进行归纳总结。结果

期刊

天花疫苗减毒活疫苗复制缺陷型减毒活疫苗蛋白亚单位天花疫苗DNA疫苗

工薪与年终奖计税特点及其筹划

根据《个人所得税法》规定，按超额累进税率对工资和薪金计征个人所得税，其计算方法可用下表表示：

期刊

《个人所得税法》年终奖计税工薪超额累进税率计算方法薪金工资

桩土作用对连续梁桥抗震性能的影响分析

结合工程实例,利用有限元分析软件Midas/civil分别建立了考虑和不考虑桩土作用的两种连续梁桥有限元模型,并对比分析了地震荷载作用下两种模型的动力响应,得出考虑桩土结构相

期刊

桥梁抗震反应谱法基于性能抗震设计桩土作用

复掺硅灰的硫酸钙晶须改性水泥基复合材料的力学性能与微观结构

提高水泥石性能的有效方法之一是限制微裂纹扩散。本工作研究了一种新型纳米纤维材料CaSO4晶须,实验结果表明,加入CaSO4晶须能够提高水泥的抗压、抗折强度。同时对水泥的微观

期刊

硫酸钙晶须硅灰强度力学性能微观结构增韧机理calcium sulfate whiskersilica fumereinforcementmechan

综合超声诊断技术观察心内膜起搏导管的研究(附34例分析)

自1979年起,我们对在本院安置埋藏式心内膜起搏器的10例34例次冠心病人,采用彩色(CPI)、脉冲(PDE)多普勒、二维(2D)、M型超声等多项检诊法进行了长期观察随访,进行了动态及心

期刊

超声诊断技术起搏导管冠心病人埋藏式三尖瓣返流二尖瓣口观察随访检诊左室长轴心腔

基于潜在语义索引和遗传算法的文本特征提取方法

与本文相关的学术论文