基于LSI/SVD的文本分类方法研究

来源 :微计算机信息 | 被引量 : 0次 | 上传用户:lnawxu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
论文通过分析传统向量空间模型(VSM)的信息检索模式和讨论基于特征项-文本矩阵的特征项赋权因子(TF-IDE)的赋值问题,提出以潜在语义索引/奇异值分解(LSI/SVD)方法为基础,采用文本相似度描述特征项语义间的联系,运用截断法来降低特征项-文本矩阵原始向量空间维数,解决特征项之间存在语义缺乏约束及向量空间维数过大的问题。仿真实验表明,该方法相对于传统向量空间模型更加高效实用。
其他文献
圆弧插补算法是数控系统中的一个关键技术,本文介绍了一种实用的圆弧插补功能模块的设计方法,此模块包含两部份:G02/G03功能模块的设计方法和G02/G03中断插补模块设计方法,在
碰撞检测是虚拟现实中的一项重要技术,而空间两物体之间的距离计算是碰撞检测问题研究的一个主要方面。本文对非均匀有理B样条(NURBS)曲面间的曲面分裂算法进行了改进,首先插入
文章在简单介绍危大工程施工相关情况的基础上,对危大工程施工现场管理工作、安全管理的问题作了分析,并对如何增强危大工程施工现场管理工作提出了建议,供参考和借鉴。
<正> 冻伤是指气温0℃以下的低温引起的组织急性冻结和皮肤损害。冻伤常被认为是偶然发生的小伤小病,但实际上,每年都有人因冻伤而造成残废或死亡。凡是处于严寒、强风、潮湿
动态网页是基于服务器动态查询数据库生成的,用户频繁重复的访问给服务器带来了巨大压力,导致系统效率低下。因此提出了网页静态化技术,然而仅通过管理员生成静态页面,不仅页面管
阐述了有限体积法的基本思想,在此基础上,从钢水的凝固过程为多元系相变出发,建立了连铸板坯凝固传热的二冷动态控制模型,以此求得铸坯表面的温度分布。本文分析了拉速和过热度等
商业税收是国家财政的重要组成部分,而如何获取税控数据源又是商业税收的核心问题。本文以GB18240.1-GB18240.6的内容为基础.给出一种在windows系统平台下,利用挂钩技术从商用收款
本文介绍了一种基于单片机系统的二值图像实时采集处理方案。该方案采用了飞思卡尔公司的型号为MC9s12DG128单片机,利用该单片机中的比较捕获模块对二值图像进行采集,同时使用了一种安位存储的方法对二值图像进行存储,降低了图像的存储空间和图像处理的数据量。为图像伺服系统提供了一种低成本可靠性强的图像采集及处理方法。
北京城市学院计算机实验教学中心下设“信息安全实验室”等15个实验室,使用面积1905平方米,拥有计算机和各种专业设备1566台,资产总额1278万元。中心为全校106年专业中的92个专
随着我国经济的不断发展,城镇人口数量的增加,农村城市化建设的普及,相关部门对城市基础设施建设给予了高度重视。为了从根本上提升城市基础设施的建设、使用效果,必须提高相