基于潜在语义分析的Web文本分类

来源 :全国第五次程序设计语言发展与教学学术会议、第三届全国Web信息系统及其应用学术会议暨全国首届语义Web与本体论学术研讨会 | 被引量 : 0次 | 上传用户:llsnow_2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的基于向量空间的文本分类方法很难处理文本的高维特性,本文首先综述了潜在语义分析的理论及方法,并且解释其数学意义,提出基于潜在语义分析的Web文本分类方法,给出Web文本的特征表示,将文本数据由高维空间映射到低维空间,通过奇异值分解提取文本的潜在语义空间.在潜在语义空间中利用支持向量机方法实现文本分类.最后采用两种文本分类方法进行对比实验,实验表明基于潜在语义分析的方法比传统方法取得更好的文本分类效果.
其他文献
目的:应用动态心电图评价依帕司他对糖尿病患者心率变异性的影响,确认依帕司他治疗糖尿病心脏自主神经病变的疗效。方法:收集糖尿病合并心脏自主神经病变患者100例,分为治疗
研究了杂波环境下多传感器多目标跟踪中的数据关联问题,针对联合概率数据关联方法的计算量大等缺点,提出了多传感器多目标跟踪的极大似然关联分配算法,建立了传感器测量与目
会议
军用软件测评实验室作为独立测试方,其承担的测试任务具有特殊性,目前缺乏适用的测试过程模型指导,测试过程模型MSTLM依据相关标准提出了针对军用软件测评实验室具有较普遍适
针对我军信息集成中出现的"信息孤岛",为了解决现代军事信息集成中的语义集成问题,给出了一种基于混合本体结构的本体集成框架,并探讨了本体映射在该框架中的实现.通过该框架
本文采用双剪应力线性屈服准则,共线矢量曲面积分、变上限积分对小林史郎三维轧制速度场进行理论解析得到了轧制力、力矩的解析解.通过轧制纯铅实验,将轧制力、力矩的计算结
本文对基于Agent的工作流系统的通讯机制进行了研究。文章介绍了一种Agent通信框架,在这个框架之上能够快速构建基于Agent的工作流系统,系统开发者不必关心通讯机制的内部实现,
本文阐述了武钢通信公司专网综合营帐系统的建设特点、系统架构、系统功能,对企业专网的建设有一定参考价值.
目前时间序列的数据挖掘集中于部分周期模式的发现[4]、似然发现[5]、新模式发现[6]、基于特征分类[7]等方法,但都没有解决整个时序样本的表示方法问题.本文提出了一种时间序
目的:制备大蒜辣素前体包芯片,使其口服后在短时间内促发酶促反应,生成大蒜辣素。方法:以蒜氨酸和蒜酶双层片为片芯,控酸颗粒为外层压制得到包芯片。并以人工胃液为介质小杯
一、对我國古代血吸虫病流行情况的研究近数年來中医治療研究血吸虫病有了長足的進展,中医治療的病例数以万計,大大地提高了我們对这一疾病辨証論治的旣有水平,中西医对于我