基于潜在语义分析的Web文本分类研究

来源 :华北电力大学(保定) 华北电力大学 | 被引量 : 0次 | 上传用户:b188413920
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出潜在语义分析的Web文本分类方法,该方法认为在词汇之间,词汇与文本之间存在着某种上下文的关系,多篇文本与多个词汇可以由各自的关系构成一定的语义结构。对这个语义结构进行计算、处理,保留文本与词汇间最主要的关系,去除其它庞大、冗余、次要的影响因素。优化后的语义结构,不但比原始的文本词汇相关结构小巧得多,而且保留了其中最为主要的相关关系,从而可以挖掘出文本与词汇的潜在语义关系,较传统的基于词空间的文本分类方法能更加有效的处理文本的高维特性。从而能在该语义结构的基础上,计算出文本和文本之间的潜在相似度,提高Web文本分类的精度。
其他文献
合成孔径雷达是二战以后发展起来的一种高分辨雷达,在军事和民用方面都具有重要的应用价值。本文介绍了从合成孔径雷达技术出现以来国内外的发展情况,展望了合成孔径雷达在今
信息隐藏技术是信息安全领域一个新兴的研究方向,它将秘密信息隐藏到可公开的载体信息中,是数据保密、版权保护、秘密通信的强有力的手段,涉及到通信与信息理论、密码学、图
随着互联网的发展,越来越多的公司加入到互联网之中。网络技术的广泛应用,给人们的通信交流带来了很大的方便,但是与此同时也导致了新的网络安全问题:个人隐私、企业的商业机密可
随着网络通信技术和数字传输技术的飞速发展,各种基于IP技术的应用得到了日益广泛的发展。Internet上的各种应用正逐步向着宽带和实时的趋势发展,VoIP(Voice over IP)业务作为典
随着Internet和Intranet的日益发展,越来越多的公司和企业基于公网建立了自己的企业业务平台。办公自动化系统是实现机关内部各级部门之间以及机关内外部之间办公信息的收集
我国煤炭行业在能源产业中占有绝对的优势,保证煤矿安全生产是重要的研究课题。现有的煤矿井下人员、设备的定位系统的定位效果不理想,无法为煤矿安全生产提供可靠保障;在重大事
利用主动声呐对目标进行探测是一种重要的水下目标探测方法,但是在浅海中,水声环境非常复杂,由于噪声,特别是混响的严重影响,使得目标的探测和识别变得非常困难。本文以检测和识别
认知无线电作为一种充分利用宝贵频谱资源的新兴技术,具有广阔的发展前景。认知无线电是建立在软件无线电的基础之上,被定义为一种智能的无线通信系统,它能够感知周围无线环
访问控制技术作为实现信息安全的一种机制,其安全性和实用性已得到广泛认可,是解决信息系统应用层安全的主要技术,越来越受到重视,访问控制技术研究已经成为信息安全领域内的
生物特征识别技术是通过计算机利用人体所固有的生物特征或行为特征进行身份鉴定。与传统的身份认证技术相比,生物特征识别技术具有普遍性,唯一性,持久性以及可采集性等特殊性,成