网页文本分类中的特征选择研究

来源 :太原科技大学学报 | 被引量 : 0次 | 上传用户:FUF66877
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于超链接语言结构本身所提供的信息,网页分类问题不同于一般的文本分类。本文分析了网页内部特征,并在1000篇网页规模语料库的基础上,通过试验对比了三种特征选择方法对高维特征向量空间进行降维的效果。文章还提出了一种新方法,根据特征项所处的位置赋予不同权重的方法,实验表明这种由文本结构导出的权重计算方法能够取得很好的分类效果。
其他文献
目的:探讨影响再次肾移植临床效果的主要因素。方法:报告我院115例再次肾移植患者的临床资料,并与同期首次移植患者的人/肾存活率对比观察。结果:两组间1、3、5年受者存活率的差异
基于三维散乱数据的曲面重构是反向工程中的一项关键技术。文章针对大规模的散乱数据点,给出了一种数据压缩及生成曲面三角网格的新算法。该算法首先按照压缩比例在原始点中提
功能元作为一种能完成一项或某一方面功能的作用单元,它是功能的具体的体现组合。文章提出了一种基于功能元的工艺装备管理系统数据库方案。它是以处理为中心的系统,已采用SQL
综合探究课在高中政治教学中有着至关重要的作用,既能有效调动学生学习的热情和积极性,又能深化他们对知识的理解,培养其综合能力。我结合自身的教学实践,从"综合探究课的相关
将非线性互补问题转化为光滑方程组是求解非线性互补问题的一个重要途径,而其转化的桥梁是NCP函数。针对非线性互补问题,构造了一个新的NCP函数,根据光滑逼近原理构造了其光
天津大学“大型润滑油型减压蒸馏内件集成技术的开发与应用”项目是在获得天津市2003年科技重大成就奖的余国琮院士指导下完成的。鉴定委员会一致认为该技术达到国际先进水平
采用实验的方法对板宽对板形的影响进行了较为系统的研究,发现了板凸度随板宽变化的一些规律。该研究结论对制定与完善板带轧制规程、提高板形质量具有重要意义。
对C/S模式和B/S模式的工作特点进行了分析,并根据MIS系统中用户对信息处理的实际要求,给出了基于B/C/S模式的信息管理系统的构建方法,该方法充分利用了C/S模式和B/S模式各自
文章将人工神经网络与有限元嵌合技术用于钢管孔型参数的预测,运用BP网络建立孔型参数与钢管尺寸精度之间的非线性关系,实现了对孔型参数的优化。解决了长期以来靠经验试凑的问
通过对局部凸空间上的标准算子代数上保持算子乘积谱函数并零集合的映射的刻画,得到了复无限维Banach空间上标准算子代数上保持算子乘积谱函数并零集合的映射的具体形式。