基于支持向量机和输出编码的文本分类器研究

来源 :计算机应用 | 被引量 : 6次 | 上传用户:wuchuanmiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
介绍了一种支持向量机与输出编码相结合的文本分类器算法 ,采用一对多、一对一和纠错编码三种编码方式以及相似度计算的海明码距、边界损失方法进行文本分类和测试 ,表明一对多编码与边界损失相似度计算相结合的分类器系统具有最高的查全率和查准率。
其他文献
文中用一种新的形式化描述语言RSL来描述网络协议,采用通信顺序进程CSP为模型。该模型基于进程代数,能用严密的代数演算方法验证协议性质。文中对CSP模型和RSL语言作了时间的扩充,并且给出了从CSP模型到RSL语言的转换步骤及规则。最后给出了一个TFTP的实例来说明RSL语言在协议描述上的适用性。
通过对苏州市2000-2003年1万余成年人的体质监测结果进行分析,认为其中存在的变异,可能是由于抽样样本的扩大造成的.
阐述了传统的IPsec体系结构性能上的不足之处,提出了一种基于CompactPCI的多机多卡(加密卡)的IPSec并行体系结构。在分析了CompactPCI的并行体系结构、多卡并行加密算法和多机并行负载均衡算法的基础上,给出了IPSec并行体系结构在CompactPCI上的一个实现方案。最后讨论并分析了使用IPSec并行体系结构传输数据时的性能。
支持向量机是近几年发展起来的机器学习方法,它是利用接近边界的少数向量来构造一个最优分类面。然而当两类中的样本数量差别悬殊时,支持向量机的分类能力会下降。为了解决此问题,文中提出了一种改进的支持向量机算法———DFP SVM算法。实验表明,此方法在解决两类样本数量十分不均衡问题时有着很强的分类能力。
发展完善了基于层次的显著区域检测模型。把原始图像分层,对每层分别提取底层特征,计算显著性特征,包括亮度显著性、饱和度显著性和色彩显著性。考虑到图像的概率特性,通过引入二维正态分布函数,准确合理地表示图像像素间的相关性。把各层计算所得的结果叠加,通过引入动态阈值,得到最后的显著区域。动态阈值方法不受原始图像的影响,有较好的适应性。将此方法应用于真实图像,得到了令人满意的检测结果。
文中针对小波变换在进行高分辨率图像和多光谱图像融合时 ,不能同时保持空间信息及光谱信息的问题 ,提出了一种优化的小波变换图像融合算法。它将高空间分辨率图像和多光谱图像经小波变换后的低频、高频分量先分别进行增强 ,然后再进行融合 ,优化了传统的基于小波变换融合方法。并且通过对同一场景的SAR图像和TM图像的融合实验 ,证明了该算法在有效地保留原图像光谱信息的同时 ,也很好地保持了空间细节
深入分析了公路桥梁施工过程中钻孔灌注桩技术的应用,对技术常见的问题进行了分析,并提出了相应的对应措施,希望提高该项技术的施工水平,为我国公路桥梁工程提供更加牢固的质
文中根据隐含语义分析理论(LSA)和Kohonen网络理论提出一种文本分类新方法。应用Kohonen网络进行文本分类存在训练速度慢的缺点,因此在网络训练阶段引入了有监督机制,提高了网络的分类速度和精度;但是对于高维的文本特征向量来说,分类速度很低,甚至应用Kohonen网络进行分类,不能取得理想结果;新方法应用LSA理论来建立文本集的向量空间模型,在词条的权重中引入了语义关系,消减了原词条矩阵中包
在对著名的Boyer -Moore串匹配算法进行分析后 ,对BM算法中的尝试位置移动处理部分进行改进 ,提出了IBM算法。该算法将好后缀移动与坏字符移动合并进行处理 ,从而尽量利用已有信息进行更大的尝试位置移动 ,使算法具有更高的效率。对IBM算法进行复杂度分析 ,对BM算法、KMP算法和IBM算法进行实际性能比较 ,结果表明IBM算法的平均运行时间明显优于BM算法与KMP算法。
科学发展观的核心是以人为本,高校实行后勤社会化改革后,在运行机制方面实行企业化管理模式,组建了后勤服务总公司.在此形式下,高校后勤只有跳出"以物为本"的管理模式,坚持