SVMDT分类器及其在文本分类中的应用研究

来源 :计算机应用研究 | 被引量 : 31次 | 上传用户:juejiang12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于SVM(Support Vectort Machine)理论的分类器已经发展为一种通用的二值分类器,但它不适用于多值的场合。在分析经典的SVM分类算法和决策树分类算法的基础上,提出了将SVM和二叉决策树结合的方法来实现多值分类器(SVMDT),并将其应用于文本分类,实验表明在分类精度和速度上具有良好的性能。
其他文献
快速准确有效的数据处理方法是日益增长的地学数据为成矿预测工作提出的迫切要求。提出了一种基于GIS的地球化学数据处理新方法,克服了传统统计分析方法对样本数据要求服从正态或对数正态分布,处理结果受少数特高品位数据影响的缺点。通过凤凰山铜矿地球化学数据处理的对比分析,认为该方法具有较好的抗干扰和致矿异常分辨能力。
当今网络存储越来越受到人们的关注,作为目前主要的网络存储技术的NAS(NetworkAttachedStorage,附网存储)和SAN(StorageAreaNetwork,存储区域网),介绍它们的文章很多,并且主要在应用方面对它们进行了比较。着重从研究的角度阐述了它们的本质特征,进而说明了为什么NAS与SAN的融合会成为存储发展的必然趋势。介绍了“对称”和“非对称”这两种主要的融合结构,并在最后
AOMG作为一种针对网格体系结构的面向Agent的系统建模方法,在网格环境中建立可视化的系统抽象模型,采用XML对建立模型进行描述。提出了在AOMG中建立本体并且对建立的本体进行形式化描述。
网络化制造首要的问题是解决分布式环境下企业资源的共享和集成。在对区域性网络化制造及其服务平台进行研究的基础上,重点探讨了Web服务技术在其中的应用。
回顾了群签名理论研究的发展过程,列举了群签名发展史上一些最主流的算法,并对它们的性质、优缺点作了较为深刻的比较研究。最后提出:设计好的方案固然重要,但当设计十全十美的方案比较困难时,不能因此而放弃其实际的应用,可针对具体的应用环境对某些指标的特定要求采取适合该环境的方案。
近年来在Linux操作系统中出现了入侵Linux内核VFS(虚拟文件系统)驱动程序的后门技术。使用该技术的后门软件能逃脱所有现有的后门检测技术,给Linux系统的安全带来了极大危害。通过分析该后门技术和Linux内核,设计实现了对该类后门软件的检测技术,其效果好于现有的后门检测软件。
在大规模高维数据挖掘研究中,数据存储与索引方法的有效性是决定算法时空效率的重要因素。将数据空间网格划分策略与高效率的树型索引结构结合起来,可以充分发挥两者在数据组织上的综合优势,将复杂问题转换为结构化的简单重复问题。在统一的框架下给出了各种数据空间网格划分的定义,讨论了两种适用于实现网格化数据索引的R-树和PK-树索引结构。试验结果表明,PK-树在数据存储和索引上具有更高的效率,与网格化数据组织方
如何构建特大图像缩略图自动提取系统是实现基于内容的图像检索和通过缩略图快速预览的关键问题之一。主要从实现原理、算法流程、内插法与平滑法的算法实现三方面讨论了这一问题,介绍了一个基于上述方案的实例系统并检验了算法的性能。
当前,基于身份的数字签名体制研究取得丰硕的成果,利用双线性映射的GDH(Gap D iffie-Hellman)问题,人们提出了许多可证安全的基于身份密码体制。提供了一种直接利用现有的基于身份的数字签名体制,构造基于身份代理签名体制的途径,并利用可证安全理论,在标准计算模型下给出了严格的安全性证明。
随着语义Web技术的不断发展,基于XML的数据文档管理成为语义Web技术发展的难题,特别是RDF,DAML,OIL,OWL等本体语言的提出,基于XML的本体文档日趋复杂,传统的在关系数据库中依靠映射关系管理本体文档越来越困难。提出使用XML数据库Xindice来存储查询本体文档并设计了存储查询方法。