基于SVM技术的文本分类研究

来源 :软件导刊 | 被引量 : 0次 | 上传用户:johnathan126
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
SVM(Support Vector Machine,支持向量机)是由Vapnik等人提出的一种新的机器学习方法。以结构误差理论、条件二次优化理论与核空间理论作为理论基础,能够较地的解决机器学习的问题,如模型选择、过学习、非线性问题和灾难维数等,很适合应用在文本分类领域。针对文本分类技术的新问题,研究了已有的主动学习方法并对其进行改进,提出了一种新的主动学习算法,很好地解决了小规模标注样本集的分类问题。该方法尤其在难以获得大量类标签或者标注样本耗费较大的领域,更能显示出它的优越性,适合日新月异的互联网的应
其他文献
本文阐述了飞天山国家地质公园旅游资源的特色、开发建设和保护问题,提出了创建飞天山国家地质公园生态旅游品牌的思考和建议。
<正>前言近年来,国家致力于节能减排和清洁生产工作,环保力度不断加强,铁合金行业综合治理是铁合金生产的当务之急。本文就锰硅合金生产浇铸过程中所产生的无组织烟气收集和
会议
行星齿轮由于其具有传动效率高、结构紧凑等诸多优点,广泛应用于大型装备上面。行星轮系在工作时由于诸多原因会导致载荷分配不均现象,如果该现象持续发生,容易造成行星轮系
介绍了在Visualbasic6.0环境下,如何对某一给定的数据集合采取一些算法思想,结合TreeView控件来实现现在软件设计上比较通用的多级树型目录,此方法在数据库设计、分类信息资
以4类典型气候条件(极干旱、半干旱、半湿润、湿润)的特高压直流输电线路绝缘子为研究对象,开展了绝缘子自然积污试验,获得了不同环境条件下特高压直流绝缘子的积污特性,揭示
通过介绍Winsock网络编程的基本原理,分析了数据包捕获技术。使用原始套接字技术实现了一个数据包捕获程序,并对捕获到的数据包进行拆解、分析、显示。最终,实现了一个有着较
<正> 第五讲 注射模流动模拟(一) 自从塑料注射模具问世以来,人们就盼望着能在模具制造之前预测熔体在型腔内的流动情况,以便尽早发现问题,修改设计图纸而不是返修模具。因此,
目的了解医院感染阴沟肠杆菌的耐药性及其耐药基因,为防控感染提供依据。方法对40株临床分离的阴沟肠杆菌,以纸片扩散法和琼脂稀释法进行药敏试验,聚合酶链反应(PCR)及序列分析法
分析了信息技术教育教学的重要性,探讨了信息技术与小学数学教学整合的方法与途径。
目的了解嗜麦芽窄食单胞菌Ⅰ类整合子的存在情况以及耐药谱型。方法2006年7月-2007年12月自临床标本分离60株嗜麦芽窄食单胞菌,采用聚合酶链反应法检测分析其基因int Ⅰ、qacE