Boosting组合学习方法及其在文本挖掘中的应用研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:stwl1976
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前Boosting方法己在数据挖掘的多个领域特别是在文本挖掘中得到了成功的应用.该文致力于解决在Boosting的理论和实际应用方面出现的一些问题,以提高其分类精度和学习速度,增强其实用性.该文的主要研究工作包括:(1)对Boosting中的权值调整进行了研究.(2)提出了基于代价的Boosting模型,并对这种情况下Boosting的权值调整、参数选择和评估代价对Boosting影响的代价函数等各个方面的问题进行了深入研究,并证明了这个模型的收敛特性.(3)对Boosting与一些典型的机器学习方法的结合解决文本分类问题进行了研究;(4)提出了一种基于Boosting机制,针对当前文本数据集动态计算相似度阈值的方法.
其他文献
该文研究和探讨了生产管理系统开发的技术环节及实现过程,并深入讨论了分布式多层结构在企业生产领域的实现.首先,阐述了分布式多层应用系统的编程思想及关键技术.介绍了分布
1)该文提出了一种适合城市交通网络分析的数据模型,将传统的基于弧段-节点的数据模型用基于完整交通特征的关联数据模型代替,设计出基于特征的交通网络关联数据模型的概念建
学位
在光照不均匀,存在阴影以及存在背景小杂色块干扰的图像中准确辨识出叶片图像,并将其显著特征抽取出来是本次课题的研究重点。本课题在对实际叶片图像信息抽取这个领域,提出
该文的主要内容是讨论细胞自动机的自演化方法及其内部运行机制,特别是遗传算法在细胞自动机自演化中的应用.首先我们介绍了细胞自动机的起源,发展,现状,还介绍了其主要特点
目前国内有一些相关领域的预测软件,如彩票预测软件等.这些软件只是实现该领域内的指标预测功能,预测的智能性较低,而且不具有通用性,不能进行跨越领域的指标预测.另外随着In
该文基于并行CORBA的原理,提出了油气储层随机建模的网络并行计算模型;改造了原有的串行计算代码;封装成并行CORBA对象,使之符合SPMD并行执行模型,解决了串行代码并行化的问
MPLS是一种新的网络技术,它将IP路由技术和ATM交换技术紧密结合,既实现了路由的智能,又利用了ATM交换机的高效硬件交换.该文首先介绍了MPLS的背景知识、技术原理、技术优势以
随着Internet上中文信息的增加,智能化搜索引擎已成为中文检索技术未来的发展目标与趋势.概念检索作为一种实现技术有着广泛的应用前景.该文回顾了搜索引擎的历史、国内外现
计算机领域技术更新速度非常快,但计算机的基本体系结构相对来说几乎不变。可重构计算技术(Reconfigurable Computing—RC)为传统通用处理器和专用处理器(ASIC)提供了一个非常