【摘 要】
:
面对大量样本特征时很多分类器无法取得较好的分类效果,样本数有限导致贝叶斯算法无法获得精确的联合概率分布估计,在样本局部构建高质量分类器需要有效的样本相似性度量指标
论文部分内容阅读
面对大量样本特征时很多分类器无法取得较好的分类效果,样本数有限导致贝叶斯算法无法获得精确的联合概率分布估计,在样本局部构建高质量分类器需要有效的样本相似性度量指标.针对以上问题,提出了一种基于余弦相似度进行实例加权改进的朴素贝叶斯分类算法.算法考虑特征对分类的决策权重不同,使用余弦相似度度量样本的相似性,选出最优训练样本子集,用相似度值作为训练样本的权值来训练修正后的贝叶斯模型进行分类.基于UCI数据集的对比实验结果表明,提出的改进算法易于实现且具有更高的平均分类准确率.
其他文献
目的探讨B族溶血性链球菌(GBS)带菌者早期干预与母婴感染的相关性。方法按照整体抽样的方法,随机选择孕20~30周的孕妇526例为研究对象,取其阴道分泌物进行细菌培养,将74例GBS阳
【目的】研究慈竹竹秆不同部位的解剖特征,为慈竹的合理利用提供理论依据。【方法】采用数显投影仪、奥林巴斯显微镜和木材图像分析软件,对生长于四川洪雅3年生慈竹不同竹秆
针对我国工业园区发展现状,围绕生态园区建设需求,为有效解决工业园区发展与资源环境约束之间的矛盾,提出园区生态化改造的有效对策,主要包括生态补链、提标改造、一体化管理
随着城市化进程的不断加快,我国市政工程数量逐渐增多,为人们的生活和出行提供了便利。因此,对市政建设道桥施工的关键技术进行分析,并对影响工程建设质量的因素进行有效管控
“我仍然对这些论文中得出的科学结论的有效性、牢靠性以及研究的可重复性,充满信心。”$$日前,面对曾供职于斯坦福大学医学院微生物学和免疫学系伊丽莎白·比克学者提出的多
本文给出了曲纹面圆柱蜗杆传动诱导法曲率的计算公式,分析了诱导法曲率与各几何参数之间的关系,从而为这种蜗杆传动的理论分析、设计制造提供了一定的理论依据。
In this pa
给排水管网作为城市建设的重点内容,在实际施工中应综合考虑管网建设对既有管网的影响,同时也应考虑到管网建设的可靠性与安全性,能够为人们生活提供可靠的水源供应,并且及时
以两种不同性能磨床的砂轮架为例,对不同要求的机床主轴箱在设计、制造、装配等方面进行了详细比较研究与分析,揭示了机床主轴箱中各零件之间的相互内在联系,指出了砂轮架设
本文以2006~2015年丝绸之路经济带中道10省(市)区物流业与区域经济发展的相关数据为依据,构建耦合评价模型和空间自相关模型,分析丝绸之路经济带中道10省(市)区物流业与区域经济
当前,中职学生的外语学习动机问题严重。本文以中职学校护理专业的学生为例,从中职学校的实际情况出发,从学校教学和学生自身等方面,分析学习动机的影响因素,并做出相应的对策,有效