基于类别选择的改进KNN文本分类

来源 :计算机科学 | 被引量 : 0次 | 上传用户:webtvwei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征高维性以及算法的泛化能力影响了KNN分类器的分类性能。提出了一种降维条件下基于类别的KNN改进模型,解决了k-近邻选择时大类别、高密度样本占优问题。首先使用一种改进的优势率方法进行特征选择,随后使用类别向量对文本类别进行初步判定,最后在压缩后的样本集上使用KNN分类器进行分类。试验结果表明,提出的改进分类模型提高了分类效率。
其他文献
动脉粥样硬化(atherosclerosis,AS)是动脉硬化中常见最主要的一种类型,因AS是全身性的疾病,故多数患者当冠状动脉存在严重的狭窄病变时,外周动脉也同时存在严重的狭窄病变。踝
农村订单定向医学生是特殊教学对象,心电图见习教学对这些学生尤为重要。针对此类学生的心电图见习教学应充分做好课前准备,充分认识教学对象;运用合适教学方法,如启发式教学法、
目的:探讨不同磁场对大鼠心组织中超氧化物歧化酶(SOD)活力、丙二醛(MDA)含量的影响。方法:用邻苯三酚法测定SOD活力;TBA法测定MDA。结果:在30 mT磁场中曝磁30 min后,大鼠心组织中SO
目的:了解卫校护生临床实习中的职业风险,规范护生的护理行为,提高护理质量,防范职业危害的风险,减少护患纠纷。方法:采用开放式问卷对我校484名专科护生进行调查。结果:对护生
目的:探讨川崎病(KD)的护理方法。方法:对收治的52例KD患儿进行回顾性分析,对治疗过程中出现的状况采取有效的护理措施。结果:52例患儿全部治愈,随访无并发症。结论:对川崎病患儿采取
对包头医学院图书馆现刊阅览室大学生读者的阅读倾向作了调查,并结合本院图书馆的实际情况进行分析,结果表明期刊读者的阅读倾向集中于休闲娱乐、社会热点和提高个人素养及技能
目的:分析816例某电厂职工的血脂情况,了解和掌握职工的身体健康状况,为预防职工心脑血管方面疾病提供依据。方法:对体检的816例电厂职工进行血脂检测,按性别、年龄分析其变化
目的:探讨彩色多普勒超声在乳腺结节病变中的价值。方法:对71例乳腺结节病变进行彩色多普勒超声检查,分析其二维声像图及彩色多普勒(CDFI)的特征。结果:利用二维超声成像可直观无
人体寄生虫学又称医学寄生虫学,是研究与人体健康有关的寄生虫的形态结构、生存繁殖规律、致病、诊断、流行与防治的一门病原生物学科。人体寄生虫学以形态学教学内容为主,实验
提出了一个基于有色Petri网的自动Web服务合成模型,为Web服务的合成提供语义支持,提高合成服务的可靠性和可维护性。该模型将服务的合成结构分成顺序、并发、选择、循环、置换5