一种新颖的基于马氏距离的文本分类方法的研究

来源 :长春工程学院学报(自然科学版) | 被引量 : 0次 | 上传用户:a0126051548
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
KNN(k最近邻算法)是文本挖掘领域最成熟最简单的分类方法之一。该方法对文本分类中的距离参数的选取敏感,错误的选择将导致分类精度降低,影响最终分类效果,该缺陷限制了KNN分类器在文本数据挖掘中的应用。因此,本文将马氏距离引入到文本分类领域,并将其与KNN算法相结合,提出了一种基于马氏距离的新的文本分类方法(Mahalanobis distance-KNN,MDKNN),该方法克服KNN算法对距离函数的敏感性。实验表明,与传统的KNN和Naive Bayes分类算法相比,该方法在文本分类的精度和稳定性上有所
其他文献
竹笛作为中国古典吹奏乐器的代表之一,因其独特的音色,在管乐演奏中呈现出特别的魅力。竹笛的演奏主要依靠演奏者对气息的灵活掌握和控制调和,进而实现音乐和情感的相互交融
提出了基于GNSS(Global Navigation Satellite System)北斗卫星导航系统地基增强技术建立铁路控制基准的新方法,通过误差传播及精度分析验证新方法的可行性,总结了新技术应用
本文对浙江省台州市路桥和温岭两个电子垃圾循环区域母乳中多氯联苯(PCBs)污染现状进行了研究.路桥本地人群(n=16)、温岭本地人群(n=27)及在台州居住不足5年的外地人群(n=9)母乳中PCB
<正>发酵法生产甘油新技术的研究在我校已持续研究了26年,但真正工业化的实现只是近三年。这几年来我校洽谈转让业务的已有数百个单位,目前在建的已超过10个单位,1993年有三
当今世界,计算机技术发展势头迅猛强劲,因而如何更好地保护软件是世界知识产权保护的一个重要内容,各国法律界以及政府部门对此相当关注。阐述了美、日等发达的国家在软件保护方
东西方文化差异制约着人们对英汉词语的理解与翻译。与此同时,英汉词语的理解与翻译蕴含着丰富的文化内涵。文化差异总是与一个民族的文化背景、风俗民情以及社会生活的变化
目的:建立高效液相色谱法同时测定泼尼松、倍他米松、醋酸地基米松的方法,对所谓的“中药秘方”中加入的该类成分进行快速鉴定。方法:采用ODS C18柱(4.6mm&#215;150mm,50μm),流动相
2011年4月17日,北京,人民大会堂。这座位于共和国“心脏”的神圣殿堂,再次见证了这一历史性的时刻:“纪念新中国航空工业创建六十周年大会”在这里隆重举行。
采用单因素和正交实验法,用粉末活性炭对含蛋黄降压肽的酶解液进行脱色处理。考察了活性炭用量、pH、脱色温度和吸附时间等因素对脱色率、肽损失率和溶液活性损失率的影响。蛄
新型植物激素拉脱维亚科学院微生物研究所的科学家利用植物的叶子、茎秆和花朵上的某些微生物研制成了一种植物生长激素,能使胡萝卜、黄瓜、番茄和甜菜作物的产量增加15~20%。只要把