基于KNN与自动检索的迭代近邻法在自动分类中的应用

来源 :情报学报 | 被引量 : 0次 | 上传用户:xuehua812
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究了一种基于KNN与自动检索的自动分类算法--迭代近邻法(Iterative KNN,I-KNN),用以解决KNN算法在小样本库的环境下分类效果不佳的问题.在无法得到足够的定类样本时,通过检索的方法将待分样本的局部主题特征放大,进而得到足够定类的相似样本.实验证明,迭代近邻法既增加了获取相似样本的几率,同时也有效地控制了样本相似度条件限制放宽后可能引入的分类噪声,在实际应用中能较好地提升自动分类系统的查全率和查准率.
其他文献
自动文本分类是提高信息利用效率和质量的有效方法。训练文本分布的不均匀会对分类的效果产生负面影响,而在实际中,很难使训练文本的分布达到均匀。针对这一问题,提出了一种改进
网络评论的观点分析为及时掌握广大民众的真实观点提供了渠道。观点主题识别作为观点分析的重要组成部分,用以确定观点所指的对象。本文设计了一种领域无关的观点主题识别算
本文对1999年至2003年中国管理类18种重要期刊中的604篇信息系统(IS)领域文章进行了实证研究,目的在于分析国内IS研究的多样性.本文从研究题目、参考学科、研究方法、分析层
从国家税务总局金税三期平台的全面上线,到国家税务总局深圳市税务局与腾讯公司签约共建"智税"创新实验室,再到中国银联与大贲科技的全面业务合作,税务机关、企业、IT供应商正
1 资料与方法    1.1 研究对象 本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文
基于标注语料库的有指导学习方法是词义消歧取得性能最好的方法,优于无指导学习方法和基于词典的方法。它的准确率极大地依赖于标注语料库的规模,而目前人工标注语料库数量极少
武汉地产集团起始于1978年,成立至今,总资产1600亿元。42年来,武汉地产集团秉承"缔造城市价值、建设美好生活"使命,由地产开发商转型为现代城市综合运营商。深耕武汉,武汉地
习近平总书记在湖北武汉视察新冠肺炎疫情防控工作时指出,社区也是疫情防控的一个重要阵地,并强调所有社区要成为疫情防控的坚强堡垒。这为中国物业管理制度优化明确了新方向
仔猪的断奶日龄有3-8周龄或60日龄,平均断奶日龄约4-8周龄。调查表明大于50%猪的断奶日龄控制在28日龄甚至更早,大多数在3~4周龄断奶。早期断奶要求在管理、房舍、健康和营养上加