文本分类器准确性评估方法

来源 :情报学报 | 被引量 : 0次 | 上传用户:wenproklklklkl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络与信息技术的飞速发展,信息极大丰富而知识相对匮乏的状况在加剧.文本挖掘正成为目前研究者关注的焦点.文本分类是文本挖掘的基础和核心.构建一个分类准确的文本分类器是文本分类的关键.现在有很多文本分类的算法,在不同的领域里取得了较好的效果.如何更加客观地评估分类器的性能,是目前值得研究的方向之一.结合作者的实际工作,本文列出目前常用的分类准确性测试和评估方法,简单对评估方法进行比较分析.文末提出了对准确性评估的一些改进设想.
其他文献
1前言随着计算机应用的日益普及,计算机软件的开发规模、应用数量急剧扩大,特别是对软件的质量要求愈来愈高.传统的个体化开发模式已远远不能满足对软件日益增长的需要,从而
通过探讨企业竞争力研究的理论基石,历史地构建了企业竞争力的核心要素;在对企业信息化理念的阐释中,分析了企业信息化的产出效应。随后,从人与物、人与人关系的研究视角出发,分析
近日,住友橡胶工业株式会社正式宣布,新型"低气味天然橡胶"技术研发成功。该技术通过抑制天然橡胶原材料中引发气味的非橡胶成分(例如蛋白质和脂类)的分解,大幅降低了天然橡
本文从IT投入产出测度、时滞、利润分配、信息与技术管理、股票市场和分析工具等方面,全面阐述信息技术"生产率悖论"产生原因,揭示信息技术投资方面潜在的生产率问题,为人们
本文探讨了知识组织中知识著者自身元数据的可行性,其结果显示知识著者安全可以按照Dublin Core标准创建合格的元数据。研究结果同时也显示知识著者认为元数据能有效促进组织
软件厂商要实现从“软件提供”到“软件服务”的要求.首先软件厂商应从认识上进行转型。只有具有创新的意识、创新的胆识和敢想敢干的精神.从思想认识上进行提升.才是企业向“软
乙丙橡胶是一种通用橡胶,因其具有全饱和的主链结构,所以具有良好的抗氧、耐热、抗臭氧、耐天候和耐水蒸气性能。通常情况下,在聚合生产时增加二烯单体,所得三元共聚物被称为
股利政策作为现代公司金融的三大核心内容之一,是公司筹资、投资活动的逻辑延续,是其理财行为的必然结果。1961年,美国财务学家莫顿·米勒(Miller)和经济学家弗兰克·莫迪
目的 探讨门静脉高压症合并原发性肝癌破裂出血病人合理有效的治疗手段及可能影响远期预后的因素.方法 根据治疗方法不同分为3组:急诊手术组、联合组、介入组.比较3组病人止血
“十一五”期间所取得的研究成果必须得到深化,并展开新形式下制造业信息化工业共性关键技术的研究,实施大型企业信息化,建设服务保障体系,以支撑重庆市制造业的做大做强。