文本分类中特征权重算法改进研究

来源 :计算机与现代化 | 被引量 : 0次 | 上传用户:yj700702
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了克服传统的TF-IDF(Term Frequency Inverse Document Frequency)算法分类F1值低的缺陷,利用特征词在类内和类间的分布信息,提出一种改进的TF-IDF-dist算法。实验结果表明,改进的算法在不同特征维度下F1值平均提升3.2%,结合不同特征选择算法,F1值平均提升2.75%,并且对倾斜数据集有更强的适应性,表明本文算法在文本分类中的有效性。
其他文献
学术论文摘要的编写,究竟应该以第一人称的语气编写,还是应以第三人称的口吻表达?虽然,国家的有关标准做出了相关规定,但纵观各学术期刊,至今没有一个统一的模式,甚至同一本期刊中,
超声靶向微泡破坏技术通过空化效应有效促进外源基因在目的组织中的转染,可通过抑制细胞某些基因的表达或抑制其信号通路而进行基因治疗,使基因治疗各类肝脏疾病逐渐成为可能
期刊
组织遇到危机事件是不可避免的,关键是危机事件发生以后怎么处理。文章试图从公共关系危机的特点和公共关系危机处理程序两个方面来阐述危机事件的处理过程。当危机发生后,企
忏悔意识是中国现代文学的一个重要特征,以鲁迅为代表的五四文人在面对万恶的封建文化和黑暗的社会现实时,对其坚决抨击,不惜自我解剖,流露出浓厚的忏悔意识。鲁迅站在历史高
目的探讨难治性心力衰竭的临床药物治疗方法效果。方法对2014年1月至2015年8月收治的难治性心力衰竭患者24例临床治疗方法资料进行分析。结果对24例患者经治疗显效17例,有效6
证人证言公证虽为一种基本的公证类型,长期以来却因收费低,办理程序复杂,被相关机构采信、认可的要求和标准高等诸多原因,一直处于被忽视的边缘状态。近年来,伴随着市场经济
目的:探讨躁狂症患者康复治疗中系统健康教育的应用价值。方法:94例躁狂症患者按照住院先后顺序随机分为研究组(系统健康教育)与对照组(常规健康教育),对比两组干预效果。结果:干预
介绍了利用Origin软件对光敏电阻特性实验数据的处理过程,并通过作图和对实验图像拟合阐述了该软件的使用方法,实践表明把其作为常用数据处理方法引入大学物理实验有利于实验
视觉掩蔽是指由于掩蔽物在时间或空间上与目标物临近,以致对目标物可见性降低的现象。在复杂的视觉环境中,为使观察者能够更迅速准确地探测、识别目标信号,可以在掩蔽物和目