基于TF—IDF优化算法在文本分类中的应用研究

来源 :电脑编程技巧与维护 | 被引量 : 0次 | 上传用户:iflytekmilk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
TF—IDF算法是文本挖掘领域的经典算法,TF—IDF算法在文本分类时会使关键词权值发生波动,对该算法在分类时权值做全局化定义,可提高文本分类准确率。
其他文献
癌痛严重影响中晚期癌症患者生活质量,通过使用第三阶梯强阿片类止痛药物,绝大部分患者疼痛能得到很好的控制。微观上,癌痛治疗的疗效与患者及医务人员的认识程度密切相关,也
利用SPSS的可编程特性,介绍了在.NET环境实现SPSS二次开发的技术与方法.
培养学生的英语综合应用能力,特别是听说能力引起了广泛的关注和重视,成为当前大学英语教学研究的一个热点。高职高专学生英语听说学习困难,听说能力亟待提高,因此高职英语教师开
财政──货币政策协调论于天义,宫本风,刘福国财政一货币政策协调论,是指通过财政政策和货币政策对宏观经济实施不同力度和不同范围的调控,来保证经济稳定增长.本文的研究,旨在为我
笔者曾多次参加中学教师关于新课程理念的履职晋级培训授课,相应地参考了许多相关书籍,对新课程理念的科学性笔者投百分之百的赞成票,但通过对中学教师培训的效果及对我国基
目的:全面系统地测量前交叉韧带损伤和半月板损伤病人的膝关节等速运动,并与其健侧肢体或术前状态作比较,客观准确地评价手术治疗及术后康复的疗效。方法:用CYBEX-Ⅱ型等速测
本文主要研究手写体识别的一般方法,并将其具体运用到工程图纸俄文手写字符数字的识别,主要工作包括: (一)通过对各种整形算法进行分析,同时考虑到实际应用中经常出现的字符图
本文通过对钢筋混凝土钻孔灌注桩在施工过程中因地质、施工工艺等多种原因常出现一些缺陷的机理进行了研究分析,并提出相应的处治对策。
根据PE文件冗余空间多的特点,实现了直接在PE文件节冗余空间中嵌入信息的方案。实验表明,可以按照隐藏信息的大小随意选择某一个能够容纳隐藏信息的节来嵌入信息,在PE文件冗
在详细分析PowerBuilder和SQL Server运行特点的基础上,总结了PowerBuilder中利用Winsock实现网络通信的几种方法,并利用其实现了局域网中客户端服务器的数据传输计算功能.同