一种新的用于文本分类的概率分类器设计

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:maomao11111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了进一步提高文本分类的准确率,文中介绍了一种新的用于文本分类的概率分类器。该分类器首先通过自然语言处理技术对文本进行预处理,然后从训练集中读取文本信息从而产生正、负规则,并计算正负权重系数,最后计算正、负概率。文中给出了计算正负权重系数的算法,并根据计算出来的权重系数及正、负概率值对文本进行分类。将文中提出的概率分类器与SVM分类器进行对比实验,实验结果表明,文中设计的概率分类器对于文本分类效果较好。
其他文献
本文主要对我国高等教育人才培养模式现状进行分析,针对存在的问题,探索创新人才培养方式的改进。高等教育教学改革应在学生的创新思维、动手能力上下工夫,从而为培养具有创新能
通过探讨高校仪器设备管理的机制、队伍、制度建设及使用和维护等问题,提出了新时期高校仪器设备管理的对策和措施。
新闻摄影记者在全媒体时代的价值如何体现,今后该如何发展是媒体行业人士关注的重点。作为一名新闻摄影记者,在见证了纸质媒体时代的辉煌之后,也迎来了新媒体时代下的困惑与
随着电影技术的不断发展,为了满足观众越来越多的多元化需求,电影的创作已经不仅仅是通过宏大新颖的叙事来吸引广大观众,而是借用新型技术来创造更为真实更为立体的视觉奇观,
目的通过对比3种不同支气管肺泡灌洗液结核杆菌检测方法在涂阴肺结核诊断中的结果,分析其临床应用价值。方法 200例涂阴肺结核患者作为涂阴肺结核组,再选取同期45例非肺结核
高等院校专业设置趋同现象的原因之一是某些专业的办学成本较低,从政策导向上看,主要表现在教学辅助人员的支出、维修费用支出与折旧费支出等方面;从客观实际情况看,主要表现在水
为了更加准确方便地测量GSM-R无线通信基站天线的倾斜角度,文中研究了一种新型的GSM-R无线通信基站天线倾角测量系统。该系统通过使用芬兰VTI公司SCA100T-D01传感器进行倾斜
随着时代进步与经济发展,我国媒体事业快速发展,这使各个媒体所面临的市场竞争越来越激烈。在这样的情况下,我国报社应该采取合理的措施,有效提升自身的整体竞争实力,在我国
网络编码被应用于多播、广播和单播中。而把网络编码应用于无线传感网汇播的研究还处于理论和仿真阶段。把网络编码应用于实际环境中,需要考虑节点同步、开销控制、线性独立的
利用我国31个省(自治区、直辖市)1996~2003年的混合截面数据,对我国教育扩展过程中的教育分配问题进行实证研究。研究结果表明,我国教育扩展与教育分配不平等之间存在显著的倒U型