一种新的用于文本分类的概率分类器设计

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户：maomao11111

【摘要】

：

为了进一步提高文本分类的准确率，文中介绍了一种新的用于文本分类的概率分类器。该分类器首先通过自然语言处理技术对文本进行预处理，然后从训练集中读取文本信息从而产生正、

【作者】

：

苏小英胡彦鹏杨竣辉李明

【机构】

：

上海中医药大学图书信息中心,上海大学计算机工程与科学学院,上海金融期货信息技术有限公司

【出处】

：

计算机技术与发展

【发表日期】

：

2014年3期

【关键词】

：

文本分类文本挖掘概率分类器 text categorization text mining probability classifier

【基金项目】

：

国家自然科学基金资助项目（61273328）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

为了进一步提高文本分类的准确率，文中介绍了一种新的用于文本分类的概率分类器。该分类器首先通过自然语言处理技术对文本进行预处理，然后从训练集中读取文本信息从而产生正、负规则，并计算正负权重系数，最后计算正、负概率。文中给出了计算正负权重系数的算法，并根据计算出来的权重系数及正、负概率值对文本进行分类。将文中提出的概率分类器与SVM分类器进行对比实验，实验结果表明，文中设计的概率分类器对于文本分类效果较好。

其他文献

创新人才培养的实践性思考

本文主要对我国高等教育人才培养模式现状进行分析，针对存在的问题，探索创新人才培养方式的改进。高等教育教学改革应在学生的创新思维、动手能力上下工夫，从而为培养具有创新能

期刊

创新思维动手能力人才培养模式素质教育innovative thinking practical ability talent cultivation

新时期高校仪器设备管理探索与实践

通过探讨高校仪器设备管理的机制、队伍、制度建设及使用和维护等问题,提出了新时期高校仪器设备管理的对策和措施。

期刊

高校仪器设备探索与实践university instruments and equipment management exploration and

全媒体时代新闻摄影记者的价值与发展——新媒体时代的新闻摄影探索

新闻摄影记者在全媒体时代的价值如何体现,今后该如何发展是媒体行业人士关注的重点。作为一名新闻摄影记者,在见证了纸质媒体时代的辉煌之后,也迎来了新媒体时代下的困惑与

期刊

新闻摄影记者全媒体时代探索

从视听技术看电影如何营造“沉浸感”

随着电影技术的不断发展,为了满足观众越来越多的多元化需求,电影的创作已经不仅仅是通过宏大新颖的叙事来吸引广大观众,而是借用新型技术来创造更为真实更为立体的视觉奇观,

期刊

视听技术一镜到底去特效化沉浸感

3种不同支气管肺泡灌洗液结核杆菌检测方法在涂阴肺结核诊断中的对比分析

目的通过对比3种不同支气管肺泡灌洗液结核杆菌检测方法在涂阴肺结核诊断中的结果,分析其临床应用价值。方法 200例涂阴肺结核患者作为涂阴肺结核组,再选取同期45例非肺结核

期刊

涂片法培养法荧光定量聚合酶链式反应涂阴肺结核诊断

高等院校专业办学成本差异实证分析

高等院校专业设置趋同现象的原因之一是某些专业的办学成本较低，从政策导向上看，主要表现在教学辅助人员的支出、维修费用支出与折旧费支出等方面；从客观实际情况看，主要表现在水

期刊

高等院校专业设置办学成本成本差异higher institutions majors setting running cost cost diff

GSM-R无线通信基站天线倾角测量系统

为了更加准确方便地测量GSM-R无线通信基站天线的倾斜角度,文中研究了一种新型的GSM-R无线通信基站天线倾角测量系统。该系统通过使用芬兰VTI公司SCA100T-D01传感器进行倾斜

期刊

GSM-R基站天线倾角测量组网测量GSM-R base station antenna elevation angle measurement n

提高报社编辑策划意识和能力的途径

随着时代进步与经济发展,我国媒体事业快速发展,这使各个媒体所面临的市场竞争越来越激烈。在这样的情况下,我国报社应该采取合理的措施,有效提升自身的整体竞争实力,在我国

期刊

报社编辑策划意识策划能力途径

基于网络编码的汇播在无线传感网中的实现

网络编码被应用于多播、广播和单播中。而把网络编码应用于无线传感网汇播的研究还处于理论和仿真阶段。把网络编码应用于实际环境中，需要考虑节点同步、开销控制、线性独立的

期刊

无线传感网网络编码汇播同步收集率wireless sensor networksnetwork codingconvergecastsynchroni

教育扩展与教育分配：中国经验研究

利用我国31个省（自治区、直辖市）1996～2003年的混合截面数据，对我国教育扩展过程中的教育分配问题进行实证研究。研究结果表明，我国教育扩展与教育分配不平等之间存在显著的倒U型

期刊

教育扩展教育分配教育分配不平等倒U型曲线education expansion education distribution education d

一种新的用于文本分类的概率分类器设计

与本文相关的学术论文