基于支持向量机的PU中文文本分类器构建

来源 :南京邮电大学学报：自然科学版 | 被引量 : 0次 | 上传用户：haihaiboyfei

【摘要】

：

在PU文本分类中，针对文本分类中可信反例获取困难，使文本分类器性能低下的问题，提出了一种基于支持向量机的Pu文本分类器的构建。该方法采用改进的特征词权值提取方法进行特征词

【作者】

：

王宗尧刘金岭

【机构】

：

淮阴工学院管理工程学院,淮阴工学院计算机与软件工程学院

【出处】

：

南京邮电大学学报：自然科学版

【发表日期】

：

2015年6期

【关键词】

：

支持向量机 PU分类文本分类正例可信反例 support vector machine PU classification text classifica

【基金项目】

：

江苏省高校哲学社会科学研究（2015SJD702）, 淮阴工学院科研基金（HGC1422）资助项目

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在PU文本分类中，针对文本分类中可信反例获取困难，使文本分类器性能低下的问题，提出了一种基于支持向量机的Pu文本分类器的构建。该方法采用改进的特征词权值提取方法进行特征词提取，利用OB—PCZ算法从未标识文本数据集中尽可能多地移除正例，从而获得更多的可信反例。结合支持向量机和改进的Rocchio构建了高效的文本分类器。实验表明，该方法比目前其它的面向PU学习的文本分类方法具有更高的分类质量。

其他文献

危险驾驶罪中机动车所有人、管理人的刑事责任

《刑法修正案（九）》在第133条之一增设了从事校车业务、旅客运输业务超员、超速、违反危险品安全管理规定运输危险品的危险驾驶行为之后,又在第2款规定了车辆所有人、管理人的

期刊

危险驾驶罪所有人管理人刑事责任

传统文化教育在初中语文教学中的渗透

初中阶段学生无论是生活还是学业都会面临更多变化,语文教学文本涉及诸多国学经典内容,在该阶段有计划的渗透传统文化教育有助于帮助学生明确人生价值和目标。

期刊

传统文化语文教学

一种简单的适合无线Mesh网络的机会协作MAC机制

针对IEEE802．11MAC（medium access control）协议中通信模式的缺陷，提出了一种新的协作MAC机制。该机制重点研究了分布式中继节点的选择算法，并定义了一种新的控制帧（retran）。目的节

期刊

无线MESH网络MAC协议协作通信机会中继wireless mesh networks MAC protocol cooperative commu

基于植株整体形状特征的杂草识别算法的研究

为解决传统基于植物叶片形状特征的杂草识别中识别率不高的问题,该文以生长中期的生菜与四种伴生杂草稗草、小飞蓬、鬼针草和车轴草为主要研究对象,提出了一种基于植株整体形

期刊

杂草识别植株整体形状特征生菜神经网络

论康拉德《黑暗的心》的现代女性主义特征

在20世纪末,上个世纪的帝国传统以某种方式在自我重复。虽然今天不再有巨大的空间和正在扩张的边界,也没有令人兴奋的移民点可设立。我们生活在一个全球性的环境中。大量生态

期刊

康拉德《黑暗的心》女性主义

安徽郎溪县“圣川白茄”的选育与栽培要点

郎溪县白茄生产历史悠久，近年来早春塑料大棚生产的白茄更是受到广大消费都青睐。为更好的发展白茄生产，对当家白茄品种进行提纯复壮，选育出圣川白茄。该文就圣川白茄的选育过程

期刊

圣川白茄品种选育技术要点

依托地方课程资源,强化美术教学特色

美术教学大纲指出:要贯彻理论知识联系生活实际的原则,教学内容的选择要结合学生生活的实际。要按照10%-20%的课时比例补充生活教材,以反应当地社会与经济发展的实际。由此可

期刊

美术教学当地特色化课程资源

高中语文生命教育主题阅读的实践

语文教育和其他的学科教育有一些不同,语文教育能够利用文章的力量去感化和教育学生,能够教生命教育充分的融入到语文教育当中,让语文成为关怀学生的学科,让语文成为带领学生

期刊

高中语文生命主题教育实践

一种个性化的k-匿名位置隐私保护算法

文中提出了一种基于个性k-匿名模型的新的％．匿名算法。在普通匿名算法中增加匿名群记忆模块，从而加快匿名算法的匿名速度。仿真结果表明当用户对安全要求较高的情况下，新匿名算法

期刊

K-匿名个性k-匿名匿名群k-anonymity personalized k-anonymity clique

坚持“信息惠农”主旨扎实推进河南省12316“三农”热线综合服务平台建设

<正>导语:2016年10月,河南省12316热线省级综合平台接到来自新乡原阳县路寨乡西寨村的大棚蔬菜种植户们发来的一封感谢信,有了12316热线专家团的权威技术鉴定书,种植户们有了

期刊

“三农”综合服务平台河南省扎实推进

基于支持向量机的PU中文文本分类器构建

与本文相关的学术论文