基于信息熵加权的Word2vec中文文本分类研究

来源 :长春师范大学学报 | 被引量 : 0次 | 上传用户：zhoulei1964

【摘要】

：

针对中文文本分类中文本向量表示和词汇重要性等问题,提出基于Word2vec的中文文本分类方法。首先采用Word2vec训练生成文本向量;然后根据信息熵的概念,计算出不同词汇在文档

【作者】

：

吴萍萍

【机构】

：

黎明职业大学信息与电子工程学院

【出处】

：

长春师范大学学报

【发表日期】

：

2020年2期

【关键词】

：

Word2vec 中文文本信息熵 Word2vecChinese textthe information entropy

【基金项目】

：

黎明职业大学2017年校级课题研究项目“基于文本分类的网络舆情分析及预测研究”(LZ201711)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对中文文本分类中文本向量表示和词汇重要性等问题,提出基于Word2vec的中文文本分类方法。首先采用Word2vec训练生成文本向量;然后根据信息熵的概念,计算出不同词汇在文档中的重要程度,对向量进行加权;最后使用SVM分类器对加权后的词向量进行训练。实验结果表明,本文提出的分类方法在精确率、召回率和F-measure均有显著提高,具有较好的分类效果。

其他文献

品种名称不得注册种子商标

自2004年《种子法》颁布以来,我国种业冲破体制机制的桎梏,发展速度与规模前所未有,2016年作为新《种子法》实施的元年,也注定拉开新一轮调整序幕。那么未来,新的法律条文将

期刊

品种名称《种子法》

APACHE Ⅱ评分对重症中暑患者预后判断的价值

目的探讨急性生理学与慢性健康状况评分Ⅱ（APACHEⅡ评分）对重症中暑患者预后判断的价值。方法选择重症中暑患者40例，其中存活31例、死亡9例。收集其入院24h内APACHEⅡ评分，并进行

期刊

中暑急性生理学与慢性健康状况评分Ⅱ预后判断

基于心态指标记分函数的四参数区间直觉模糊多准则决策方法

针对直觉模糊数在决策应用中的不足,定义了四参数区间的直觉模糊数,并列出其加权几何平均算子、有序加权算术平均和有序加权几何平均算子以及加权平均算子。研究限定在具有确

期刊

四参数区间直觉模糊数心态指标记分函数多准则决策four parameters interval intuitionistic fuzzy numbers(

环形腔中的双稳性和三重光力诱导透明窗口的可调性

在一个包含二能级原子系综的环形腔光力学系统中,通过数值计算发现,复合系统可以出现双稳性,同时出现三重光力诱导透明。我们发现光学腔场与二能级原子之间的耦合提供了一个

期刊

腔光力学系统原子系综光力诱导透明双稳optomechanical systematomic ensembleoptomechanically induc

某档案馆高压细水雾灭火系统设计

结合某甲级档案馆的消防设计，分析了档案馆的消防特点，对高压细水雾灭火系统与气体灭火两种方式进行比较。介绍了高压细水雾灭火系统的灭火原理，并对该档案馆的高压细水雾灭火系

期刊

甲级档案馆档案库房气体灭火系统高压细水雾灭火系统

肠炎Ⅱ号保留灌肠治疗慢性结肠炎150例

肠炎Ⅱ号保留灌肠治疗慢性结肠炎１５０例王明星张素琴鲁春芳河南省许昌市中医院（４６１００７）笔者自１９９３年６月采用肠炎Ⅱ号保留灌肠，治疗慢性结肠炎１５０例，获满意疗效，现介绍如下。１一般资料本组１５０例病人中，男８３例

期刊

结肠炎慢性肠炎Ⅱ号中药灌肠

一种改进教师提问的体系

语言教师提问很多。事实上,在英语作为第二语言(ESL)的课堂里提问是最常见的话语类型之一(Sinclair 和 Coulthard1975)。有一项研究表明,一位 ESL 教师仅在五十分钟的一堂课

期刊

教师提问显示性参考性提问参考性问题

火的历史重建及其与气候变化和人类活动关系研究进展

火是影响生态演化和物质循环的突发性驱动因素之一,在人类文明的进步中也有重要的作用。综述了全球范围内生物质燃料不完全燃烧产物——碳屑、树轮火疤、碳黑、多环芳烃和左

期刊

火的历史气候变化人类活动火成碳碳黑多环芳烃左旋葡聚糖fire history climate change human activitiescha

中国IODP 2014年各项工作取得重要进展

<正>2013年10月,IODP正式进入新的阶段——国际大洋发现计划(International Ocean Discovery Program,IODP)。进入新阶段后,现有的三个钻探平台独立运行,各自寻找财政支持,这

期刊

IODP 2014无机地球化学重要进展

旋磁治疗慢性喉炎100例临床分析

旋磁治疗慢性喉炎１００例临床分析张恒峰南京市第一医院（２１０００６）近几年来，我们应用旋磁穴位治疗慢性喉炎，获得较好的疗效，现报告如下：１临床资料１００例慢性喉炎患者，全部由五官科门诊确诊后转来，其中部

期刊

喉炎旋磁穴位治疗

基于信息熵加权的Word2vec中文文本分类研究

与本文相关的学术论文