基于宏特征融合的文本分类

来源 :中文信息学报 | 被引量 : 0次 | 上传用户：zhangshuyunhuiming

【摘要】

：

宏特征（即文档级特征）抽取方法是文本分类中一类典型的特征抽取方法,可以分为有监督宏特征抽取和无监督宏特征抽取。这两类宏特征抽取方法均能提高文本分类的性能。但是,同时使

【作者】

：

王丹丹陈清财王晓龙汤步洲

【机构】

：

深圳信息职业技术学院数字媒体学院,哈尔滨工业大学深圳研究生院网络智能计算重点实验室

【出处】

：

中文信息学报

【发表日期】

：

2017年2期

【关键词】

：

文本分类有监督宏特征抽取无监督宏特征抽取特征融合 text classification supervised macro feature extrac

【基金项目】

：

国家自然科学基金（61173075,61272383）, 深圳市基础重点项目（JC201005260118A）, 深圳市战略性新兴产业发展专项（ZDSY20120613125401420,JCYJ20120613151940045）, 深圳科技研发资金（JC201005260175A）, 贵州省科学技术基金资助项目（黔科合J字[2013]2335号）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

宏特征（即文档级特征）抽取方法是文本分类中一类典型的特征抽取方法,可以分为有监督宏特征抽取和无监督宏特征抽取。这两类宏特征抽取方法均能提高文本分类的性能。但是,同时使用两类宏特征的情况还没有被研究。该文研究了有监督宏特征和无监督宏特征融合对文本分类性能的影响。具体来讲,研究了两种有监督宏特征抽取方法,与三种无监督宏特征抽取方法,即K-means、LDA和DBN,相互融合的情况。在两个公开语料库Reuters-21578和20-Newsgroup以及一个自动构建的语料库上的对比实验表明,有监督和无监督宏特征

其他文献

Molecular Modification of a HSV- 1 Protein and Its Associated Gene Transcriptional Regulation

疱疹单一的病毒的分子的修正打字我(HSV-1 ) 乙酰化和磷酸化代表的蛋白质对它的生物功能必要。细胞 chromatin-remodeling/assembly 涉及 HSV-1 在怀有 lysin 的 HSV-1 或潜

期刊

分子修饰HSV-1蛋白质基因转录调控方法Modification Herpes simplex virus type （HSV- 1） Trans

Recent Advances in Research on Hepadnaviral Infection in the Woodchuck Model

土拨鼠模型是一个优秀动物模型学习 hepadnaviral 感染。在使可能检验 T 房间的这个模型的新进步调停了在尖锐、长期的 hepadnaviral 感染的有免疫力的回答。最近，为细胞毒素

期刊

美洲旱獭细胞基因免疫系统Chronic hepatitis B Woodchuck hepatitis virus （WHV） Hepatitis

基于有监督学习的医古文叙述性术语语义标注

对自由文本形式的中医古籍文献（医古文）进行标注，是对其进行深入分析的前提，语义标注技术是实现该目的的方法之一。该文将中医古籍文献中包含的术语分为名称性术语以及叙述性术语

期刊

语义标注叙述性术语有监督学习中医古籍文献semantic annotation descriptive terms supervised learn

基于语义构词的汉语词语语义相似度计算

汉语词语语义相似度计算,在中文信息处理的多种应用中扮演至关重要的角色。基于汉语字本位的思想,我们采用词类、构词结构、语素义等汉语语义构词知识,以“语素概念”为基础,

期刊

词语语义相似度计算语义构词词义知识表示语素概念Chinese word similarity computing Chinese semantic w

Herpes Simplex Virus Type 1 ICP27 Protein： Its Expression, Purification and Specific Antiserum Produ

(HSV-1 ) 疱疹单一的病毒类型 1 是唇疱疹和另外的更严重的疾病的原因的代理人。HSV-1 感染房间的蛋白质(ICP27 ) 27 是对到目前为止在 herpesviruses 的所有类上识别的基因

期刊

单纯疱疹病毒抗血清蛋白质纯化生产BLOT分析感染细胞P27基因Herpes simplex virus type 1 （HSV-1） Infe

Construction and Characterization of a Hepatitis B Virus Replicon

建立复制细胞肝炎 B 病毒(HBV ) 当模特儿并且在抗病毒的药评估决定它的应用程序，我们构造了表情包含了 HBV 染色体的 1.3 个拷贝，并且在 Huh7 房间在短暂 transfection 以后测

期刊

Prokaryotic Expression and Purification of HIV-1 Vif and hAPOBEC3G, Preparation of Polyclonal Antibo

准备 HIV-1 Vif 和 hAPOBEC3G 并且生产他们的抗体， HIV-1 vif 的完整的长度基因碎片被聚合酶链反应从 HIV-1 NL4.3 cDNA，和 APOBEC3G 基因的一个原生质标志放大被 RT-PCR 从 H

期刊

多元性繁殖原核抗体净化过程Human immunodeficiency virus type 1 （HIV-1） Viral infectivity

基于在线社会网络的用户影响力研究

对大规模的在线社会网络图结构进行了较为系统的分析,结果表明社会网络的入度、出度、发文数等基本符合幂律分布。社会网络的小世界属性也使得强连通关系呈现＂纺锤体＂形状。该

期刊

社会影响力小世界属性信息扩散社会网络social influence small world information diffusion soci

“创新难题”的破解

公司治理不论在哪个层面,绝大多数情况下,都是由一个管理团队来完成的。团队的主要领导者,天然就负有＂双重性＂的管理职责。一方面,他要对所有管辖范围内的业务、效益和风险承担

期刊

创新管理团队管理职责公司治理管辖范围管理责任风险承担职责分工

In vivo Inhibition of NAS Preparation on H9N2 Subtype AIV

NAS 准备，一种中草药由云南 Eco 农业的研究院发现了，潜在的抗病毒的活动。在这篇论文， H9N2 子类型上的 NAS 准备的禁止的效果鸟的流行性感冒病毒(AIV ) 在 vivo 被调查。感染

期刊

H9N2亚型禽流感病毒NAS体内逆转录聚合酶链反应制备病毒感染农业研究所抗病毒活性NAS preparation H9N2 subtype A

基于宏特征融合的文本分类

与本文相关的学术论文