基于宏特征融合的文本分类

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:zhangshuyunhuiming
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
宏特征(即文档级特征)抽取方法是文本分类中一类典型的特征抽取方法,可以分为有监督宏特征抽取和无监督宏特征抽取。这两类宏特征抽取方法均能提高文本分类的性能。但是,同时使用两类宏特征的情况还没有被研究。该文研究了有监督宏特征和无监督宏特征融合对文本分类性能的影响。具体来讲,研究了两种有监督宏特征抽取方法,与三种无监督宏特征抽取方法,即K-means、LDA和DBN,相互融合的情况。在两个公开语料库Reuters-21578和20-Newsgroup以及一个自动构建的语料库上的对比实验表明,有监督和无监督宏特征
其他文献
疱疹单一的病毒的分子的修正打字我(HSV-1 ) 乙酰化和磷酸化代表的蛋白质对它的生物功能必要。细胞 chromatin-remodeling/assembly 涉及 HSV-1 在怀有 lysin 的 HSV-1 或潜
土拨鼠模型是一个优秀动物模型学习 hepadnaviral 感染。在使可能检验 T 房间的这个模型的新进步调停了在尖锐、长期的 hepadnaviral 感染的有免疫力的回答。最近,为细胞毒素
对自由文本形式的中医古籍文献(医古文)进行标注,是对其进行深入分析的前提,语义标注技术是实现该目的的方法之一。该文将中医古籍文献中包含的术语分为名称性术语以及叙述性术语
汉语词语语义相似度计算,在中文信息处理的多种应用中扮演至关重要的角色。基于汉语字本位的思想,我们采用词类、构词结构、语素义等汉语语义构词知识,以“语素概念”为基础,
(HSV-1 ) 疱疹单一的病毒类型 1 是唇疱疹和另外的更严重的疾病的原因的代理人。HSV-1 感染房间的蛋白质(ICP27 ) 27 是对到目前为止在 herpesviruses 的所有类上识别的基因
建立复制细胞肝炎 B 病毒(HBV ) 当模特儿并且在抗病毒的药评估决定它的应用程序,我们构造了表情包含了 HBV 染色体的 1.3 个拷贝,并且在 Huh7 房间在短暂 transfection 以后测
期刊
准备 HIV-1 Vif 和 hAPOBEC3G 并且生产他们的抗体, HIV-1 vif 的完整的长度基因碎片被聚合酶链反应从 HIV-1 NL4.3 cDNA,和 APOBEC3G 基因的一个原生质标志放大被 RT-PCR 从 H
对大规模的在线社会网络图结构进行了较为系统的分析,结果表明社会网络的入度、出度、发文数等基本符合幂律分布。社会网络的小世界属性也使得强连通关系呈现"纺锤体"形状。该
公司治理不论在哪个层面,绝大多数情况下,都是由一个管理团队来完成的。团队的主要领导者,天然就负有"双重性"的管理职责。一方面,他要对所有管辖范围内的业务、效益和风险承担
NAS 准备,一种中草药由云南 Eco 农业的研究院发现了,潜在的抗病毒的活动。在这篇论文, H9N2 子类型上的 NAS 准备的禁止的效果鸟的流行性感冒病毒(AIV ) 在 vivo 被调查。感染