基于类别信息优化的潜在语义分析分类技术

来源 :中国科学技术大学学报 | 被引量 : 0次 | 上传用户:zxw2yanzi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
潜在语义索引作为一种公认有效的矩阵降维技术,在关键词检索、文本分类等多种基于统计的机器文本学习任务中被广泛应用.基于专业文献的文本分类任务,结合严格分类体系下同类与不同类文本的特点,以专利文献分类为例,提出了一种基于类别信息优化的潜在语义分析分类技术.该方法根据分类文本各类别的特征信息,将原始文档分解为多种伪文档,强化不同分类的专属特征出现频率,进而优化构建潜在语义空间,提升模型分类性能.实验结果证明,专利文本分类任务结合该方法时,可以有效地提高分类的准确性.
其他文献
<正> 随着对外开放的深入,中国的读者通过各种渠道接触到的英文报刊杂志越来越多,读英文报刊杂志的人也越来越多。可是凡读英文报刊杂志的人都会有同样的感受:英文新闻标题不
数据驱动在外语教学实践中发挥着越来越重要的作用。在利用大数据构建线上课程平台的基础上,探讨基于数据驱动的美国文学教学模式创新问题。研究发现,通过以数据驱动促进教学
删失回归模型是一种响应变量受限制的模型,广泛应用于计量经济学中.针对删失回归模型,借助于分位数估计方法和SCAD型惩罚函数,提出了一种变量选择和压缩估计方法.该方法可选
提出了带有最低保障固定供款养老基金最优管理的连续时间随机控制模型.在奈特(Knight)不确定的基金管理者区分含糊(ambiguity)和含糊态度(ambiguity attitude)下,用α极大极小期望
随着社会的持续性发展以及旅游专业的持续创新,高职教育阶段旅游专业教学课程的重要性也在不断地提高。在科学技术的发展需求之下,国内外大多数的旅游专业课程都处于持续改革
"X光式"是一种非常特殊的绘画透视方法,其特点是,作者对所画的对象进行特殊的处理,不仅表现出对象的外部特征,而且展示出对象为我们的肉眼看不见的部分或被摭挡住的部分,有点
中国花鸟画,兴起于北宋,鼎盛于明清,繁荣于近现代,集中地体现了人与作为审美客体自然生物的审美关系。它往往通过抒发作者的思想感情来体现时代精神面貌,从而间接地反映社会
便秘是胃肠道最常见的症状之一,包括结肠性便秘、盆腔出口梗阻性便秘、结肠竞力与出口梗阻性便秘并存、正常传输性便秘4种类型.在除外器质性病变后,传输试验、排粪造影及肌电图
在质心能量1004-1060Me V之间的25个能量点测量了e^+e^→KS^0+KL~0和e~+e^-→KK截面,系统误差大约为2%-3%.分析是基于VEPP-2000e^+e^-对撞机上CMD-3收集的积分亮度为5.5pb-1
<正>羽衣甘蓝有很多品种,按植株高度分,有高生种和矮生种,高生种株高可达3米,矮生种株高仅30厘米左右。按叶片分,有皱叶和平滑两种类型,均采收嫩叶为食用,而皱叶型更受消费者