融合特征权重计算方法的短文本技术研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:tianwang800
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类是自然语言处理(NLP)应用中的基本任务之一。卷积神经网络(CNN)广泛用于NLP任务。然而,应用卷积神经网络进行文本分类忽略了文本分类类别中词语的区分能力。特征权重计算方法广泛用于数据检索和文本分类模型。最近,有研究者提出了一种有监督的特征权重计算方法,用来选择文本中对文本分类类别具有高区分能力的那些词。为了改进基于CNN的文本分类,我们引入了一种特征权重计算方法来改进基于CNN的文本分类。具体说来,我们使用两个单独的模型来进行文本分类任务。一种是使用特征权重计算方法来选择具有高类别区分度的单词,然后使用它们来表示文本。另一个是使用卷积神网络从新文本表示中提取特征并进行分类。我们在数据集Reuters-21578上进行了文本分类的实验。通过使用这种方法,我们提高了句子的准确性。
其他文献
超材料在太赫兹频段具有重要的应用价值,频率响应特性各异的超材料单元结构能够有效提高太赫兹波调制器件、极化转换器件及平面阵列天线等核心组件的性能。本论文重点研究了
过氧化氢酶(CAT)是自然界中一类具有极其重要意义的末端氧化还原酶。典型过氧化氢酶通常由四个相同的亚基构成,每个亚基氨基酸残基序列长度大约在460个左右。CAT能够专一且高效催化过氧化氢分解为氧气和水。基于此原理,CAT广泛应用于电化学过氧化氢生物传感器领域来检测过氧化氢含量。但是CAT在检测过程中处于电场状态下的相关性质尚未完全了解,因此该研究借助于分子动力学模拟来探讨CAT在一定电场下的相关性
目的:观察1,25(OH)_2D_3对TGF-β1刺激的HK-2细胞中mTOR的表达及肾小管上皮-间充质转分化的影响。方法:1.选取HK-2细胞,给予TGF-β1刺激,采用Real Time-PCR检测α-SMA表达的变化,确定TGF-β1的最佳作用浓度;2.将HK-2细胞分为五组,即正常对照组、TGF-β1(5ng/ml)刺激组、TGF-β1+1,25(OH)_2D_310-10mol/l组、T
随着等离子体物理及外空间技术的发展,真空紫外探测技术得到越来越广泛的应用,对于真空紫外光电器件的研究需求变得越来越迫切,而光谱响应测试技术对于光电器件的研究有着重
在产能过剩、产业转型的特殊背景下,本文利用45家上市光伏企业在2015—2017年的财务数据,运用因子分析构建光伏企业经营绩效树形指标体系;再利用突变级数法和数据包络法,对上
管道服役过程中,防腐涂层会发生破坏或失效,从而导致外部介质腐蚀管道外壁形成腐蚀缺陷。国内外学者对腐蚀缺陷管道的修复不断深入研究,复合材料修复管道技术由于成本低、工
前瞻记忆意向后效应是指前瞻记忆任务完成阶段,已完成意向的发生发展过程。具体表现为重复执行错误及对进行中任务反应时的干扰。对于前瞻记忆意向后效应的认知加工机制,目前
众所周知,流动性管理在农村商业银行在运营过程中扮演着相当重要的角色,同时商业银行经营的最根本的目标是确保整体资产的“流动性、安全性、盈利性”,因此流动性管理水平的
外商直接投资(FDI)已成为促进中国经济增长一个重要力量,外资进入对中国产业结构带来的影响也逐渐引起重视。近年来,随着中国西部地区优惠政策的不断出台和西部大开发的逐步深入,越来越多的外资进入西南地区。外资为中国西南地区经济发展和社会进步做出了重要贡献,但引进FDI的地域差异和行业差异也成为了引起西南地区区域经济发展失衡的重要原因。充分发挥FDI的效应促进西南地区产业结构优化升级,进而带动整个西南地
GPS在线数据处理系统旨在通过网络平台向用户提供高精度GPS数据自动解算服务,让用户在不需要掌握GPS原理与计算方法的情况下,能够得到高精度的解算结果。国内外相关学者、研究机构纷纷尝试并建立起一系列的在线处理GPS数据服务,国外已有多个较成熟的GPS在线数据处理系统上线并提供服务,国内却迟迟未有相关服务正式上线。然而国内用户使用现有GPS在线数据处理系统时存在坐标框架与国内不一致、网络访问延时高、