【摘 要】
:
随着互联网技术的高速发展,网络已成为人们沟通交流、获取信息的主要通道。而网络上的信息多以短文本的形式展现,如何快速有效地提取短文本中的信息,是一个非常有价值的课题。传统的短文本分类方法不仅过度依赖于情感词典的构建,而且需要耗费大量的人工成本进行特征提取。通过对这些问题进行分析,利用短文本的特点,设计了基于LSTM-TextCNN的短文本情感分类模型对传统分类方法作出改进。在课题研究过程中,通过阅读
论文部分内容阅读
随着互联网技术的高速发展,网络已成为人们沟通交流、获取信息的主要通道。而网络上的信息多以短文本的形式展现,如何快速有效地提取短文本中的信息,是一个非常有价值的课题。传统的短文本分类方法不仅过度依赖于情感词典的构建,而且需要耗费大量的人工成本进行特征提取。通过对这些问题进行分析,利用短文本的特点,设计了基于LSTM-TextCNN的短文本情感分类模型对传统分类方法作出改进。在课题研究过程中,通过阅读大量的期刊文献,介绍了短文本分类的发展历史和研究现状,详细阐述并对比了短文本分类中的相关技术。文本向量表示阶段,采用优化后的TF-IDF方法对特征向量进行加权,改进了传统的Word2vec词向量表示的不足,加快了分类模型中损失函数的收敛速度。设计基于LSTM-TC的短文本情感分类模型,该模型训练后得到的特征向量中保留了原文本中的局部特征和全局特征,通过将该模型与其他模型做实验对比,充分验证了该模型的有效性。在系统设计时,采用B/S的架构模式设计并实现了短文本情感分类系统。该系统实现的功能模块包括数据获取模块、数据预处理模块、情感分类模块和页面展示模块等,其中情感分类模块应用了基于LSTM-TC的短文本情感分类模型。该系统最终展示了短文本情感分类结果以及短文本分词的统计结果。由此设计的短文本情感分类模型通过对比实验得到其准确率为93%,比SVM、TextCNN等其他模型高出1%以上,可见该模型在短文本分类任务中具有较好的表现。本文通过系统测试验证了短文本情感分类系统具有良好的性能和完备的功能,达到了需求规定的目标。
其他文献
虚拟资源是互联网企业最重要的产品之一,对于这些资源的集中管理是十分必要的。某公司某部门主要负责该公司一些关键的虚拟资源,每年这些虚拟资源都会带来很大比例的营收。该部门最初只有一种虚拟资源,随着业务的扩展,在原来的基础资源上逐渐开发出了多种衍生虚拟资源。另外,节假日的时候,该部门为了增加收入,会进行一些营销活动,需要一次性给用户发放多个虚拟资源。原有的直接调用各个虚拟资源提供的接口的模式,随着虚拟资
随着生物信息学的不断发展,蛋白质残基接触预测和蛋白质结构域预测的研究也越来越多,准确率也越来越高。蛋白质残基接触图包含了蛋白质二维结构和三维空间距离信息,是研究蛋白质三维结构的重要步骤。蛋白质结构域对于解析蛋白质结构和理解蛋白质进化与功能有很大的作用,预测蛋白质结构域是蛋白质结构预测的第一步。论文主要是利用蛋白质残基接触图对蛋白质结构域进行划分。首先改进了目前蛋白质残基接触预测最好的网络Respr
随着医学显像设备的高速发展,正电子发射计算机断层显像(PET,即positron emission tompgraphy)设备面世并在医学可视化领域扮演着越来越重要的作用。与此同时面向PET数据的三维可视化需求也越来越多。然而,目前三维重建方法多应用于CT数据而对PET数据进行数据可视化的方法相对匮乏,因此研究相应的解决方案具有重要的意义。文章对常见的三维重建算法进行了研究,在分析比较面绘制体绘制
智能机器人和无人车具有广阔的应用前景,路径规划作为其核心问题,引起了广泛关注。路径规划问题是在给定起点和终点的情况下,智能体通过各种限制条件比如障碍物等规划出一条最优路径。强化学习模仿人类的学习过程,通过探索环境所得的环境回报作为训练数据,自行训练,不再需要预先设定好的训练数据,适合作用于未知环境,适用于路径规划问题。强化学习在路径规划下的使用,已经取得了不错的效果,但是在实际使用中,由于环境可能
随着现代生活节奏的加快,睡眠疾病和精神疲劳受到人们的广泛关注。而心率和呼吸是其中十分重要的诊断指标,因此准确检测心率和呼吸具有重要价值。现有的研究大多基于额外的精密检测设备,成本较高且不易用于日常检测,所以提出一种便捷且高精度的检测方法是很有必要的。心冲击图信号(BCG,ballistocardiography)相对于其他人体特征信号极具便捷性,且测量过程中可以做到与人体表皮无接触。其中BCG信号
随着移动互联网和信息技术的发展,信息过载问题日益加剧,很多互联网公司的产品纷纷推出千人千面的推荐系统,帮助用户高效地获取其感兴趣的内容,从而增加用户粘性,提高用户转化率,达到公司商业化目标持续增长的最终目的。目前业界使用的推荐系统主要包括召回和排序两个阶段。召回阶段负责从海量候选中筛选出用户潜在感兴趣的内容作为排序阶段的输入,优化召回服务可以为排序阶段提供更优质的内容,进而提升用户体验。为此,论文
如今互联网技术正飞速发展,互联网无时间地域限制、操作成本低、信息量大等突出优点,使得线上招聘逐渐取代传统招聘,成为求职者的主要求职途径。一个理想的招聘系统应该具备用户操作流畅,使用方法简明,界面干净简洁,流程直接不繁琐,求职反馈及时等特点。在需求分析中规划了系统三类用户招聘者、应聘者、系统管理员的功能需求,和系统性能要求;在系统设计中对系统架构、功能模块、数据库表和索引设计,对高并发问题技术选型;
随着智能交通领域兴起,交通标志识别作为其关键技术,发展同样迅速。但传统的交通标志识别需借助大量监督数据,而监督数据获得困难,并且传统的识别方法需要在高成本的重新训练下才能对新的交通标志进行识别,无法适配地区性交通标志差异和满足今后的需求。事实上,交通标志具有原型图像,在此基础上我们利用小样本学习的方法来解决上述难题。而目前的变分原型编码器(VPE),利用小样本学习与编码器结合将真实图像和原型图像诱
在传统的建筑行业中,若要绘制建筑模型,大多会采用CAD(Computer Aided Design,计算机辅助设计)进行制图,尽管能够通过一些电子设备提高绘制的效率,但是仍需要耗费巨大的人力。随着科技以及数字化技术的蓬勃发展,BIM(Building Information Modeling,建筑信息模型)渐渐被人们所关注,并受到了广大建筑行业人员的青睐,是建筑行业发展的新趋势,在Web端针对BI
网络时代的到来,智能手机的发展,加上流量资费的不断降低,使得基于IP网络的语音通话迅速发展起来,各种语音通话的框架更是层出不穷。但由于这种语音通话基于IP网络,而网络传输情况复杂且存在很多不可控因素,这就意味着语音数据在网络传输时的安全无法得到保障,比如可能出现被第三方监听截取的风险,所以当人们的交流涉及一些个人隐私或者需要保密的信息时,语音通话不再成为人们的选择。因为安全问题,语音通话的发展受到