【摘 要】
:
针对自然语言处理情感分析领域中情感分类的问题,提出了一种基于多特征LSTM-Self-Attention的文本情感分类方法.方法 以词向量和词性向量为输入,利用LSTM网络模型提取文本的序列特征,并通过在模型中引入自注意力机制(self-attention),从序列特征中提取出句子的语法和语义特征,减少了任务的复杂度.上述方法避免了传统循环神经网络存在的梯度消失和梯度爆炸的问题,极大缩短单词长距离依赖特征之间的距离,提高了分类效果.最后使用中文电影评论数据集进行实验验证,结果表明该方法特征提取能力更强,使
【机 构】
:
太原科技大学计算机科学与技术学院,山西太原030024;太原科技大学计算机科学与技术学院,山西太原030024;中国科学院地理科学与资源研究所,北京100101
论文部分内容阅读
针对自然语言处理情感分析领域中情感分类的问题,提出了一种基于多特征LSTM-Self-Attention的文本情感分类方法.方法 以词向量和词性向量为输入,利用LSTM网络模型提取文本的序列特征,并通过在模型中引入自注意力机制(self-attention),从序列特征中提取出句子的语法和语义特征,减少了任务的复杂度.上述方法避免了传统循环神经网络存在的梯度消失和梯度爆炸的问题,极大缩短单词长距离依赖特征之间的距离,提高了分类效果.最后使用中文电影评论数据集进行实验验证,结果表明该方法特征提取能力更强,使得情感分类的准确率提升了1.74%.
其他文献
由于视频图像数据较为复杂,现有视频图像角点检测方法没有考虑视频图像成像过程中,摄像机镜头的光学偏差与装配误差导致径向畸变问题,导致像素级角点检测精度较低.提出基于迭代校正的视频图像亚像素角点检测方法.利用多次拍摄和逐级迭代优化镜头参数,根据畸变图像与校正图像坐标的映射关系,利用空间坐标变换与像素点灰度插值法使畸变图像复原,将校正图像与高斯函数卷积构建多尺度空间,以尺度空间内角点为中心投影至校正图像,在校正图像内设定投影区域,利用区域内全部角点构建角点集群,结合坐标加权平均法完成视频图像亚像素角点检测.仿真
为了加强网络访问安全、减少恶意攻击发生几率,提出了一种基于双重触发的嵌入式内核安全访问控制方法,首先修改嵌入式内核,使其完全符合OSEK-time的标准双重触发调度模块,之后利用静态周期性抢占式调度策略,检测是否存在新的双重触发任务需要激活,再以双重触发的嵌入式内核为载体,构建一种CloudMLS方案模型,得到数据所有者和权威中心系统的公开参数,最后数据所有者通过上述获得的信息构建安全访问控制机制,并添加新安全级与安全访问结构关联,进而完成安全访问控制.仿真结果证明,信息熵接近于理想值8,密钥敏感性较强,
针对当前多数应急物流仓库运行效率低下,无法满足高效运作需求等问题,以演化博弈为理论基础,提出一种应急物流最优仓库定位方法.从最小化服务时长与最小化需求响应时间两个角度出发,分析候选点建设成本、供应点与候选点紧急交通工具运营成本,讨论服务时间,进而构建最小化函数及其约束条件,以建设、运营以及惩罚等各种成本作为需求响应效率,架构最小化函数及其约束条件,引入扰动原则,提出最优仓库定位演化博弈问题,获取最优仓库定位策略集合,定位应急物流最优仓库.设定某市不同区域中应急储备仓库、需求点以及供应点的模拟场景等,解得应
Web信息访问的有效监控已成为保证网络安全的重要部分,提出基于关键词分级检索的Web信息访问监控算法.充分考虑词汇链长度、词汇链中词汇分布密度等因素计算所搜寻词语与初始词汇链相似度,依据相似度结果构建词汇链,基于词汇的首次出现位置、所处文档区域、所处词汇链强度、词汇信息熵四种属性确定文档中词汇权值,降序排列词汇链内全部词汇权值,依次选取权值较大的词汇作为关键词,根据所确定关键词实现关键词分级检索Web信息,利用PageRank算法获取Web页面重要程度排序Web网页超链接,依据超链接排序结果确定监控周期实
在复杂环境下智能物流分拣系统中QR码检测任务有着较高的精度及速度要求,为满足工业现场硬件资源条件下算法模型的部署,提出了一种基于端到端网络的QR码快速检测算法.算法采用深度学习中主流One-Stage检测器作为基础框架,提取以及融合不同尺度的特征信息,同时在网络模型中加入优化的深度可分离卷积以及全连接注意力宏模块,以及应用快速非极大值抑制,整体上提升特征提取效果和模型检测的速度.最后,将文中算法与开源的经典模型(如YOLO V3、SSD-VGG、RetinaNet等)做对比实验,应用于采集于物流分拣现场Q
网络用户文档涵盖大量隐私敏感数据,传统隐私大数据检索方法面对多种类繁杂数据存在检索顺序混乱问题,导致检索命中率不高、效率低下等问题.为解决上述问题,提出基于相似树查询的隐私大数据定向检索算法.结合物-雾-云建立适用于海量数据的隐私保护检索系统,设计基于相似树查询的兄弟叶节点查询结构.利用网格区域分割将多种类繁杂数据集划分成多个子集,完成大数据的相互匹配与滤波.结合模糊谱聚类完成数据关联属性特征提取,按照数据聚类属性识别分类特征,引入识别结果完成隐私大数据定向检索.仿真结果表明,与传统方法相比,所提隐私大数
采用当前方法辨识制冷系统堵塞故障位置时,由于没有对相关数据进行预处理,导致辨识结果召回率低、误报率高、漏检率高.于是提出多联式空调制冷系统堵塞故障位置辨识方法.将待辨识的多联式空调制冷系统堵塞故障位置设为观测点,利用迭代检验方法对观测点时间序列进行清洗,消除对故障位置辨识贡献较低的数据,提高召回率.利用数据的能量熵、近似熵特征构建堵塞故障数据特征集合,完成堵塞故障特征融合提取,以降低误报率,采用基于交叉验证的SVM故障分类模型完成堵塞故障位置的辨识.实验结果表明,所提方法的召回率高、误报率和漏检率较低,实
针对传统方法构建的模型寻址规则与逻辑不匹配,导致物联网出现失效节点时模型寻址效果下降,在云信任度评估下,提出全新的物联网海量底层资源寻址模型构建方法.方法 预先制定底层寻址编码方案,采用元胞更新模型寻址规则,利用搜索算法设计寻址逻辑,通过建立寻址模型云信任度评估推荐模块,实现对海量底层资源寻址模型的优化.仿真结果表明,与传统寻址模型相比,设计的寻址模型的寻址准确率更高,构建的模型有更好的寻址效果.
针对传统医学图像检索存储体量大、检索效率低等问题,提出一种基于加权深度特征的医学图像并行检索方法.利用基于部分语义加权的卷积神经网络进行图像深度特征提取,筛选深层网络中对图像信息有效表达的特征;建立图像分布式乘积量化哈希编码模型,实现对高维特征的分布式编码压缩;最后,结合Spark并行模型对查询的医学图像执行分布式并行检索.在医学图像数据集上的实验证明,所提出的方法与传统方法相比具有更好的检索精度和检索效率表现.
针对一些电量预测模型缺乏对季节、节假日等特殊时间节点处理的过程,以及单一Prophet模型在节假日等特殊时间点易陷入过拟合,导致预测置信值偏差较大的问题,提出了一种改进Prophet预测方法.方法 在原有Prophet模型的基础上,增加了一个预测值优化模块,通过模块融合Prophet模型和XGBoost模型,利用XGBoost模型正则化项可有效防止过拟合的特点,对不同子模型的预测结果进行加权求和,减小预测误差.实验结果表明,与原始Prophet预测模型相比,改进后的预测模型X-Prophet有效减小了预测