【摘 要】
:
随着自然语言处理(NLP)的不断发展,深度学习被逐渐运用于文本分类中.然而大多数算法都未有效利用训练文本的实例信息,导致文本特征提取不全面.为了有效利用对象的实例信息,本
【机 构】
:
上海理工大学 光电信息与计算机工程学院,上海,200093上海理工大学 光电信息与计算机工程学院,上海200093;上海理工大学 信息化办公室,上海200093;
论文部分内容阅读
随着自然语言处理(NLP)的不断发展,深度学习被逐渐运用于文本分类中.然而大多数算法都未有效利用训练文本的实例信息,导致文本特征提取不全面.为了有效利用对象的实例信息,本文提出最近邻注意力和卷积神经网络的文本分类模型(CNN-AKNN).通过引入基于加权卡方距离的最近邻改进算法训练文本,构建文本对象的注意力,然后将注意力机制与卷积神经网络相结合实现全局特征与局部特征的提取,最后通过softmax函数进行文本分类.本文采用搜狗新闻语料库、中山大学语料库以及英文新闻语料库AG news进行大量实验,结果表明本文所使用的改进算法相较于基准算法效果更优,更有利于提取模型的隐含特征.
其他文献
多语言文本的情感分析是情感分析领域的重要问题之一,而现有的情感分析方法着重于对单语言文本的研究.本文针对中英混合文本提出了一种细粒度情感分析模型,通过基于大规模语
人工智能的飞速发展对高性能计算提出了更高的要求,异构计算环境下任务调度问题一直是高性能计算中的关键问题.本文提出一种基于优先队列划分的调度算法(PQDSA),该算法根据DA
链路预测作为复杂网络分析的一项重要任务,其目的是寻找节点间缺失(新)的链路,识别虚假交互,对于挖掘和分析网络的演化,重塑网络模型具有重要意义.传统的链路预测方法多数采
随着安全关键性系统的日益复杂,如何提高安全关键系统的安全性成为急需解决的问题.基于形式化模型的复杂系统设计与分析是一种重要的安全性分析方法.本文工作对AIR6110标准中
针对无人机自组网和地面控制站通信时网关节点持续时间短并由此带来的数据传输时延过大和成功率不高等问题,提出了一种基于无人机-地面控制站链路状态预测的网关选择算法.该
提出了一种云数据中心基于数据依赖的虚拟机选择算法DDBS(data dependency based VM selection).参考Cloudsim项目中方法,将虚拟机迁移过程划分为虚拟机选择操作(VM selectio
针对无设备的室内重点区域监测问题,本文提出一种Wi-KAM方法,通过获取室内人员的实时位置信息,判断重点区域内部的人员存在情况和区域边界的入侵情况.本方法使用高斯低通滤波
差分隐私因具有严格推理和证明的隐私保证,常被应用于位置隐私保护场景中.用户进行位置连续查询时,会引起噪声叠加导致查询精度下降,目前基于规则树结构的差分隐私虽然能降低
推荐系统本质上是一种信息检索工具,它检索出有用信息并推荐给特定的用户.组推荐系统通过不同的融合策略融合群组偏好,支持群组用户访问当前的热门兴趣点.传统组推荐模型没有
在不确定数据流聚类算法的研究中,位置不确定性是一种新的不确定数据类型.已有的不确定数据模型不能很好地描述和处理位置不确定数据.鉴于此,在提出基于联系数的位置不确定数