融入集成卷积和注意力的民航业务实体识别

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:jingcheng0417
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过识别机场的业务实体能够帮助管理者在网络舆情中快速定位服务中的痛点问题.旅客评价中存在较多的复杂实体并伴随有数据类别失衡的现象,针对此提出融入集成卷积(E-CNN)和注意力机制(Attention)的实体识别方法.主要利用人工标注和半监督思想结合的方法获取旅客评价的数据集,通过ECNN获取多范围的文本特征信息,由双向长短期记忆网络(BLSTM)获取文本的长依赖特征,使用Attention机制克服数据类别不平衡的缺点.实验结果表明,提出的方法能有效识别民航业务实体,F1值超过其它所对比的模型.
其他文献
针对彩色图像在加密过程中数据量大、相邻像素相关性强及冗余度高等缺陷,提出基于新四维超混沌的彩色图像加密算法.利用混沌性能更好的四维超混沌系统与反向传播神经网络结合进行序列融合运算,生成伪随机性更好的融合序列作为密钥流;利用密钥流对彩色图像像素块进行位置置乱及像素扩散运算,得到最终的密文图像.仿真计算结果表明,该加密算法具有良好的安全性及抗攻击能力.
为有效解决HDFS面对多类型的海量小文件存在存储效率与检索速率低下的问题,构建一种基于EHDFS架构的存取方案.存储阶段,引入最优化策略,建立新的合并存储模型,使小文件最大化填满且均匀分布于Block,提高DataNode空间利用,降低NameNode内存开销.检索阶段,改进MapFile映射关系结构、索引存储位置与组成元素以建立新的文件索引模型,避免跨跃式文件搜索,实现小文件的集中检索.实验结果表明,对比多种大数据存储模型,在不同数据量的分组压力测试下,该方案有效提高了HDFS的存取效率.
为解决传统核极限学习机算法参数优化困难的问题,提高分类准确度,提出一种改进贝叶斯优化的核极限学习机算法.用樽海鞘群设计贝叶斯优化框架中获取函数的下置信界策略,提高算法的局部搜索能力和寻优能力;用这种改进的贝叶斯优化算法对核极限学习机的参数进行寻优,用最优参数构造核极限学习机分类器.在UCI真实数据集上进行仿真实验,实验结果表明,相比传统贝叶斯优化算法,所提算法能提升核极限学习机的分类精度,相较其它优化算法,所提算法可行有效.
针对睡眠分期中样本不平衡问题,提出以最短路径为指标选取最优数据进行数据生成的思想,增加少数类样本的数量.基于Border-SMOTE算法,提出改进的iBorder-SMOTE睡眠数据生成算法.用密度峰值聚类算法确定待生成数据的簇类别区域,采用中心最短路径选取最优数据点进行数据生成,使用异变扰动方法对生成数据进行修正,保证数据的全局分布.在数据集Sleep-EDF上进行验证,其结果表明,改进后的算法有效提高了少数类样本的识别精度.
为解决类不平衡和样本重叠问题,提出一种基于分层欠采样和Bi-GRU的恶意行为检测模型(SSU-BG).数据预处理及特征模型的构建;基于欧氏距离算法统计出高频样本的最高密度点及类内平均距离,根据样本分布特点将高频类样本依次划分为稀疏区、稀疏区边界区及稠密区3个区域,根据抽取出样本标签数在稠密区内划分出不同层次圆环,计算每个类的不均衡度,计算其均值作为整个样本的采样比例,按照此时的采样比例在稀疏区边界区的圆环域和稠密区进行分层随机欠采样;将文本向量输入训练好的Bi-GRU模型中.实验结果表明,该模型改善了整体
针对资源受限的移动边缘计算(MEC)卸载问题,提出一种基于遗传算法优化的卸载决策与计算资源分配方法(GAO).建立联合时延、能耗以及卸载费用的系统卸载效益模型,提出最小资源分配阈值;引入改进的遗传算法求解效益最大化问题,针对该问题提出一种两段式的染色体结构和遗传算子.进行仿真实验,对比分析随机卸载决策与平均计算资源分配、全部卸载决策与随机计算资源分配等4种策略,GAO均优于其它策略,提高了系统卸载效益.进行灵敏度分析,该方法在设备数量、传输功率等参数下均具有较好的性能.
为进一步提高随机森林算法分类准确率,提出一种基于决策边界的倾斜森林(oblique forests based on decision boundary,OFDB)分类算法.将决策边界与自适应权重融入随机森林算法框架,采用决策边界作为分裂准则,使原本垂直于数据空间的分裂准则变为倾斜的超平面,有效提高算法对数据空间结构的适应能力.自适应权重改进叶子结点类标号计算方法,有效提高算法对不平衡数据的分类能力.实验结果表明,该算法与随机森林算法相比具有更高的分类准确率与较好的不平衡数据分类能力.
针对KCF算法在跟踪过程中面对复杂场景、尺度变化等问题效果欠佳的问题,提出一个采用KCF跟踪器的特征融合的尺度自适应核相关跟踪算法.提出一种方向梯度直方图和颜色直方图特征的特征融合方法;采用一种含有7个固定尺度因子的尺度池,采用响应最大的尺度更新当下尺度;使用平均相关峰值能量作为模板更新的指标,控制响应更新.将改进算法在OTB-100数据集中与近年来流行跟踪算法进行对比实验,实验结果表明,改进算法在性能上较KCF算法在精度和成功率上分别提高了10.3%和16.3%,可实现目标的鲁棒性跟踪.
为降低厂家因瓶装酒瑕疵带来的不必要损失,提出一种改进的Cascade R-CNN算法模型,对酒瓶瑕疵进行检测.采用基于聚类算法的Anchor生成策略,将多尺度预测的骨干网络用作特征提取,使用感兴趣对齐层取代原先的感兴趣池化层.将改进的模型与其它基于Faster R-CNN和Cascade R-CNN的酒瓶瑕疵检测模型做消融实验,实验结果表明,该模型能够更加准确识别和定位出多类酒瓶瑕疵情况.在检测速度方面虽然略逊于其它模型,但模型检测的准确度达到了79.6%,远高于其它模型.
针对在数据量动态增加的场景下现有的排序算法管理数据导致算法性能大大降低的问题,提出一种16-bit Trie树排序算法.借助邻居节点上存储的链节点指针完成排序,它不仅可以边构建边排序,且引入动态数组可以提高该算法的空间效率.仿真结果表明,传统Trie树支持数据动态更新,但通过遍历Trie树的方式完成排序耗时较多,快速排序算法在数据动态增加时效率低,16-bit Trie树排序算法支持数据动态更新,排序时间明显少于传统Trie树,优于快速排序,这表明16-bit Trie树排序算法在处理海量动态数据时具有突