基于卷积神经网络与SVM分类器的隐喻识别

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:zhz_8512
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
【目的】针对中英文的隐喻数据集,提出一种基于卷积神经网络与SVM分类器的隐喻识别方法。【方法】将实验数据向量化,结合词性特征和关键词特征作为卷积神经网络的输入,通过卷积层和池化层提取特征,应用SVM进行分类。针对卷积神经网络的池化层中特征采样的不完全性,提出将MaxPooling与Mean Pooling组合在一起的改进方法。【结果】相对于直接使用卷积神经网络,利用本文方法进行隐喻识别的准确率在英文动宾语料、英文形容词–名词词组语料和中文隐喻语料分别提高4.12%、0.84%和4.50%。【局限】中文分词不准确,影响词向量模型训练;卷积神经网络的层数过少,影响特征的完整性。【结论】根据中英文数据集上隐喻识别的结果分析,该方法在两个数据集上都取得了良好效果。
其他文献
基于ARDL-ECM模型,文章以1990~2011年的中美林产品贸易数据,从汇率水平和汇率波动水平两个维度实证考察人民币汇率变动对中美林产品贸易的影响。结果表明,人民币升值在短期和
我公司现有FA009型抓棉机4台,抓棉机臂长1650mm,且其中有两个装有23个抓棉刀盘、276个抓棉齿的抓棉打手。生产中发现,此抓棉机抓棉打手轴经常损坏,直接影响了正常生产和产品质量,
对病害预应力混凝土梁桥的正常使用状态进行评定时,各类因素的不确定性对评定结果具有重要的影响。针对病害预应力混凝土梁桥正常使用状态的评定方法展开研究,论文重点研究在
我国的戏曲博大精深,融汇了几千年的文化精华。民族歌剧的发展历经困难和创新,逐渐吸收了戏曲的艺术营养,形成了中国特色的民族歌剧。本文以我国歌剧代表之一的《党的女儿》
改革开放以来,我国经济发展越来越好,社会主义现代化建设事业也取得了显著的成果,近年来我国国民经济收入水平不断提升,逐步改善了人们的生活质量。人们在生活质量不断提高的
介绍了汽轮机转子温度场、热应力及寿命损耗的数学模型及实现其实时监测的方法,结合300 MW供热凝汽机组,对其寿命进行分析。
对12个烟草品种分别提取DNA并用OPA、OPG、OPJ、OPK、OPL、OPM、OPN共7组140个引物进行扩增,其中113个引物能有效扩增,113个引物共产生788条不同分子量的谱带,但不同烟草品种
1<水泥工业大气污染物排放标准>(GB4915-2004)对原标准修订的主要内容1.1扩大了适用范围标准适用范围扩大至水泥工业生产全过程:不仅包括水泥制造(含粉磨站),还包括矿山开采
目的考察pH值及温度对注射用奥关拉唑钠溶液质量和颜色的影响。方法采用高效液相色谱法(HPLC法),在不同时间、不同温度、不同pH值备件下测定溶液中奥关拉唑的含量;测定溶液的pH值