融合k均值聚类与LSTM网络的半监督词义消歧

来源 :西安电子科技大学学报(自然科学版) | 被引量 : 0次 | 上传用户:LKYWGF
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
一词多义是自然语言所固有的特性.词义消歧是根据上下文来确定歧义词汇的含义,是自然语言处理领域中的一项关键技术.目前,词义消歧被广泛地应用于机器翻译、信息检索和文本分类之中.为了提高词义消歧的准确率,提出了一种结合k均值聚类与长短期记忆网络的半监督词义消歧方法.以歧义词汇为中心,选取左右两个邻接词汇单元,形成大小为4的词窗.从词窗中选取词形和语义类作为聚类特征,利用k均值聚类方法对无标注语料进行聚类.将聚类得到的语料加入SemEval-2007:Task#5的训练语料中,以扩充训练语料的规模.从词窗中选取词形、词性、语义类、英文译文和消歧距离作为消歧特征,使用长短期记忆网络来确定歧义词汇的语义类别.利用扩充后的训练语料来优化长短期记忆网络的参数.使用SemEval-2007:Task#5的测试语料对词义消歧分类器进行测试.通过实验分析了隐藏层数和训练语料规模对词义消歧的影响.实验结果表明:相对于贝叶斯分类器和深度信念网络而言,所提出的方法能够提高词义消歧的准确率.
其他文献
研究了胶料牌号、用量及硫化体系对高硬度EPDM混炼胶配方性能的影响.结果 表明,以低门尼粘度、宽相对分子质量分布的EPDM为生胶,获得的高硬度EPDM混炼胶的加工性能和力学性能较好;与目前常用的高硬度EPDM配方相比,大填充混炼胶在性能和成本控制方面均有较大优势,混炼胶硫化加工性能优异,吃料快,出片光滑柔软,便于硫化;在填充量相同的情况下,采用硫黄硫化体系可以获得较高的硬度和较好的硫化性能.
对轨道交通用轴箱弹簧制造过程中常见的气泡质量缺陷进行了分类及原因分析,并提出了相应的解决措施.应用硫化仿真技术优化注、排胶系统,提升混炼胶门尼粘度,强化生产过程控制,优化硫化成型方式等系列措施,有效解决了轴箱弹簧气泡的质量缺陷,提升了产品质量.
综述了核壳吸波填料的制备方法、多层结构、核壳形状以及核壳吸波填料/聚合物复合材料的吸波性能,并展望了核壳吸波填料的发展方向.
随着当今便携式消费电子产业的迅速发展,对DC/DC变换器的要求越来越严苛,单一集中式电源供电很难满足对多路输出参数的需求.本文基于LTC3855芯片,提出一种双通道同步降压DC/DC变换器设计方案,并进行了原理验证.双通道变换器采用buck拓扑结构,输出采用双MOS构成的推挽结构,具有突发、连续、脉冲跳跃三种工作模式可以选择.该设计具有结构紧凑、工作稳定、效率高、功率密度大等特点,设计原理经过验证,设计方案具备一定的普适性,可作为负载点电源进行推广使用.
交通拥挤会影响常规公交线路行程时间的可靠性,给公交运营以及居民出行带来不便.针对这一问题,提出了可靠指数、可靠度来评价常规公交线路行程时间可靠性,并以上海市为例,基于GPS数据分析了线路和运行信息与行程时间可靠性间的关联,构建了逻辑回归模型进行定量分析.结果表明:站点数目、行程时间、运行时段、是否工作日以及公交通过的区域类型对可靠度有显著影响.当站点数与21差距的绝对值越小,当行程时间与3886 s相差越大,可靠性越高.
1553B总线作为一种复杂的通讯协议,若要单纯采用硬件描述语言Verilog去实现它,会产生巨大的工作量,为克服这一问题,提出一种基于NiosⅡ嵌入式软核处理器的设计方案.设计采用现有的IP外设模块快速搭建硬件系统,详细探讨了控制器和BU61580接口、SOPC硬件系统及PCB板图的设计考量;软件应用程序在IDE开发环境下设计实现,完成具有BC、RT功能的1553B总线系统开发.通过仿真测试板卡对系统进行功能测试,实验表明测试结果准确无误,设计上的合理性得到充分验证.
以某款带有百年日历、可编程时钟输出、夏令时、闹钟报警等功能的时钟模块为研究对象,为快速获得该时钟的逻辑完整性与正确性的判定,设计一种带有涓流充电的RTC验证方法.通过对预设功能的解析、归纳和梳理,将实时时钟、日历、定时闹钟,以及月末日期调整、闰年补偿等功能拆分成独立模块,根据各自特点,依靠相应的中断机制,以跳点变化为切入点,把遍历与跳越两种方式有机结合.为验证方法的严谨性,通过SPICE进行功能仿真,同时针对样品设计了一套验证板和控制软件.经验证该方法可满足预期,可为相关项目研发提供技术支持与保障.
全聚焦超声对曲面构件表面轮廓成像时存在伪像干扰及轮廓信息缺失问题,导致轮廓提取误差较大.本文选取有机玻璃加工了3个正弦曲面试块,进行全聚焦成像.综合考虑TFM伪像成因和曲面构件的声束传播特征,针对发射阵元进行指向性函数校准,消除了曲面构件轮廓成像中存在的伪像,改善了全聚焦成像质量.对曲率较大且缺少有效轮廓信息的区域,结合线性插值函数拟合出表面轮廓,提升曲面轮廓提取准确度,使表面轮廓重建平均误差减小0.36mm~0.55mm,最大误差减小3.76mm~4.8mm.
近期新冠肺炎疫情在全国多地高发,党中央国务院对此轮疫情的频发高度重视.最近,中共中央政治局常委召开会议,分析新冠肺炎疫情形势,部署从严抓好疫情防控工作.
针对智能优化算法在具有最小旁瓣电平和零陷深度的均匀激励非周期直线阵列零陷综合中存在收敛速度慢及易于陷入局部最优的问题,提出了一种基于改进郊狼算法的直线阵列综合.该算法在郊狼算法的基础上,提出次优个体变异策略和全局最优组内引导策略.在次优个体中引入Hybrid映射扰动,小范围内发生变异,提高种群多样性,扩大搜索范围;构建一种新型的成长方式,提出全局最优组内引导策略,使算法更快地接近全局最优解,提高局部搜索能力并加快收敛速度.仿真结果显示,改进后的郊狼算法较原郊狼算法收敛速度明显加快,与遗传算法、布谷鸟算法、