基于深度学习的双语词典构建方法研究

来源 :现代计算机 | 被引量 : 0次 | 上传用户:caojinhe1118
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双语词典的构建方法一直是人们研究的重要方向。随着近些年理论水平和硬件性能的不断发展,基于深度学习神经网络的算法,在各个研究领域都取得了很大的突破。本文利用爬虫技术从网络上爬取汉英双语语料,经过分词、去停用词、词形还原等处理后,通过神经网络训练汉英双语语料,得到双语词向量,进而构建出汉英双语词典。实验结果表明,该方法在构建双语词典方面具有良好的效果。
其他文献
针对传统图像处理技术提升数字图像视觉传达效果不佳的问题,文中提出基于图像处理技术的视觉传达优化方法。在HSV颜色空间内对低光照的图像进行增强,引入复小波变换(DT-CWT)来改进离散小波变换(DWT)由于位移不变性造成的方向性系数的不敏感。此外,该方法还根据人类视觉对于颜色感知的敏感度,对HSV空间中的V通道进行重建。在传统的多尺度Retinex(MSR)算法上进行改进,使用引导滤波器替代MSR中
针对大学生因性格、生活习惯不同而被室友孤立的问题,提出一种基于K-means算法的寝室分配方法。首先用调查问卷对学生的性格和生活习惯进行收集,然后根据同性别数据的相似性,使用K-means算法划分,并得到最为合适的边界条件,最后基于选定的条件来进行寝室分配。通过这种方式,寝室相处会更加和谐。
HDFS的默认副本放置策略较为简单,若随机选择的节点负载过重,会影响HDFS的文件写入速度。为改善这一问题,提出了一种基于KNN的副本放置策略模型KRPM(KNN Replica Placement Model)。该策略中,数据节点会将自身的特征通过心跳发送给名称节点,通过训练好的KNN回归模型对节点的写入速度进行预测。若随机选择的节点预测值小于集群的平均值,则重新随机选择,直到选择到符合条件的数据节点。实验表明,新的策略能够提高HDFS的文件写入性能。
27.5kV交联聚乙烯单芯电力电缆在我国高铁牵引供电系统中应用广泛。目前27.5kV高压电缆及附件故障率比较高,难以对电缆缺陷和故障准确定位以及实时监测,影响到牵引供电设施的安全运行。通过研究运用物联网技术、地理信息系统(GIS)技术、空间索引技术等信息技术,对电缆信息有效、实时、自动化的采集,采用数字化运维和智能化监控手段,实现对电缆全路径在线监测、故障判断和精准定位。
从供配电系统、智能化系统方面介绍了某大型医疗建筑电气设计,提出了若干现阶段医疗建筑电气绿色、节能设计的实用方案,以供电气设计人员对医疗建筑进行电气设计时参考。
随着微博平台的广泛流行,越来越多的新闻媒体通过微博发布新闻资讯。对微博新闻用户进行聚类研究,可以帮助新闻媒体结合自身特点,针对性发挥自身媒体作用,提供更好的内容推送。首先构建基于层次聚类法的微博新闻用户聚类模型,运用数据采集软件获取用户数据,再采用SPSS软件对其进行聚类分析和聚类结果的描述统计。根据聚类结果结合相关特征值的现实含义,将微博新闻用户分为三大类,并针对各类媒体特征提出指导建议。
HolliView产品页面采用Canvas绘制,Canvas是一个图形容器,为实现画面上元素特性的自动化组态及测试,首先需定位到画布上需要操作的元素,而Selenium的基本定位方式只能定位到该画布上,无法定位到画布上的具体元素,因此需要使用Selenium的JS注入的方式,通过插入JS脚本的方式获取所要操作的元素坐标,再使用ActionChains对应的鼠标动作去执行对应的操作。目前画面元素动态
以某研发办公大楼项目设计为例,分析了民用建筑低压直流配电不同电压的供电半径,确定了低压直流电压等级;对比了单极、双极母线架构的优缺点,选择了适合项目规模的双极母线架构;讨论了数据中心不同高压直流供电架构的效率与可靠性,并介绍了一种结合光伏发电的市电+光伏高压直流双路电源的数据中心供电方案。提出建筑内的储能蓄电池与传统UPS蓄电池不同,应主要关注蓄电池的循环寿命和消防安全性能,阐述了水系锌离子电池储能方案及直流充电桩配置选择,并给出了项目直流配电系统经济模式的运行策略。
近年来,随着各种便捷支付方式的普及,银行账户交易数据呈现爆炸式增长,同时数据模型也在不断变化,传统关系型数据库已难以满足这种海量的、模式灵活、高可用、高性能的数据存储和查询需求。通过对银行历史交易数据查询业务特点的分析,本文提出一种基于MongoDB数据库的银行海量历史交易数据查询解决方案,方案包括系统架构、数据模型、索引设计和分片键策略。实验表明,MongoDB能够实现海量的交易数据的存储和快速查询能力。
随着科学技术的快速发展,无人机因其作业方式机动灵活、功能多样化、成本较低、时效性好等优势在电力巡线、地图测绘、道路巡检、空气质量监测等领域得到广泛应用。同时,我国航空产业正处于高速发展阶段,对于飞机表面检查的工作要求越来越高,传统的目视检查、无损探伤等检测手段因其低效性、不安全性、精度差等问题已经不能满足航空产业的检测技术需求。针对上述问题,提出一种基于无人机航拍影像的多目标航前检查方法。对比多边形和兴趣点两种航迹规划手段,从建模质量、航测面积、飞行距离、飞行时间、照片数量等方面进行分析。研究结果表明,虽