基于深度学习的海运邮件分类技术研究与应用

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:wang9230c
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着航运业的不断的发展,对信息技术的要求也日益增强,电子邮件通讯因为具有利用成本低、消息传递快捷等优势,已成为中国航运业业务交往的主要载体之一。目前海运邮件多标签分类技术大多是通过基于规范的方法进行,而由于规范的建立通常要求有关领域的专家或学者耗费大量时间对海运信件加以总结,而规范的建立往往更注重于文本中文字字面特征形式,并不能有效使用海运邮件文本上下文信息。所以,有必要采用基于深度学习的文本多标签分类技术,将同一业务类型的海运邮件进行多标签分类以便于进一步检索与利用,例如进行实体识别等任务。通过以上对海运邮件特点的分析,由此提出一种基于深度学习的海运邮件多标签分类的方法,并设计与实现了海运邮件多标签分类系统,具体研究内容如下:(1)构建 MLC-M(Multi-label classification of Marine Mail)模型。该方法不再只关注海运邮件中的词级语义信息,也考虑了海运邮件字符级语义信息,这一过程是通过在词向量表示层中引入CNN学习文本字符级特征完成的,最终将词级语义信息和字符级语义信息进行拼接完成海运邮件词向量表示;同时MLC-M模型中,在BiGRU模型的基础上融入自注意力机制,获取代表子空间的多维度和语义信息,并对不同的单词赋予不同权重来突出关键区域,重要的海运邮件文本信息赋予更大的权重。(2)对提出的MLC-M模型在海运邮件数据集上进行对比实验,并分析对比实验的结果。本文实验数据集选取海运邮件数据集,选取F1作为评价指标,分析实验结果,与传统多标签文本分类方法进行实验对比,MLC-M性能有一定的提升,验证了MLC-M模型在海运邮件多标签分类任务上的有效性。(3)设计并实现海运邮件多标签分类系统。该系统前端采用Vue框架,后端使用Python的Flask开发框架,包含邮箱管理、邮件获取、邮件分类、邮件管理、发件人管理五大功能模块,最终该系统通过测试,可以应用到海运物流公司,节省人力成本的同时提高海运物流公司的工作效率,在相对较短的时间内获得最重要的信息可以为海运物流公司在市场竞争中带来优势,同时也代表着可以为海运物流公司获取经济效益。
其他文献
报纸
动态网络的链路预测不仅有助于了解拓扑结构和网络功能之间的关系,还可以更好地了解网络的演化过程,已被广泛应用于金融网络数据分析、流感趋势预测等领域。然而,动态网络数据因随时间变化、节点相关性弱的特性导致其不容易同时提取结构和时间特征,进而影响链路预测效果;如何巧妙并有效地构造出一个高鲁棒性的动态链路预测模型是当下图链路预测领域所面临的最大难题;另外,人们常常只关注预测模型的构建而忽略了数据处理、模型
学位
<正> 夏某某,女,25岁,工人,初诊1989年3月9日。患者于本月3日晚突发高热(体温40.3℃),伴头痛头晕、恶寒泛恶、四肢冰冷等症经厂医务室、某医学院附属医院给于输液、抗生素、退热止痛药及激素治疗3天未效,又在市中西医结合医院输液及中药解表发汗剂治疗,热度一时下降,停药后又复上升,故来我院门诊。主诉高热已达6天。证见憎寒壮热,热后寒颤,日晡益甚,面色浮红,头昏重痛;胸脘痞闷,时时泛恶,身体困
期刊
轨迹数据中蕴含着大量具有实际应用价值的道路信息,这些信息直接或间接地描述了道路网的特征,利用轨迹数据能够实现道路的拟合和城市路网的提取。但精度、密度不一致的轨迹数据中存在着大量的离群点,严重影响了道路拟合的准确性,不利于路网的更新和城市的交通规划。本文以道路拟合为应用目的,以轨迹数据的离群点检测为预处理过程,提出了一种面向道路拟合的轨迹数据离群点检测方法,首先定义描述数据对象波动性的核密度变化因子
学位
在国际物流运输行业,海洋运输因为其具有运输量大、运费低、油耗少和对货物适应能力强等优势,一直是跨国物流运输中应用时间最久、最普遍的一类运输方式。有统计发现中国进出口货物中90%以上都是依靠海洋运输完成。国际间的航运物流主要通过英文邮件进行交流,往来邮件内容大多使用口语化的富文本来传递有用信息。在已知的航运邮件信息抽取发展过程中,首先完全由人工进行信息提取,然后发展为使用基于规则的方式进行提取并人工
学位
通过文献资料、逻辑分析和调研发现当前我国大学公共体育存在教学理念固化、教学模式守旧、教学方法缺乏创新、教学评价不够完善等问题。基于探索体教融合视阈下公共体育教师在教学实践中应有的理念变革和行动自觉,提出了知识传授和品格精神培育并重、教学模式和方法与评价不断改革创新等纾困策略,推动体教融合在新时代大学公共体育教学的落实。
期刊
定位技术的不断发展和对蕴含丰富知识价值的时空数据深入分析需求的增长,促使传统的空间信息服务逐渐转向时空数据服务,而时空数据的高效存储与查询可以为复杂时空数据服务场景提供决策响应和支持。现有大数据技术虽然在一定程度上能够解决时空数据的存储管理问题,但其对时空关联性并不敏感,无法有效处理具有时间连续性和空间邻近性的时空大数据。高效的时空索引既可以快速排除无关数据,又可以快速定位相关具体的时空对象,成为
学位
肝细胞癌中蛋白质稳态是其生长和转移的基础, Hsp90作为分子伴侣可维持多种促癌分子的稳定性,并抑制抑癌分子的活性,使蛋白质合成和降解之间保持平衡,致使癌细胞在恶劣微环境的持续刺激下依旧可以生存。然而, Hsp90抑制剂因在临床试验中表现出严重的不良反应,故迄今没有一种抑制剂获得FDA的批准。该篇文章阐述了Hsp90的结构、表达调控、伴侣循环以及Hsp90过表达与肝细胞癌之间的联系,旨在阐明Hsp
期刊
随着采集点云数据技术的日益发展,现实生产与生活中所能获取到的点云数据增长速度迅猛。点云数据由于其获取速度快、结构简单而又信息量大的特点,引发学者关注。同时,有关深度学习相关技术的发展以及卷积神经网络功能性逐步提升,将其应用到点云法向估计的工作愈来愈多。然而,如何在点云法向估计过程中保持模型细节特征并抵抗模型低质量因素的干扰仍然是具有挑战性的工作。现有工作设计多样化的网络架构实现端到端的估计结果,但
学位
乳腺癌已成为发病率最高的恶性肿瘤之一。热休克蛋白90(HSP90)被称为分子伴侣,其在合成多肽、控制蛋白数量、蛋白折叠、调控蛋白活性和蛋白降解过程中发挥重要作用。HSP90可调节细胞生长、粘附、侵袭、转移、血管生成和细胞凋亡等,在乳腺癌发展过程中起重要的作用。HSP90抑制剂在抵抗肿瘤生长和抑制侵袭方面发挥积极作用,成为一种新的治疗手段。本文就HSP90与乳腺癌的关系,以及HSP90抑制剂介导的乳
期刊