基于机器学习的自然语言处理和传输技术的研究

来源 :东南大学 | 被引量 : 0次 | 上传用户：mirrorwxj

【摘要】

：

随着信息技术的高速发展,各种服务和应用软件不断涌现,人们日益普遍地使用计算机来完成日常生活中的任务。然而,缺乏计算机科学方面的专业知识,使得非专业人士难以与系统交互

【作者】

：

方兰婷

【出处】

：

东南大学

【发表日期】

：

2018年01期

【关键词】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着信息技术的高速发展,各种服务和应用软件不断涌现,人们日益普遍地使用计算机来完成日常生活中的任务。然而,缺乏计算机科学方面的专业知识,使得非专业人士难以与系统交互并获得有用的信息。因此,自然语言处理作为一种可以使计算机分析与理解人类语言的方法吸引了来自世界各地研究人员的兴趣。本文以机器学习为核心,在自然语言的处理和传输两个领域开展研究。在自然语言处理中,首先探索了一种通用的生成词向量的技术,即集成词嵌入,通过集成已有词嵌入向量集和语义知识库来生成一种更高质量的词嵌入向量集。进而,探索了两种特定的自然语言处理任务:在线学习中的语法问题检索技术和个性化推荐技术,分别提出基于模糊树匹配的检索方法和基于内容的推荐方法。其中,集成词嵌入均作为辅助技术可以进一步改善检索和推荐结果。在自然语言传输中,探索了基于深度学习的物理层传输技术。具体研究内容包括4个方面:首先,研究了集成不同词嵌入向量集和语义知识库的方法。现有的方法大多根据大型语料库中的词分布信息学习得到词嵌入向量集。这种方法虽然可以得到语料库中包含的语义信息,但忽略了包含在语义知识库中有价值的信息,例如ConceptNet。而且,不同词嵌入向量集在质量和捕获信息特性等方面差异很大。因此,我们提出了一种从多种开源词嵌入向量集和语义知识库中集成学习更高质量的词嵌入向量集的方法。同单个词嵌入学习方法和未融入语义知识库的集成方法相比,所提集成方法在多个自然语言处理的标准评估任务中都展现了更好的结果,例如词相似任务和词类比任务。其次,研究了面向语法问题的检索方法。在给定一个查询语法问题时,找到相似语法知识点的问题。由于语法问题的检索目标和常规信息检索问题不同,现有的统计分析和语法分析方法不适用于语法问题的检索任务。因此,我们提出了一种基于树匹配的方法用于检索语法问题。首先,提出了一种新的parse-key树结构,用来捕获语法问题的语法信息。然后,提出了两个核函数来计算parse-key树之间的相似度,即模糊树核函数和POS排序核函数。此外,我们还提出了词嵌入相似度、词性相似度和文本相似度,用于进一步提高检索准确度。再次,研究了个性化语法资料推荐方法。根据用户的个人选择和语法资料的特征,个性化推荐适用于他的语法资料。由于现有的推荐方法不适用于语法资料的推荐任务,我们提出了一种高效的基于语法特征提取的推荐方法。首先,提出了统计类、词性类、语法关系类和词嵌入类4个类型的语法资料特征。然后,基于所提特征,我们使用标准线性模型完成推荐。就我们所知,我们的工作是第一个提出针对语法问题的推荐方法。实验结果表明,所提推荐方法在准确度和效率上均取得了很好的表现。最后,研究了基于深度学习的自然语言传输方法。传统的块状通信结构在复杂场景下难以求解最优值且计算复杂度高。本文提出了一种端到端的自然语言传输方法。同传统的通信系统单个处理每一个模块不同,本文将整个通信系统当成一个编码器和一个解码器。实验结果表明,所提方法可以由数据驱动来学习未知信道模型的最佳解决方案。

其他文献

蜜柑大实蝇在中国的适生性研究

蜜柑大实蝇Bactrocera（Tetradacus）tsuneonis（Miyake）是重要的检疫性有害生物，危害柑橘类作物。本研究在中国748气象站点的气象数据和蜜柑大实蝇生物学数据的基础上综合运用CLIMEX

期刊

蜜柑大实蝇适生性CLIMEXArcGIS

既有住区适应老年人建筑更新改造设计探索

我国当前已经进入到老龄化的发展行列,其中老年人的建筑更新改造设计的工作就显得比较重要,对既有住区适应老年人的建筑优化改造,是满足实际发展需求的重要保障工作.基于此,

期刊

既有住区老年人建筑更新改造设计

我爱您,伟大的祖国

<正>我游过祖国秀美壮丽的山川大河,也逛过祖国辽阔的北海南疆,长城内外,大河上下,雪域高原,无一不使人留连忘返,魂牵梦绕。它使我真正认识了祖国,由衷地热爱祖国。每当我捧

期刊

我的祖国圆明园

宫腔镜在子宫内膜息肉诊治中的应用

目的:探究宫腔镜在子宫内膜息肉诊治中的治疗效果。方法:选择梅州市人民医院妇科在2016年1月至2016年7月收治的100例子宫内膜息肉患者为研究对象,将患者分为两组,其中50例患

期刊

宫腔镜子宫内膜息肉宫腔诊刮术

新型农村养老保险筹资研究

社会保障制度是体现社会公平、构建和谐社会、保持社会稳定的重要方面。社会保障的缴款模式是社会保障制度能够稳定和持续实行的关键。无论是过去、现在还是未来,资金来源和

学位

新型农村养老保险社会保障税一国两税税费分征

乒乓球正手拉弧圈球技术的教学与训练研究

弧圈球技术已经成为乒乓球运动中攻击力最强、稳定性最好的一项进攻性主流技术，是乒乓球旋转、速度与力量不断融合的结果，是最符合乒乓球运动规律的一项技术。正确认识弧圈球的

期刊

乒乓球拉弧圈球教学训练

基于条码技术的秦皇岛大樱桃冷链供应链追溯研究

<正>基于条码技术记录大樱桃从种植、采摘、加工、仓储、包装、运输、销售等供应链环节的数据,建立追溯信息数据库,一旦发现问题,能够根据数据库信息溯源进行有效的控制和召

期刊

大樱桃供应链秦皇岛气调库条码技术

《中国城池史》

<正>出版社:中国友谊出版公司出版时间:2015年9月装帧:平装开本:16开定价:48.00元【内容简介】多年以来,我国学者在城池建设方面的论著不多,专著也甚少。留传下来的凤毛麟角,

期刊

《中国城池史》

灾害问题的经济学分析

从经济学角度探讨灾害问题,能够揭示灾害发生与发展的规律,从而为制定各种防范与控制灾害的经济方法和手段,为经济的可持续发展提供理论上的依据。本文从灾害的本质出发,揭示

学位

灾害经济学经济增长灾害风险

毛毛竹秆茎高生长的发育解剖研究

采用光学显微镜技术,对竹类植物高生长的发育过程进行了研究,研究结果如下:1、竹类植物的高生长分为地下发育和地上发育两个阶段。2、竹类植物高生长的地下发育阶段主要是由

学位

初生生长次生生长居间分生组织次生分生组织短细胞原始细胞

基于机器学习的自然语言处理和传输技术的研究

与本文相关的学术论文