基于自然语言理解的车辆行驶指令抽取

来源 :北京邮电大学 | 被引量 : 6次 | 上传用户:leisiyue520zh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
车辆行驶指令抽取是从非结构化的车辆行驶描述文本中抽取出能够控制车辆行驶的结构化信息,是信息抽取在车辆行驶领域的一个应用。对于一个车辆行驶文本,我们如果想从中抽取出能控制车辆行驶的结构化信息,如控制车辆行驶的方向,速度等,对这些描述车辆行驶信息的词或短语进行定位以及给它们打上属于自身语义的描述符成为关键。本文构建了一个基于自然语言处理的车辆行驶指令自动抽取系统VIAES (vehicle instruction automatic extraction system),该系统由四个模块组成:①语义分类模块:给指令文本中的每个词或短语打上属于自身语义类别的标签;②车辆行驶指令判别模块:对于用户输入的指令进行判别其是否和车辆行驶相关;③结构切分模块:将一个具有多个子指令的指令进行结构切分;④结构化模块:对一个语义分类序列用6个行车基本元素来表示。本文提出一种基于CRF、self-training与词典相结合的方法对车辆行驶文本进行语义分类。实验结果表明,本文的方法能够有效的对车辆行驶文本进行语义分类,整体正确率为92.8432%,并且本文的方法有很好的可移植性。根据得到的语义分类序列,本文利用多种方法来检测一个文本是否是车辆行驶指令,实验结果表明高斯混合模型(GMM)有更好的检测性能。一个用自然语言描述的车辆行驶指令可能是由多个子指令组成,如:“车辆向前行驶500米右转”,其由两个指令组成。结构1为:“向前行驶500米”,结构2为:“右转”。本文把结构切分看做一个序列标注问题.CRF可以有效的解决序列标注问题,利用CRF来对语义分类序列进行结构切分,实验结果表明结构切分标记准确率达到96.89%。结构化模块包含两个部分,一个是起止位置识别,如“从蓟门桥向前行驶到知春路”其中“蓟门桥”是起始点,“知春路”是终止点。本文采用标签传播算法来实现起止位置识别。实验表明其准确率达到92.78%。另一个是结构化,即把一个语义分类序列(起止位置识别后)用6个行车基本元素来表示。6个元素分别是:起始点、速度、距离、方向、动作、终止点。本文构建的车辆行驶指令自动抽取系统VIAES是自然语言处理在人机交互领域的一个具体应用,是走向智能驾驶的一个探索。VIAES系统的整体准确率为89.7%。
其他文献
探空火箭发射后,通过数传系统地面接收到大量的试验数据,它们具有巨大的科学研究和应用分析价值。本文的目的是设计有效组织管理数据、为数据提供统一回放平台的方法,以方便利用
随着科技的飞速发展,计算机技术已经被应用到社会生活的各个领域。教育作为科教兴国战略的核心内容,是现代社会生活的重要组成部分,同样受到计算机技术的深刻影响。数据结构课程
长期以来,软件开发过程都是基于文件系统构建起来的,在基于文件系统的软件开发方式下,代码、代码相关信息、文档都是以文件形式存储,软件开发活动都是围绕源代码、文档、可执行程
随着Web2.0的快速发展,社交网络已经成为网民上网所花时间最多的应用类型,随之催生了一种新型的营销方式,社交媒体营销。如今,社交媒体营销对于企业的重要性越来越突显出来,特别对
随着成象技术和计算机图象处理技术的发展,成象自动导引技术在当代导弹系统中表现出来越来越明显的优势.利用景象匹配技术的成象制导武器系统,具有抗干扰能力强、命中精度高
近年来,随着互联网的蓬勃发展,网络化的产品越来越多,大量的用户可以直接通过网络对这些产品进行评论。以Android系统为代表的安卓软件已经成为网络化产品的发展热点。安卓软件
学位
少数民族“双语”教学是国家提高少数民族教育质量、提升各民族综合素质、促进社会经济发展、保障社会稳定的长期重要举措。然而双语教学中存在的教师队伍数量缺、汉语言能力
图像融合是以图像数据为对象的信息融合,运用图像处理和计算机技术,将初始图像数据加以分析,最大限度地提取各个初始图像数据的有利信息,并将这些有利信息汇集到一幅图像中去
可燃气体探测器性能检验装置在对可燃气体探测器的行业监督检验中发挥着重要的作用.在消防电子产品质量监督检验工作中也具有举足轻重的地位.面对电子技术和控制理论的飞速发