基于本体的食品投诉文本危害信息抽取研究

被引量 : 3次 | 上传用户:ryan1114
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
食品安全问题是关系到人民健康和国计民生的重大问题。近年来,例如“三聚氰胺奶粉事件”的发生使得人们对食品安全问题的关注程度进一步提高。食品安全问题的发生不仅使我国在经济上受到严重损害,还会影响到消费者对政府的信任乃至威胁社会稳定和国家安全。食品投诉文本危害信息抽取能够有效的弥补食品检测技术“不能够”和“不全面”的问题,其智能的信息化处理是食品安全问题网络化监督的重要凭仗。本文在传统基于本体的信息抽取模型基础上提出了基于本体的食品投诉文本危害信息抽取模型。能够准确的抽取出投诉文本中的危害信息,并能够对危害信息的语义进行推理,而且能够利用抽取出的危害信息完善本体,确保本体的实时性,对我国食品安全问题起到积极作用。基于本体的食品投诉文本危害信息抽取模型由三个主要的模块组成,分别是学习模块、抽取模块和扩展模块。学习模块主要完成种子词的生成及种子相关词的生成,为后续投诉文本危害信息的抽取和推理起到铺垫作用;抽取模块主要完成食品投诉文本危害信息的抽取,其中包括三种信息的抽取,分别是背景知识、否定词汇和危害信息,三种信息的有效整合不仅能够解决传统信息抽取易产生信息碎片的问题,更重要的是让消费者对食品危害有全面的把握;研究发现,在抽取模块的执行过程中存在背景知识但是不存在危害信息的投诉文本反应的往往是最新发生的食品危害,这些危害信息在本体中没有很好的体现出,因此扩展模块利用词汇链技术抽取出这些危害信息,并将危害信息用于扩充本体,使得本体能够保持很好的实时性。
其他文献
三峡大坝自建成以来,面临的首要难题是对库区水质的监测和控制,由于三峡库区覆盖面积大,污染源多,监测点分散,使得原有的监测方式和数据信息管理手段不能满足应用需求。针对这一重
语言是人类文明和发展的产物,它直接反映着人类活动与社会发展状况。各国在政治、经济、文化等方面的联系使得语言频繁接触,并带来语音、句法等社会语言学形式的变化。语码转换
目前发达国家对发展中国家的出口贸易广泛实施技术性贸易壁垒。由于我国的标准化工作及其法制建设滞后 ,技术力量薄弱 ,已制约了经济技术发展。在入世之后 ,我国完善标准化法
产业集群的核心是指在一定空间范围内产业的高集中度,这种组织形式不但降低集群中企业的生产成本,同时,产业集群的规模经济效益、产业和企业的市场竞争力也被提高。然而,伴随着产
香菇是我国久负盛名的珍贵食用菌,是食、药兼用的大型真菌,是一种高蛋白、低脂肪的营养食品。保康是我国生态环境的第一县生产,其生产的香菇以独特的口感、香味和过硬的品质闻名
目的探讨单独与联合应用X线摄影及超声检查对于先天性髋关节发育不良的诊断价值。方法收集52例经临床确诊的先天性髋关节发育不良病例,回顾性分析经单独采用X线或超声检查以
京、津、沪、渝4个直辖市经济发展存在差距,产业结构优劣是重要原因之一.采用产业结构信息熵定量分析了4个城市产业结构的动态变化,并进一步采用四分量偏离—份额分析法,评价
牛顿-莱布尼茨公式是微积分的核心内容,它为定积分的计算提供了一个有效的方法 .但由于定理的条件要求较高,这对定积分的计算产生一定约束.首先对牛顿-莱布尼茨公式作了一些
随着4G移动技术的发展和普及,越来越多的电视台利用4G移动网络进行电视直播。本文介绍了广东广播电视台的新闻信号调度系统,该系统主要用于4G信号调度,探讨如何更合理高效地
随着电子元件和通信等方面技术的快速发展,无线传感器网络如今已经广泛应用于环境监测、交通监控、森林防火等诸多领域。异常检测作为无线传感器网络的重要应用之一,受到越来