基于HMM的文本信息抽取方法

来源 :中国人工智能学会第10届全国学术年会 | 被引量 : 0次 | 上传用户:fjtv55
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的文本信息抽取方法有两种:知识工程方法和自动训练方法。前者需要对领域知识很熟悉的知识工程师的参与,而且需要大量的工作来发现有用的规则(或模式):而后者的劣势在于需要大量的训练语料才能达到很好的性能。本文结合这两种方法,提出了一种基于HMM,采用加入规则方法和引入平滑技术的半结构化文本信息抽取方法,该方法仅需要知识工程师的少量参与,而且可以显著地提高信息抽取系统的性能,尤其是在可用的训练语料较少的情况下更有优越性。
其他文献
本文对可拓推理进行了研究。依据基元的可拓性和基元变换的传导性,研究基元拓展推理和基元变换的传导推理,并用类似的方法研究复合元变换的传导推理。利用物的共轭性,探讨物元的共轭推理。基元拓展推理、基元变换的传导推理、复合元变换的传导推理和共轭推理统称为可拓推理。
个性化推荐系统采用知识发现技术给用户提供准确、合理的信息从而赢得客户。基于用户群组特征的推荐方式是应用最广也是最成功的一种方式。但是算法的复杂度随着用户数量的增加而急剧增长,因此在实际的应用中,面对着数以万计的用户,服务系统要承担大负荷的计算量,从而导致推荐效率的下降。本文提出了一种基于特征项的推荐算法来解决基于用户的推荐算法所面临的可扩展性差的问题。实验表明,使用基于特征项的推荐算法能够在提高推
本文针对HIT-Ⅳ型双足步行机器人的结构特点,给出了—种融合几何方法和解析方法的新的逆运动学算法。这种算法可提高运算速度和准确性,并有效地消除了多解情况。文章介绍了双足机器人步态规划的主要步骤、算法和—种步态规划的仿真结果。
本文对智能运输中匝道测控的各种因素进行分析,建立了匝道测控的监测策略的因素空间,给出了基于因素空间分析的匝道测控预测模型,并用实例说明,该模型具有较理想的结果。
智能技术是多通道、多媒体用户界面的核心。本文讨论了智能用户界面的主要技术,包括多通道输入、多通道输出、交互管理和交互模型、智能环境、基于智能体的交互等。本文结合一个移动导游系统实例重点分析了它的多通道输入、上下文感知技术和评估结果。
本文阐述了智能交通系统ITS在日本的起源发展和主要研究领域:导航系统、自动收费系统ETC、安全运行支援等的进展情况,以及今后几年内的发展规划和应用前景预测,及其对中国这方面研究工作的见解。
在网络环境下大数据量的半结构化数据模式发现和模式变化检测是关于半结构化数据研究的一个重要方向。本文在有向标记树的基础上,研究了半结构化数据的树状最大频繁模式挖掘问题,采用最右扩展枚举方法无重复枚举所有候选模式,利用频繁模式扩展森林实现高效剪枝扩展和挖掘频繁叶模式,从而高效挖掘树状最大频繁模式。此外通过改进模式变化检测到约束满足问题映射的方法来降低问题转换后的规模,从而可以利用CSP问题求解技术高效
本文利用可拓方法,研究对信息、知识和策略的评价和排序问题,以便于从大量的信息或知识中获取对自己有用的内容,并给出计算机实现的框图。其基本思想是利用可拓学的逻辑细胞——基元及其运算表达信息和知识,用变换表示策略,根据评价特征,建立可拓集合和关联函数,然后,计算信息、知识和策略对应的关联函数值,利用优度评价方法确定相应的优度,再按优度大小进行排序。
本研究利用可拓工程方法让撞球机械人拥有自动选择子球与球袋的能力,藉由影像的撷取与处理技术,找出球桌上所有球的位置,最后经由决策机制得到要打击那一个目标予球与进那个目标球袋,让撞球机械人顺利地将目标球撞进目标球袋中。可拓决策方法是藉由子球与母球的距离,子球与球袋的距离以及母球、子球与球袋的相对角度,自动找出一颗进球率最高的子球,从软件的仿真及实验结果得知,可拓方法所架构的决策思维,能够快速让撞球机械
集对分析(SPA)是一种元系统分析方法,自1989年提出以来已在多个学科多个领域显示出巨大的潜力和应用前景。本文在同时考虑最高决策者和有不同权威的多位专家意见、有不同重要性的多项评估指标情况下,用同异反理论推导出多个项目评估的一般模型,探讨运用SPA进行项目评估新方法,并作了该方法的稳定性分析,然后以具体实例证实其有效性、科学性和优越性。