基于HMM的文本信息抽取方法

来源 :中国人工智能学会第10届全国学术年会 | 被引量 : 0次 | 上传用户：fjtv55

【摘要】

：

传统的文本信息抽取方法有两种：知识工程方法和自动训练方法。前者需要对领域知识很熟悉的知识工程师的参与，而且需要大量的工作来发现有用的规则(或模式)：而后者的劣势在于需要大量的训练语料才能达到很好的性能。本文结合这两种方法，提出了一种基于HMM，采用加入规则方法和引入平滑技术的半结构化文本信息抽取方法，该方法仅需要知识工程师的少量参与，而且可以显著地提高信息抽取系统的性能，尤其是在可用的训练语料较少

【作者】

：

何清路斌史忠植

【机构】

：

中科院计算技术研究所智能信息处理重点实验室北京 100080 北京大学方正技术研究院北京 1

【出处】

：

中国人工智能学会第10届全国学术年会

【发表日期】

：

2003年3期

【关键词】

：

信息检索文本信息人工智能机器学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

可拓推理研究

本文对可拓推理进行了研究。依据基元的可拓性和基元变换的传导性，研究基元拓展推理和基元变换的传导推理，并用类似的方法研究复合元变换的传导推理。利用物的共轭性，探讨物元的共轭推理。基元拓展推理、基元变换的传导推理、复合元变换的传导推理和共轭推理统称为可拓推理。

会议

人工智能知识工程可拓变换可拓推理

基于特征项的个性化推荐服务模型

个性化推荐系统采用知识发现技术给用户提供准确、合理的信息从而赢得客户。基于用户群组特征的推荐方式是应用最广也是最成功的一种方式。但是算法的复杂度随着用户数量的增加而急剧增长，因此在实际的应用中，面对着数以万计的用户，服务系统要承担大负荷的计算量，从而导致推荐效率的下降。本文提出了一种基于特征项的推荐算法来解决基于用户的推荐算法所面临的可扩展性差的问题。实验表明，使用基于特征项的推荐算法能够在提高推

会议

信息检索数据挖掘个性化服务推荐算法

HIT-Ⅳ型智能仿人步行机器人步态规划研究

本文针对HIT-Ⅳ型双足步行机器人的结构特点，给出了—种融合几何方法和解析方法的新的逆运动学算法。这种算法可提高运算速度和准确性，并有效地消除了多解情况。文章介绍了双足机器人步态规划的主要步骤、算法和—种步态规划的仿真结果。

会议

智能机器人双足机器人步态规划逆运动学

匝道测控的因素空间分析

本文对智能运输中匝道测控的各种因素进行分析，建立了匝道测控的监测策略的因素空间，给出了基于因素空间分析的匝道测控预测模型，并用实例说明，该模型具有较理想的结果。

会议

智能运输匝道测控因素空间预测模型

智能用户界面、主要技术及实例

智能技术是多通道、多媒体用户界面的核心。本文讨论了智能用户界面的主要技术，包括多通道输入、多通道输出、交互管理和交互模型、智能环境、基于智能体的交互等。本文结合一个移动导游系统实例重点分析了它的多通道输入、上下文感知技术和评估结果。

会议

智能技术智能用户界面人机交互多通道输入上下文感知

ITS在日本的研究动态

本文阐述了智能交通系统ITS在日本的起源发展和主要研究领域：导航系统、自动收费系统ETC、安全运行支援等的进展情况，以及今后几年内的发展规划和应用前景预测，及其对中国这方面研究工作的见解。

会议

城市交通交通控制智能交通计算机技术

基于树状模式的半结构化数据的模式发现和模式变化检测问题的研究

在网络环境下大数据量的半结构化数据模式发现和模式变化检测是关于半结构化数据研究的一个重要方向。本文在有向标记树的基础上，研究了半结构化数据的树状最大频繁模式挖掘问题，采用最右扩展枚举方法无重复枚举所有候选模式，利用频繁模式扩展森林实现高效剪枝扩展和挖掘频繁叶模式，从而高效挖掘树状最大频繁模式。此外通过改进模式变化检测到约束满足问题映射的方法来降低问题转换后的规模，从而可以利用CSP问题求解技术高效

会议

计算机网络信息检索数据结构数据挖掘

对信息、知识和策略的评价与排序

本文利用可拓方法，研究对信息、知识和策略的评价和排序问题，以便于从大量的信息或知识中获取对自己有用的内容，并给出计算机实现的框图。其基本思想是利用可拓学的逻辑细胞——基元及其运算表达信息和知识，用变换表示策略，根据评价特征，建立可拓集合和关联函数，然后，计算信息、知识和策略对应的关联函数值，利用优度评价方法确定相应的优度，再按优度大小进行排序。

会议

人工智能知识工程基元排序可拓变换

可拓理论在撞球机械人球袋选择之应用

本研究利用可拓工程方法让撞球机械人拥有自动选择子球与球袋的能力，藉由影像的撷取与处理技术，找出球桌上所有球的位置，最后经由决策机制得到要打击那一个目标予球与进那个目标球袋，让撞球机械人顺利地将目标球撞进目标球袋中。可拓决策方法是藉由子球与母球的距离，子球与球袋的距离以及母球、子球与球袋的相对角度，自动找出一颗进球率最高的子球，从软件的仿真及实验结果得知，可拓方法所架构的决策思维，能够快速让撞球机械

会议

智能机器人人工智能知识工程可拓决策

基于集对分析的项目评估

集对分析(SPA)是一种元系统分析方法，自1989年提出以来已在多个学科多个领域显示出巨大的潜力和应用前景。本文在同时考虑最高决策者和有不同权威的多位专家意见、有不同重要性的多项评估指标情况下，用同异反理论推导出多个项目评估的一般模型，探讨运用SPA进行项目评估新方法，并作了该方法的稳定性分析，然后以具体实例证实其有效性、科学性和优越性。

会议

项目评估集对分析元系统分析同异反分析

基于HMM的文本信息抽取方法

与本文相关的学术论文