基于元性质的数量型属性值自动提取系统的实现

来源 :第三届中国数据挖掘学术会议(CCDM2009) | 被引量 : 0次 | 上传用户:nihaonan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  实体属性值抽取是信息抽取的重要组成部分。针对数量型属性类型多样以及取值易变的问题,提出了一种基于元性质的数量型属性值自动抽取系统。对系统的结构、功能框架以及相关核心技术,包括提取文本的选择、候选值的提取及评估、结果的自动验证等进行了详细讨论。通过对百度百科的5大类9子类实体数量型属性值的抽取,平均准确率和召回率分别达到71%和89%,高于基于简单搜索的方法和传统的基于词汇-句模的方法。该方法适用于开放领域的数量型属性值获取,易于获取单值属性的精确取值。
其他文献
  在中文文本分类模型中提出了文本的KWP度量。在文本分类系统中SVM决策表上建立了CKWP约简方法,利用CKWP值标注训练集文本的方法改进了中文文本分类系统。
元素碘作为一种化学消毒剂的显著地位已经确立。与其它消毒剂相比元素碘具有抗菌谱最广,在极低浓度如百万分之0.5~2时仍具有极短杀菌时间。有效pH范围广(pH 5.0~9.0),不产生抗
  自动文摘是自然语言处理的一个分支研究领域。基于语义的自动文摘方法解决自动文摘处理中语言复杂性问题,在克服领域局限性的同时从本质上提高文摘的质量。常用语义模型包
  多词单位是由两个或多个单词组成的独立的语义单位。多词单位的发现和使用在词典编纂、语言翻译和信息检索等领域有着重要的作用。发现多词单位的主要途径是从语料库中进
会议
1.控氮幼苗期适当减少氮肥用量,以免植株生长幼嫩,抗寒力差。追肥要早,低温前不施速效氮肥,宜叶面喷施0.2%~0.3%磷酸二氢钾1~2次。2.施肥晴天用牛、猪粪或堆粪200-300担,施于菜蔸根际处,即可提高土温2-3℃。3.培
  随着语义网络技术的发展,本体不一致性问题成为本体联盟中的研究热点之一。根据研究方法与问题域的差异,出现了多种处理方法。其中基于模型诊断技术的本体不一致性处理方法
为了解某化工厂铅污染现状,我们于1988年进行了本调查,现报告如下。 1 材料与方法 1.1 生产环境监测选定丹粉、铬黄和触媒3个车间做为监测点,分别对3个车间空气铅浓度进行测
  问答对(Frequently Asked Question and Answer Pair)过滤是准确自动获取问答对的关键。本文提出了针对领域和面向句子的中文问答对过滤方法。结合句法结构关系和领域特
  带约束最长公共子序列(CLCS)问题有很深的生物学应用背景,常被用来表示同源基因序列相似性的度量,但计算CLCS时间代价很高,最早的CLCS算法的时间复杂度为0(rn4),目前,最
会议
“6+2”的缴费模式,768元的缴费基数,在省会城市里是不多见的。低费率、低基数能否确保南昌市基本医疗保险制度稳健运行? “6 +2 ” payment model, 768 yuan contribution