论文部分内容阅读
实体属性值抽取是信息抽取的重要组成部分。针对数量型属性类型多样以及取值易变的问题,提出了一种基于元性质的数量型属性值自动抽取系统。对系统的结构、功能框架以及相关核心技术,包括提取文本的选择、候选值的提取及评估、结果的自动验证等进行了详细讨论。通过对百度百科的5大类9子类实体数量型属性值的抽取,平均准确率和召回率分别达到71%和89%,高于基于简单搜索的方法和传统的基于词汇-句模的方法。该方法适用于开放领域的数量型属性值获取,易于获取单值属性的精确取值。