论文部分内容阅读
提出了一种标注方法实现语义网中无结构专业文档的自动标注。通过分析给出专业文档的两方面特征,并提出了三个假设。为提高标注效率,基于结构对本体进行分割,将本体划分成具有较高语义独立性的片断;然后利用从专业文档中抽取的关键词定位本体片断;最后,使用选中的片断,利用语法结构和三元组的对应性对文档进行标注。实验结果表明,所提出方法在标注效率、标注数量和准确性三个方面都有所提高。