论文部分内容阅读
中文叙词表本体(OntoThesaurus)是一种新型的、同时具备叙词表和本体特征的知识组织系统。其配套系统“中文叙词表本体共建共享系统”(OTCSS)采用的共建方法是依靠一种机器辅助的人工构建方法(类似于WIKI)。这种方式的好处是修订意见准确率高、修订内容完整等,但是也存在修订信息时效性不稳定的缺点,其成功还需要依赖网络用户的大量参与。本文提出了中文叙词表本体中等同关系的自动构建方案。其中,基于web搜索引擎的模式匹配算法,对OntoThesaurus叙词概念的覆盖率达到91%;基于《知网》义原词频的词汇等同关系识别算法,比原算法在准确性上提高了8%,达到了78%的准确率