论文部分内容阅读
文章通过分析叙词表相关概念、叙词表优选词相关标准以及领域叙词表融合中概念优选词的选择等相关主题,总结国内外叙词表融合的现状、等同关系研究进展以及概念优选词选择的原则、方法、算法等。同时总结了叙词表概念优选词选择的四种方法,并对每种方法进行举例,分析其优点和不足,在此基础上,引入层次分析法来解决叙词表融合时的概念优选词选择问题。 结合层次分析法的原理,文章分析了概念优选词的主要影响因素:词形、词义和词频。其中,词形和词义是定性的,而词频是定量的。层次分析法作为定性与定量相结合的方法,能够将词形、词义在一定程度上定量化,同时将这三个因素综合起来考虑,通过在表达同一概念的术语之间进行两两比较,最终选出一个最合适的术语作为概念优选词。 根据层次分析法的步骤,文章分别从《水利水电科技主题词表》和《黄河水利科技主题词表》中选取7个类目共2957组概念进行融合,先对两部叙词表中的术语进行概念归并,归并后形成374组概念词群,然后运用层次分析法在概念词群中选择出一个术语作为概念优选词。将得到的概念优选词与《水利水电科技主题词表》、《黄河水利科技主题词表》和《汉语主题词表(工程技术卷)》中相关概念优选词作对比,发现使用层次分析法选出的优选词与三部词表中相关概念优选词的一致性均在57%以上。最后从叙词表概念颗粒度、叙词表的编制规则、样本选取以及层次分析法的适用性对实验结果进行了分析。通过实验证明,层次分析法可以作为领域叙词表融合时概念优选词选择的一种方法。