论文部分内容阅读
在计算涉及地名的句子相似度时,地名有着特别的重要性.如果不恰当地对地名进行处理,不体现出地名对于句子的重要性以及地名间的差异性,会导致相似度计算结果不甚合理.提出了一种改进的句子相似度计算方法.该方法在计算地名词语相似度时利用了地名在地理树中的层次关系以及从百度地图API获得的经纬度坐标,在计算非地名词语相似度时则利用了HowNet知识库,通过对地名词语和非地名词语赋予不同的权重来体现地名的重要性,并计算出句子的整体语义相似度,再结合句子结构的相似度计算出句子的综合相似度.实验表明:改进后的新方法对于计算