论文部分内容阅读
现有基于网络测量的IP定位方法往往难以给出带有准确经纬度信息的可靠定位结果,通常仅能确定目标可能所处的大致区域(本文称为缓冲区),定位精度难以满足实际应用需求。针对该问题,本文提出了一种基于概率主题模型的网络定位结果优化方法。该方法首先从爬取的与网络实体相关的文本信息内容中,利用概率主题模型LDA的弱监督主题分类思想,提取与地物类型相关的从属主题;其次,根据提取的从属主题,确定实体可能所属地物类型;最后,将网络定位结果缓冲区与地理图层进行叠加,在叠加范围内检索所属类型的地物,确定实体的地理位置,从而