论文部分内容阅读
互联网是人类网络空间行为的体现,其中隐藏了大量人物信息。由于这些信息分散在整个网络空间中,将互联网人物信息提取并进行归类具有重要的研究意义和实用价值。文中提出了一种新的互联网人物信息提取模型,实现了人物信息的自动化提取。详细分析了基于网络爬虫的网页信息采集、基于语义分析的人物特征提取、基于向量空间模型的人物聚类算法和人物信息检索等技术原理和实现方案,能够对互联网人物信息进行分析和提取。