论文部分内容阅读
本文对科研服务平台PKUSpace中标签挖掘子系统的设计与实现进行了探讨。本研究设计并实现了标签变体识别算法来处理标签的各种变体,并在实验中取得很好的效果。文章以聚类作为发现主题的方法,并比较了标签聚类和资源聚类的效果。为了能动态地处理系统中对象的复杂关系,在M-LSA模型基础上提出了增量M-LSA模型。同时,对所采用的聚类算法BIRCH进行了改进,以适应系统的动态性。