论文部分内容阅读
本文提出了文本与命名实体的联合主题(Combined Entity Topic,CET)模型,用于在统一的主题空间下同时分析文本和文本中命名实体的主题属性,通过主题属性区分实体在文本中的重要性,建立实体间的语义网络关系,实现组织挖掘。CET模型采用文档层和实体层的双链结构,在文档层借鉴LDA模型的主题建模方法,在实体层提出基于Dirichlet分布的实体建模方法改进AT模型的生成过程。实验结果显示,CET模型能够有效降低复杂度,提高文档和实体聚类效果。