【摘 要】
:
[目的]挖掘网络话题的地域分布,为舆情管控和社会管理提供决策依据.[方法]通过引入网络签到功能,将用户评论的位置参数引入到LDA模型中,提出一种面向地域的网络话题识别模型(
【机 构】
:
蚌埠医学院卫生管理学院 蚌埠233030;中国科学技术大学计算机科学与技术学院 合肥230027;蚌埠医学院卫生管理学院 蚌埠233030;
论文部分内容阅读
[目的]挖掘网络话题的地域分布,为舆情管控和社会管理提供决策依据.[方法]通过引入网络签到功能,将用户评论的位置参数引入到LDA模型中,提出一种面向地域的网络话题识别模型(Regional Oriented Latent Dirichlet Allocation,RO-LDA).该模型将每个文本词都打上位置标签,联合建模文本、话题、位置和词汇,生成文本-话题、话题-特征词和(话题,地域)-位置三个分布矩阵.通过话题-特征词分布识别出网络话题,再通过(话题,地域)-位置分布识别出话题的流行区域.[结果]在真实数据集上验证RO-LDA模型,F值达80.05%,高于其他对比模型.[局限]文本位置标签的概化由人工设定,标签概化范围的大小对话题的地域识别精度具有一定程度的影响.[结论]将位置参数和LDA模型融合,实现了话题地域特征识别,为话题的线下挖掘提供了新思路.
其他文献
[目的]对海关平台的高维报关商品特征实现有效降维,提高海关平台的工作效率.[方法]以国内某海关4个月的商品文本作为语料,从词语相似度与相关度两个微观层面评估生成词向量的
[目的]消除文献系统中的作者重名歧义,以解决其导致的文献错误聚合问题.[方法]通过结构化文献数据建立作者网络、文献网络以及作者-文献网络,融合不同网络表示学习方法获得文
[目的]设计基于可视化的基金资助热点发现方法,用于分析科研立项重点以及发现其演化过程.[方法]基于NASA小企业研发计划基金申请书的文本特征,绘制连续时间窗口下基金资助图
[目的]对广东省刀剪专利数据进行演化规律分析.[方法]提出一种新“体用”归类体系,建立基于LDA的TRIZ特征主题模型,计算不同年份、主题下概率高的前n个词汇,并预测未来三年的
[目的]探索同类突发公共卫生事件中微博用户在各话题类型上的共振规律.[方法]以朗之万方程为基础构建突发公共卫生事件子话题的随机共振模型,以新浪微博上关于山东问题疫苗事