基于时间序列分析的微博突发话题检测方法

来源 :2015中国计算机网络安全年会 | 被引量 : 0次 | 上传用户:liuhuilei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  针对微博信息噪音大、新颖度难以判断的问题,在动量模型的基础上进行优化,提出了基于时序分析的微博突发话题检测方法。通过动量模型提取候选突发特征后,对特征的动量时间序列分别借鉴信号频域分析理论和股票趋势分析理论进行建模,分析特征的频域特性来识别频繁伪突发特征,分析特征的新颖程度来识别间歇性伪突发特征,合并过滤后的有效突发特征形成突发话题。微博数据实验表明,该方法有效提高了突发话题检测的准确率和F 值。
其他文献
  网络公关行业随着互联网的普及和发展而迅速崛起,然而在发展过程中却出现了网络推手、网络打手、网络删手等网络公关异化现象,给消费者、企业、市场秩序以及互联网公信力造
会议
  针对时间抽取的研究目前一般是基于时间抽取规范TIMEX2 或TIMEX3 采用规则或机器学习的方法进行处理,但是得到的时间信息缺少完全统一的形式,特别是在安全事件的舆情发现及
会议
  为了提高云计算系统的资源利用率,考虑用户的QoS 需求约束,优化性能,将云计算和工作流集成,采用DAG(Directed Acyclic Graph)进行任务调度模型的建立,给出工作流系统中的
会议
Terrequinone A是由构巢曲霉(Aspergillus nidulans)分泌的具有抗癌活性的二级代谢产物,有着广阔的应用前景和市场潜力。但通过微生物培养提取活性物质存在着含量低、分离纯化
膜联蛋白(Annexin)广泛存在于动、植物中,在生长、发育和适应性方面都发挥着重要的作用。植物中的膜联蛋白分布广泛,主要存在于胞质溶胶、细胞质膜、内膜和多种细胞器中。已经发现植物中的膜联蛋白在非生物胁迫条件下发挥作用,并且可以形成超极化激活的钙通道参与胞质中钙离子信号产生,对植物适应不良环境有重要作用。为探究Osannx诱导抗逆性的生理机制,本实验选用水稻(Oryza Sativa L)野生型、
  社交网络数据获取是社交网络分析重要的前提条件。当前各大社交网络平台对于第三方爬虫的屏蔽措施日益复杂,页面也通常日益复杂、动态生成,传统的数据获取手段受到严峻的挑
  舆情分析与社交网络迫切要求建立完备的监督机制。日趋激烈的网络乱象呼唤在网络监管上建造等腰三角形结构,让检察机关主动参与到网络虚拟社会的治理中去,让静态的立案监督
  信息通过用户交互在社交网络中大规模地迅速传播,对其传播进行预测在舆论控制、信息推荐、市场营销等方面都具有重要意义。本文简要介绍了信息传播的机制,分析并归纳其影响
  随着电子技术的飞速发展,移动智能手机的计算速度和存储量在不断地提高,其功能越来越完善,甚至能够取代传统PC 来满足用户的某些需求。在传统的虚拟计算环境(IVCE)中,加入移
会议
  本文通过分析并利用不同话题之间的相关性提出话题交叉回归方法(Topic Cross Regression,TCR),该方法将话题的流行度序列建模为其他相关话题的流行度序列的线性回归函数
会议