面向隐式微博主题挖掘系统的设计与实现

来源 :东华大学 | 被引量 : 0次 | 上传用户:yellue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅速发展,电商平台逐渐成为大众购买商品的主要渠道,企业官方微博是服务于电商平台的便于企业发布对外消息、用户讨论评价产品的一种新型方式。随着公司网络营销影响力的增加,与公司相关的微博文本数量日益增多,其中隐含着许多与公司密切相关的话题。挖掘得到其中有价值的信息可以实时监控与公司相关的舆论动向,支持公司管理层决策。微博主题检测技术是研究如何对大量的微博数据信息进行管理分类,这己经成为当前微博研究中最热门的方向之一。主要工作内容如下:(1)微博中包含大量的无法分析其主题归属的微博。如果一味抛弃将会大大影响整体主题的输出,遗漏掉很多微博作者关心的话题。因此本文在目前已存在的微博主题模型基础上,着重分析微博的结构和微博间的关系并结合概率主题模型设计和提出了基于微博转发评论关系和自身上下文关系的面向隐式微博的主题模型CGRMB-LDA模型。该模型利用微博间评论关系、转发关系和上下文关系扩展隐式微博来达到明确隐式微博的主题归属的目的,最后采用吉布斯采样的方法求解模型得到微博-主题和主题-词汇的概率分布。(2)本文还探讨如何快速便捷地利用微博开放平台的API接口实现获取微博间的评论转发关系来分析处理隐式微博。另外,本文还针对隐式微博的特点经过数据预处理、网络符号替换和情感词扩充使得最后主题模型的输出更加准确并带有一些情感色彩。
其他文献
传统软件测试通常是设计合适的测试用例,检测软件是否能够输出预期结果,是对错误表象的检测;而基于故障模型的软件故障检测是根据错误的本质进行检测,其优点是可以根据建立的
SOA即面向服务的架构,其基本思想是以服务为核心,将企业的IT资源整合成可操作的、基于标准的服务,使其能够被重新组合和应用。SOA是衔接业务需求和技术实现的桥梁。它具有松
曲线的重合检测及多项式的求根问题是计算机辅助几何设计(CAGD)与计算机图形学(CG)领域中的两个基本问题,有着许多应用,如碰撞检测,曲线曲面求交运算、中轴线计算及点投影等
设计模式被广泛用于解决软件设计和开发过程中反复出现的设计问题。设计模式在软件源码中的使用信息(即设计模式实例)能够在较大程度上反映软件系统的设计思路。准确地从软件
随着现代教育技术的发展,现今的教育方式已经发生了深刻的变化。一方面人们可以很方便地从互联网上得到大量的学习资源,另一方面,教师们辛勤创作的作品随时面临着遭受窃取的
基于视频监控技术的车辆测速技术由于具有检测区域大,系统设置方便等突出特点,已成为智能交通系统领域的研究热点。本文针对这一热点,研究了在高速公路环境下,基于组件的交通
E_Learning学习管理系统是学校教学平台建设工作中的一个趋势,是通过综合教学设计,以互联网络为主要交流平台建设的教学科目内容及实施教学活动的整合。它既是学校教学平台中
3D模型变形技术在工业设计、模具生产、零部件加工、动画制作等领域有着广泛的应用。传统的模型变形技术操作复杂、效率低下,针对这个问题,本文对交互式网格模型变形技术展开
随着近年来网络技术的飞速发展,与Internet有关的安全事件愈来愈多,安全问题日益突出。目前,网页木马成为恶意软件传播中最常见的形式之一,网页木马具有传播速度快、变种形式
微机电技术和无线通讯技术的高速发展,使得无线传感器网络在众多领域有了广泛的应用。无线传感器网络节点协作机制是多种技术综合运用而形成、面向服务或任务的协同处理机制,