基于热度高峰趋势的网络舆情事件衍生话题提取方法研究

来源 :河北大学 | 被引量 : 0次 | 上传用户:pppxulan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络科技的蓬勃发展,微博、抖音、贴吧等网络社交媒体逐渐成为民众信息交流的主要方式之一。网络社交媒体借助手机这一实时通讯设备,使用户不受时间和空间的制约,随时随地进行社会交往和互动。与传统媒体相比,它能够模糊组织边界,使不同年龄、性别、价值观念和信仰的用户进行交流,鼓励用户评论、反馈和分享信息,给用户带来强烈的参与感。此外,它能够采用匿名身份发表观点,这有利于用户表达真实感受。因此,分析微博等社交媒体上用户的讨论内容是捕捉民众观点的重要途径。关注网络舆情事件对于政府相关机构及时监测可能产生的衍生话题具有重要意义。网络舆情事件的爆发会引发网民在社交媒体上发表感受,激烈讨论,进而产生较为敏感的衍生话题。衍生话题导致了网络舆情问题更加错综复杂,进一步加大了政府对舆情管理的困难与风险。因此,本文对网络舆情事件衍生话题的提取问题展开深入研究,目的在于为衍生话题的监测提供新思路,为相关部门有效检测和控制网络事件传播,更好地为制定事件预警策略提供理论依据。首先,提出一种基于LTTB-KSC算法的网络舆情事件热度高峰趋势分析模型,该模型使用LTTB-KSC算法对热度序列聚类,然后借助三次样条插值法和高斯混合模型构建每一类的热度高峰函数,分析函数曲线特征将舆情事件热度高峰的变化划分为单高峰、高-低峰、低-高峰三种模式。其次,将热度高峰变化模式划分结果作为预测事件热度高峰时间范围的基础,提出使用DTW距离确定网络舆情事件对应的热度高峰变化模式,预测热度高峰发展趋势,确定高峰期对应的时间范围。第三,提出一种改进的逆主题频率衍生话题提取模型ITFLDA,对网络舆情事件热度高峰时间范围内网民的发文内容提取话题特征词,分析可能产生的衍生话题。最后以“鹿道森事件”为例进行衍生话题提取仿真实验。实验表明,LTTB-KSC算法在聚类效率和效果上均高于KSC算法,ITFLDA模型则在精准率、召回率和F-Measue值三项指标上相较原LDA模型均显示出优势,改进的网络舆情事件衍生话题的提取方法性能优于传统方法,能有效进行网络舆情事件衍生话题预测,为战略决策提供辅助支持。
其他文献
《北窗炙輠录》分上、下两卷,南宋施德操撰,是作者的随笔杂录,以记载前辈人物盛德轶事和谈论史事、品评诗词为主。施德操,生卒年不详,学者称其为“持正先生”,为人正直,品行高洁,勤奋好学。《北窗炙輠录》成书于南宋高宗时期,保存较为完整,流传至今版本较多,主要有陈氏本和吴岫本两个版本系统,当代主要版本为全宋笔记本和宋元笔记小说大观本。《北窗炙輠录》内容涵盖甚广,包括人物评价、小说故事、生活趣事、教育思想、
学位
宋王朝作为中国历史上文化发展的重要时期,在社会上下形成了“文治”的局面,产生了丰富灿烂的文化成果。赵宋宗室作为在当时社会上最大、最繁盛的宗族,自然也受到了这种社会风气以及国家政策的影响,在经史著述与文学艺术领域取得了卓越的成就,涌现出诸如赵令畤、赵师秀、赵汝愚等著名于时的宗室文人群体。本文以宋代宗室经史著述成果为主要关注点,并结合宋代宗室的教育、科举等背景,对宋代宗室经史著述的具体情况进行分析和研
学位
“数术”是古人知识构成的重要部分,随着时代的不断发展,数术思想中蕴含的科学思想逐渐分离出来,传统的“数术”逐渐让位于新出现的学术,“数术”在生产生活中的地位也在逐渐下降。“数术”作为历史特定发展阶段所诞生的特殊文化现象和学术门类,对古代社会产生了深远影响,但在不同的历史时期,“数术”的内涵也不尽相同,随着时代的发展,“数术”中分离出的部分形成了专门的学科、方技体系,因此本文以“数术”在不同时期的内
学位
金永植《朱熹的自然哲学》是一部系统描述朱熹对自然现象看法的著作,集中探究了朱熹的自然观。金永植在这本著作中,以朱熹的自然哲学概念为基础,效仿“天、地、人”的中国研究传统,论述了朱熹对自然世界的看法和态度,并通过比较朱熹与西方科学传统总结了朱熹的自然观特征。在金永植教授研究朱熹自然哲学的背景方面可以看到,朱熹的成就对后世和国际影响深远,经过僧侣传至日韩,经传教士传入欧美,在国际上掀起了朱子学研究热潮
学位
有清一代,晋商的活动地域非常广泛,支沙口村本身也是适应当时商人之需要而建。此村位于井陉县南部山区,是太行山东麓腹地的一个小山村,现有278户居民,这里群山环绕,石头建筑众多,尤以清朝晚期的特色建筑——石墙瓦房,最具北方太行山区的传统民居文化价值。位于村口的关帝庙和位于村东坡的“官房”,作为支沙口村的两处标志性建筑,无论是对考察北方山区的村庙建筑历史,还是对研究我国北方山区的原生态民俗文化发展和演变
学位
辽朝疆域辽阔,民族众多,根据自然环境和民族活动地域,大致可分为幽云十六州汉人活动地区、上京为中心的契丹人活动地区、中京为中心的奚人活动地区、东京为中心的渤海人活动地区、阻卜和乌古等民族活动西北草原地区、室韦和女真等民族活动的东北地区等六部分。因这些地区纬度不同,经度跨度较大,这就为辽朝不同地区的养马业发展提供了有利因素。辽朝的马最早起源于欧亚的西伯利亚等地区,后经中亚的哈萨克斯坦等地,传入东亚。这
学位
《月令广义》,明代冯应京纂辑,戴任增释。全书共二十五卷,首卷为叙由、编端和图说,余下二十四卷以岁令统领,除十二月令外还增加每月令、四季令、土王令、闰月令、昼夜令、时令。每卷所包含各条例大致包含政教、文言、古事、藻言、名数、气候、主属、物理、卫生、起居、宜忌、授时、药食、服食、阴阳、占候等篇。《月令广义》属于古代仿《月令》体的时令类文献。学界对先秦时代的“月令”文献流传与秦汉政治中的《月令》思想等领
学位
随着全球气候变暖等环保问题的发生,降低碳排放量越来越成为全球各方关心的焦点,各种全球环保峰会的举办,彰显出低碳经济成为全球经济社会发展的主题。物流业作为能源消耗与碳排放的重点产业之一,同时也是中国低碳经济发展的关键基础领域,其减碳化发展趋势已迫在眉睫。区域物流作为区域经济活动的主要部分,其低碳化发展战略的实施将推动整个物流行业的蓬勃向上,进而带动其他行业。我国为实现物流低碳化目标已实施大量战略举措
学位
网络的快速发展使用户个人掌握了丰富的资讯,适应了当前网络时代的需求,但是由于互联网产生的网络信息量急剧上升,这使得个人用户在与大数据打交道时不可能获得对自己真正有用的信息。所以,信息过载是当今互联网应用面临的主要问题,而个性化推荐系统是解决这一问题的有效途径,因此受到了众多的关注和研究。目前,推荐算法的主流是基于协同过滤的推荐算法,但随着网络用户和项目数量的增加,推荐系统面临许多挑战,推荐结果会受
学位
多属性决策在日常生活中的应用十分广泛,无论是家庭买房买车,还是企业的供应商或是材料选择等方面,都需要运用到多属性决策,而模糊决策在多属性决策中的地位举足轻重。模糊决策方法在不断发展完善,从模糊集发展到犹豫模糊集,解决了模糊集只能包含一个隶属度的局限性;再从犹豫模糊集发展到概率犹豫模糊集,解决了犹豫模糊集不能充分表达决策者真实意愿的局限性。偏好关系在多属性决策的应用中十分广泛,它可以准确的表达决策者
学位