基于机器学习的政协提案和相关舆情的分析

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:bowangmosong1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
全国政协提案是我国政治制度非常重要的机制之一,每年全国各级政协委员都要提出提案,仅北京市2018年公开的提案就有798件,全国各级政协委员提出的提案总数更多。采用技术手段对政协委员形成的提案进行热点主题发现,并根据这些热点主题进行舆情统计分析,可以挖掘相应的社情民意,为政协委员提供技术信息的参考。目前,关于提案的热点主题发现和采用技术手段对热点主题进行舆情统计的相关研究尚未见到。本文设计了一套政协提案及其相关舆情分析系统,为政协委员提供信息技术支持。本文主要工作包括以下几个方面:(1)对政协提案划分主题并提取关键词。编写网络爬虫程序,从政协提案网站采集了提案数据;根据政协提案的结构特点对提案进行向量化表示,使用K-means聚类算法对提案进行聚类,每一类表示一个主题;设计了两种关键词提取算法从每个主题中分别提取出三个关键词,分别简称“长词”和“短词”,并设计对比实验分析了两组关键词的有效性,结果表明“长词”比“短词”更能反映主题内容。(2)设计、训练情感分类模型并预测所有未标注数据的标签。开发爬虫程序,采集了每个“长词”的微博舆情数据并保存为结构化文本格式;设计了基于双向LSTM的情感分类模型,训练模型,在测试集上达到了 90.45%的准确率,远远高于基于传统机器学习算法的情感分类模型在该数据集上的测试准确率。(3)对政协提案的相关舆情进行统计并可视化。在上述工作的基础上,对获取的微博舆情数据进行了统计:从关注度演进趋势和关注度大小、情感演进趋势和情感倾向等角度对每个主题的相关舆情进行了统计分析。
其他文献
20世纪80年代末,整体课程作为一种新的人文主义课程思潮在北美兴起。它以“整体的人”作为理论的参照点和内在框架,为我们描绘了一幅理想的课程画卷。本文首先系统梳理了整体课
水利是关系国计民生的大事,水利施工企业是我国水利建设中的主力军。面对我国水利建设的市场化,众多大型水利施工企业难以适应,生存与发展的问题成为水利施工企业必须面对的现实
随着我国加入WTO,面临国外优质农产品所带来的冲击,农产品市场竞争将越来越激烈,而从目前我国农产品生产加工自身的状况来看显然还没有对这些挑战作好准备。我国的农产品主要还
品牌是市场营销学和广告学广为使用的一个概念。在时间上,品牌自身经历了一个发展过程,不同的人对品牌的理解也不尽相同。随着互联网技术对经济、社会的影响越来越深入,传统品牌
学术管理和行政管理是高校管理的重要组成部分,当前,虽然对高校学术管理、高校行政管理的研究有很大的进展,出版了不少有价值的专著,但是对学术管理与行政管理之间的关系研究还有
本文以餐饮O2O为研究对象,尝试构建餐饮O2O供应商、技术平台和物流配送三个必要模块与餐饮O2O发展之间的关系模型。研究从客户角度出发收集相关数据资料,并以顾客满意度作为
《玉堂春》一剧为传统名剧,但过去只演《起解》《会审》两折。荀慧生增订全本,并从唱腔、舞美、人物扮相上进行创新,使玉堂春的人物形象更加丰满,促进了《玉堂春》剧目的再传
作为科技时代的产物,交互式电子白板的运用为小学语文教育的改革提供了重要帮助,成为了小学语文教师,尤其是小学高段教师的得力助手,在激发学生们学习兴趣的同时,提高了他们
随着我国经济的快速发展,我国作为世界经济大国位置已经逐渐显现,人民生活水平和精神追求不断提高。当前随处可见的广场舞代表着我国民众对生活的更高追求。民族民间舞蹈作为
网络是否带来了更平等的政治参与结构?利用一起典型的网络舆情事件——夏俊峰事件的意见领袖微博数据,对其内部网络结构进行分析,发现意见领袖发挥着将公民个体诉求转化为大