水利信息中的聚类和舆情分析研究

来源 :华北水利水电大学 | 被引量 : 0次 | 上传用户:wangcb00
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
水利信息包含文本信息、视频信息、音频信息以及图像信息等,其中文本信息是其最广泛、最重要的组成部分,本文将重点关注水利文本信息。随着水利工程的快速发展,海量水利文本数据通过互联网不断积累,水利相关研究人员以及用户如何在这些信息中快速且准确地获取到关键信息,以及如何提高水利文本信息的舆情分析挖掘能力,这些问题已成为近年来国内外水利研究者研究的热点内容。因此,准确判断出水利文本信息的关键内容,对及时且精准地掌握水利信息舆情热点非常重要。本文构建了基于深度学习改进的K-means聚类模型,并将该改进模型应用于水利信息舆情分析研究。本论文的主要工作如下:1、构建了基于句向量(doc2vec)和多粒度卷积神经网络改进的聚类模型(DMCNN-K-means)。该模型与传统聚类改进模型进行对比实验,得出DMCNNK-means模型的准确率为95.45%,相比于传统的CNN模型准确率增长5.8%,相比于MCNN模型准确率增长5.25%。结果表明,DMCNN-K-means模型相较其他K-means改进模型,能获取到更有效的文本特征向量,提升模型聚类准确率,得到较准确的水利信息文本聚类标签数及较好的文本聚类效果。2、设计了水利信息舆情分析系统,该系统针对水利新闻文本信息实现了舆情采集、舆情分析和舆情评估功能。其中舆情采集模块的语料主要来自水利新闻网,利用网络爬虫对以水利新闻网为代表的多个水利网站进行爬取得到水利新闻文本数据。舆情分析模块主要针对如何准确识别水利信息舆情热点话题,展开问题研究及模型构建。舆情评估模块是基于评价指标进行理论研究,并选择一定指标对舆情分析模块的结果进行评价。论文研究了融合句向量和多粒度卷积神经网络的DMCNN-K-means聚类模型,充分挖掘了水利文本信息的深层关联信息,实现了水利信息舆情的分析展示,对水利研究者和水利关注者具有一定的指导意义。
其他文献
1例54岁男性食管癌患确诊后接受TP方案化疗(白蛋白结合型紫杉醇480 mg静脉滴注1次+顺铂45 mg静脉滴注3次)联合免疫治疗(卡瑞利珠单抗200 mg静脉滴注1次),每3周为1个周期。治疗2周期后患者出现心悸不适,复查甲状腺功能五项提示fT3、fT4、TotT3、TotT4较正常水平大幅升高,TSH<0.01 mIU/L,甲状腺球蛋白抗体和抗甲状腺过氧化物抗体滴度高,心电图提示窦性心动过速,
期刊
本文的工作主要围绕带有时滞影响的两个流体动力学模型展开,即具有双时滞的三维不可压Ladyzhenskaya-Lions模型和具有无限变化时滞的三维不可压LadyzhenskayaLions模型,研究了它们解的适定性和长时间行为.本文共分为四章.第一章首先介绍了流体动力学相关模型的研究背景和研究现状,然后概括了本文主要的研究内容,并给出一些常见函数空间和拉回吸引子基本理论.第二章研究了有界区域上具有
学位
变量为三次型除数函数均值可表示为(?)其中,dk(n)是除数函数.本文,我们借助经典圆法和指数和估计的方法,研究了当k=2,l=5和k=4,l=6时的除数函数均值问题,分别得到了其误差项具有幂节余形式的渐近公式,即定理1对于x≥2,我们得出渐近公式其中(?)定理2对于x≥2,我们有(?)其中(?)i,j(0≤i≤j≤3)是整数.
学位
随着大数据与信息技术的崛起,逐渐渗透到各个领域,其中医疗行业是应用最广泛的领域之一。利用医疗数据进行构建相关体系的模型预测,对提供及时有效的医疗决策具有重要的现实意义。而癌症是医学界的难题,因此如果能够实现对癌症存活性的分类预测,那么就能帮助医生在癌症治疗时做出更正确的医疗决策。肺癌位于癌症死亡率首列,每年有成千上万人死于肺癌,因此本文拟对肺癌数据进行存活性分类预测。使用美国国家癌症研究所SEER
学位
就业是民生之本,就业问题关系到经济发展和社会和谐稳定。改革开放以来,随着社会经济的发展,我国的产业结构和就业结构均发生了巨大的变化,但是,三次产业就业与产业发展逐渐开始出现不平衡的问题,就业结构问题逐渐突出,已成为制约区域经济社会协调发展的重要因素,研究就业结构问题具有重要的现实意义。本文对郑汴洛新地区产业结构、就业结构的关联关系进行了研究,预测了未来一段时间郑汴洛新地区的产业结构调整系数和就业结
学位
随着我国经济社会进入高质量发展阶段,城市化水平不断提高,水资源在新时代的供需失衡问题也随之加剧,水资源短缺已成为阻碍经济社会与生态环境协调发展的难题。科学评价并准确预测水资源承载力,对经济社会高质量发展、水资源合理开发利用具有重要意义。本文以郑州市和武汉市为研究对象,从水资源、经济社会、生态环境三个维度入手,构建水资源承载力评价指标体系,对两座代表城市的水资源承载力状态进行评价;构建机器学习预测模
学位
互联网数据是未来经济社会的重要资源,其中自然语言占据较大比例,使自然语言处理的进一步研究更加迫切。自然语言处理有连接主义和非连接主义两条路线。近年来多层神经网络上的深度学习被用于自然语言处理的各个方面,使连接主义成为研究热点,而非连接主义的自然语言处理进展可能被忽视,例如基于形式语法的句法分析。句法分析是自然语言处理的中间环节,直接影响句子的语义解释、篇章理解、机器翻译、问题回答等下游任务的完成质
学位
共聚阻燃尼龙可以有效解决尼龙可燃性和燃烧熔融造成火势扩散的问题,在航天航空、建筑、纺织等领域中有着重要的应用前景。对尼龙主要的阻燃改性方法进行了介绍,详细阐述磷系阻燃尼龙、氮系阻燃尼龙、协效阻燃尼龙等新型共聚阻燃尼龙材料的研究与应用进展,并从阻燃性能、综合性能、阻燃剂的研发角度对阻燃尼龙材料的发展进行了展望。
期刊
计算鬼成像(Computational Ghost Imaging,CGI)作为一种新型的单像素成像技术,利用不具备空间分辨能力的桶探测器获取被测物体信息,结合空间光场调制技术,计算重构目标物体的像。由于单像素成像兼有采样、压缩和加密的特点,已被广泛应用于光学信息安全领域。基于计算鬼成像的光学加密技术具有并行数据处理能力、多维度、高鲁棒性等特点,能够将二维图像甚至三维物体加密为一维实数序列,极大地
学位
群青替代酞青蓝配蓝色无卤阻燃玻纤增强高温尼龙具有良好的热稳定性,但在热流道注塑成型时存在变色问题。本文从工艺角度出发,研究了机台吨位,注塑温度,模具温度,注射速度,注射压力和成型周期等方面对蓝色无卤阻燃玻纤增强高温尼龙连续生产颜色稳定性的影响。最终在230T注塑机,320℃注塑温度,116℃的实际模温,中高射速和射压,循环周期18 s下满足产品生产稳定性的要求。
期刊