基于主题模型的水利信息分类方案设计

来源 :水利信息化 | 被引量 : 0次 | 上传用户:YAOXUEQIN
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
水利信息分类是水利科学数据共享标准化最为重要的一项工作,因此对水利领域大量数据信息的分类十分有必要。针对水利文本数据非结构化的特点,设计一个基于主题模型的水利文本信息分类方案,通过结合LDA主题模型和GloVe词向量模型的优点,提出一种新的主题模型。利用AdaBoost算法改进KNN分类器,在迭代中对分类器的错误进行适应性调整,最终得到分类器的集合。实验结果表明,使用AdaBoost提升KNN对于水利文本分类效果良好,分类效果远好于常见的朴素贝叶斯和决策树,和原来的KNN分类器相比,微观准确率提高1.1个百分点,宏观准确率提高了4.1个百分点,说明在水利文本分类中使用AdaBoost算法可提升KNN分类器的有效性。
其他文献
目的探讨适合呼吸科特点的护理交接班方式,简化交班记录,提高交接班质量。方法根据呼吸科特点设计病情观察一览表,规范交班内容的书写,各班次护士根据患者病情进行交班,接班者阅读
本文以申能星火热电锅炉分散控制系统(Distributed ControlSystem,简称DCS)改造为依据,就热电厂主要设备锅炉DCS系统的配置方式、I/O点的布置、逻辑的组态和主要自动情况,进行了
二次函数是初中数学的一个大难点,总有一些九年级学生常被二次函数的关系式、抛物线的平移、对称轴、顶点坐标、增减性及最值问题等知识点所困扰.如何解答二次函数的关系式?往
随着企业信息化进程的不断加快,ERP(Enterprise Resource Planning)逐步成为我国企业信息化管理的重要工具。我国有半数以上的中型制造企业实施了ERP系统。随着ERP信息技术和中
工业化开始以后技术应用的普及,不断加深和加快了城市工业化的发展思维及城市规划标准化的趋势,规划建设的相关标准和规范建设不断加强,且出现了追求越高越好倾向。标准化是针对
在初中数学中,二次函数占据了很大的比重.二次函数对学生来说既是难点又是重点.教学过程中的难点是学生对二次函数的很多概念并不理解,另外解题过程中出现的各种问题也会影响
随着家用电器的日益普及,民用住宅的用电量也随着增加,其用电量的增加主要反映在两个方面:一是真正用于电气照明的各类电光源的用电量的增加,另一方面是插座的用电量的增加
工业化是经济增长的引擎,推进工业化进程对保持中国经济中高速增长的持续性有重要影响。本文基于2003—2016年省级数据测算了劳动力成本数据并实证考察了劳动力成本上升对中
拖延是一个普遍存在且非常复杂的心理问题,本文对拖延心理的研究成果进行小结,对拖延的概念、性质、类型、测量、影响因素及干预测量进行了阐述,并提出了拖延研究存在问题与
当今世界,经济的全球化趋势日益明显,而作为经济发展中的重要组成部分,国内外银行业的业务结构也在不断的调整和改变。而由于消耗资本较少,个人信贷业务正日益受到众多商业银行的