基于高斯混合模型林业信息文本分类的技术研究

来源 :东北林业大学 | 被引量 : 0次 | 上传用户：bavai

【摘要】

：

林业信息文本分类是根据建立好的分类器,让计算机对给定的林业信息文本集进行分类的过程具有理论和实用双重价值。本文详细介绍了林业信息文本特征提取的过程,利用构造的特征

【作者】

：

许莉薇

【机构】

：

东北林业大学

【出处】

：

东北林业大学

【发表日期】

：

2015年期

【关键词】

：

文本分类高斯混合模型 RW-GN 可行性

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

林业信息文本分类是根据建立好的分类器,让计算机对给定的林业信息文本集进行分类的过程具有理论和实用双重价值。本文详细介绍了林业信息文本特征提取的过程,利用构造的特征矩阵进行林业信息文本分类,详细分析了高斯混合模型和基于修正加权高斯牛顿的神经网络算法的原理,为林业信息文本的分类提供了新思路。本文研究主要结论：(1)本文将高斯混合模型算法引入林业信息文本分类研究中。高斯混合模型的参数估计采用参数估计算法,由于EM参数估计算法虽然是逐步收敛到最大值,但是初始值的选择对于EM算法最终的收敛效果起到很大的影响,所以本文提出了将K-means算法估算的初始结果赋值给EM参数估计算法,大大提高了EM算法参数估计的精度。由于K-means算法是聚类算法,在初始化值输入构造的高斯混合模型中时,林业信息样本的类型需要和样本群匹配,所以对于样本的要求有一定的限制,所以此处所做实验选择的是均衡的林业信息文本。(2)本文将基于修正加权高斯牛顿的神经网络算法引入林业信息文本分类研究中,基于修正加权高斯牛顿的神经网络算法(RW-GN)是BP神经网络算法的改进算法,是对神经网络算法中的训练函数进行参数优化,提高了算法的分类正确率。由于该算法是以神经网络算法为基础所以算法具有较高的稳定性,适合不均衡林业信息文本的分类,通过实验结果表明,基于加权高斯牛顿的神经网络算法对不均衡林业信息文本的分类获得了较高的准确率。(3)将本文的两种算法分别应用在林业信息的均衡与不均衡的样本中。针对算法的优点选择样本,将提出的算法实验结果与林业信息文本分类的常用算法作对比,如：BP神经网络、SVM支持向量机、贝叶斯、决策树算法。实验结果表明高斯混合模型算法适合均衡林业信息的文本分类,基于神经网络的修正加权高斯拟牛顿算法适合不均衡林业信息文本的分类,两种算法都获得了较高的准确率,具有可行性。

其他文献

基于Hough变换和神经网络的中国静态手语识别

近些年来,随着社会的发展,信息无障碍的研究与发展越来越受到重视,其中一个很重要的技术就是手语识别和手语合成技术,这种技术的发展为聋人和正常人之间的自然交流提供了一个

学位

Canny边缘检测Hough变换广义Hough变换BP神经网络手语识别

基于Internet的嵌入式远程监控系统的研究与设计

ARM架构的嵌入式处理器和嵌入式Linux操作系统的完美结合,引发了远程监控系统新的技术革命:由于其优异的性能和高的性价比,被广泛地应用到各种电子产品的设计当中;并且越来越

学位

Linux嵌入式系统嵌入式应用开发

目标跟踪技术在实验土力学中的研究与应用

目标跟踪技术的研究是计算机视觉、图像处理和模式识别领域里非常活跃的课题,目前正广泛地应用于军用和民用等各个领域。本文研究的主要内容为如何将目标跟踪技术应用到实验

学位

特征选择颗粒目标目标跟踪分层匹配高斯模型

基于UML状态图的软件测试用例生成方法研究

软件测试在软件开发过程有着越来越重要的地位,它贯穿于软件定义与开发的整个周期即整个软件开发过程。而测试用例的生成设计又是软件测试过程中的重点和难点所在,它的设计依

学位

图论测试用例测试准则UML状态图

Web Services在动态电子商务系统——网上书店中的研究与实现

“软件即服务”已经成为软件发展的趋势,动态电子商务正是这一思想的结果。目前电子商务应用中存在着商务流程的频繁更新,企业异构平台上不同系统之间收集、归纳、整合和传播

学位

Web Services动态电子商务XMLSOAPUDDI

基于小波变换的图像配准

图像配准是图像处理领域的基础问题,它是将不同时间、不同传感器或不同视角下获取的同一场景的两幅或多幅图像进行匹配、叠加的处理过程。图像配准是图像镶嵌、目标识别、图

学位

小波变换边缘提取图像配准互信息

P2P流媒体点播技术中缓存算法的研究

随着计算机和网络技术的快速发展,互联网流媒体技术广泛应用于网络直播、视频点播、远程教学等领域。但传统的基于C/S架构的服务模式很容易引起服务器的性能瓶颈和带宽瓶颈,

学位

P2P流媒体点播缓存算法

基于RFID隧道人员定位系统的设计与实现

随着高铁项目的目益增多和建设范围的逐渐扩大,各类隧道工程的突发事故对隧道施工人员的安全保障及紧急救援带来了新的挑战。如何把事故的人为管理因素降到最低点,并且在事故

学位

RFID室内定位技术RSSI算法碰撞冲突

虚拟场景实时阴影算法的研究与实现

作为增加虚拟场景真实感的关键技术——阴影的实时渲染技术,在三维游戏、动画影视、三维地理信息系统、计算机辅助设计和制造等多方面得到广泛的应用。阴影效果在真实感图形

学位

软阴影半影阴影图阴影体光线跟踪包围盒综合包围壳

视频语义特征提取的研究

随着计算机网络和存储技术的飞速发展,视频等多媒体数据呈几何级数增长,如何从浩如烟海的数据资源中实现视频数据的检索成为人们关注的问题。现有的视频检索系统技术多是基于

学位

视频检索语义提取SID算法

基于高斯混合模型林业信息文本分类的技术研究

与本文相关的学术论文