基于主动学习SVM的蒙文文本分类系统的设计与实现

来源 :内蒙古大学 | 被引量 : 4次 | 上传用户:xiaoxianjihuoma
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化的高速发展,世界变成了信息的海洋,如何从大量信息中迅速有效地提取所需信息成为急待解决的问题。由于分类可以在较大的程度上解决信息杂乱的现象,方便用户准确地定位所需的信息和分流信息,因此,对文本分类领域的研究再一次引起人们的关注。 文本分类是指根据文本的内容自动确定文本类别的过程。随着蒙文国际标准编码的正式发布,蒙文信息的自动分类问题就成了一项重要的研究课题。由于蒙文的词法结构和语法结构均与英文和中文存在较大的差异,不能照搬国外的研究成果,因此有必要研究蒙文自己的分类系统。本文的工作是设计并实现一个蒙文文本自动分类器。 本文介绍了基于主动学习SVM的蒙文文本分类系统的设计思想。从蒙文语言学的角度对蒙文分析后,指出了蒙文中各种词性的词语在蒙文特征提取中具有不同的重要性,并给出了蒙文词干提取的方法;在充分分析了SVM的理论基础之后,对SVM算法进行了改进,即用主动学习方法处理SVM分类器的训练文本;在WindowsXP/VC6.0环境下实现了基于主动学习SVM的蒙文文本多类别分类原型系统,并对其进行了分析。
其他文献
本文结合实际项目对嵌入式系统应用进行了分析和研究,分析了嵌入式BSP和PC机BIOS之间的区别和联系,对当代比较流行的嵌入式操作系统如嵌入式Windows CE、嵌入式Linux、VxWorks
移动Ad hoc网络是一种临时自治的分布式系统,具有无中心接入和多跳的特征。在许多场合(如军事通信、灾难恢复、搜索和救援行动以及分布式计算等)具有越来越重要的作用。由于
学位
学位
近年来由于微型制造技术、通信技术以及电池技术的进步,使得微小的传感器具有了感应、无线通信和处理信息的能力,随之出现了一种新兴的计算机网络——无线传感器网络(WirelessS
随着多媒体编码技术和网络通信技术的发展,出现了很多以“流”为特征的多媒体应用,如视频会议、网络监控等。这些应用具有实时性要求,如视频会议系统的声音和图像都不允许停
计算机技术和通信技术促使了互联网络的迅速发展,基于网络的信息服务、应用服务在短时间内迅速发展,充分利用网络通信功能极大的提高了信息资源的利用率。但是互联网络本身却并
运动目标检测是计算机视觉中的重要研究方向之一,也是智能视频监控系统的核心。然而,运动目标检测算法在动态背景中受到外界因素的干扰,使得检测结果难以满足高层视觉处理系
计算机联锁系统(CBI)是铁路运输中的重要设备,它肩负着列车调度、安全行车、提高运输效率的重要工作。它通过对道岔、进路以及信号的控制,来实现铁路列车的调度指挥工作。随
随着人机交互技术的快速发展,新的人机交互方式成为近年来研究的热点。手势作为一种自然而直观的交流方式,是人机交互中一个重要组成部分。基于视觉的手势识别一直是计算机视