市长公开电话汉语文本标签的确立

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:aheoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络事业的快速发展和人民群众参政议政、自我保护意识的不断增强,信息处理已经成为人们获取有用信息不可缺少的工具.许多城市设立了市长公开电话服务平台,于是,各行各业的文档信息每天都在剧增.采用传统的人工手段分类信息,不仅耗时长,而且面临的困难越来越多,尤其政府承办部门职能的调整,使得如何将这些信息及时准确地分类到调整后的处理单位成为迫切需要研究的问题.文本自动分类是信息检索和数据挖掘领域的研究热点与核心技术,基于机器学习的文本自动分类系统是信息处理的重要研究方向,它是指在给定的分类体系下,根据文本的内容自动判别文本类别的过程.本文基于长春市市长公开电话汉语文本分类的实际问题,介绍文本自动分类的概念,市长公开电话系统,对文本分类中所涉及的关键技术,包括分词、特征选择、特征提取,进行了总结和研究,探讨了基于半监督学习的文本标签的分类问题,研究了基于EM算法、随机森林、Boosting算法的汉语文本的分类问题,使用C++语言实现了三种算法的文本分类程序,并对实验效果进行了分析.
其他文献
随着数据获取技术突飞猛进地发展,模式识别领域的高维数据越来越多。这些高维数据里的冗余信息不仅严重影响分类器的精度,增加分类器训练的难度。这些高维数据还会造成“维数灾
为解决现场无法在线测量轧辊表面油膜厚度的问题,考虑二次冷轧机组润滑设备与工艺特点,在阐述了二次冷轧过程轧辊表面油膜厚度形成及演变过程机理的基础上,运用流体动力学原
树上随机场是随机过程理论在树—这一数学模型上的应用,它产生于信息理论的编码和译码问题。设随机过程{Xt,t∈T},其中的状态和状态序偶出现的频率是否遵从大数定律,直接影响
法制节目以其报道案件为主要内容而具有特殊性,有时会形成一种所谓的“媒体审判”现象,片面追求轰动效应,既误导了公众,也对法官的审判形成了强大的压力。所以,电视法制节目特别是地方台法制节目,在发展迅速、取得巨大成就的同时,也面临着一些问题。    地方台法制节目的现状    中国人民大学新闻系主任姚广宜将我们目前的电视法制节目分为六种类型:举案说法类、演播室讨论类、纪实性公安题材类、益智互动类、竞技挑
Carbon dissolution from four types of metallurgical cokes and graphite was investigated by using immersion rods in a resistance furnace to clarify the influence
目的:比较局部姑息性放疗法与阿片类药物对肿瘤骨转移患者镇痛作用的临床疗效。方法:选取医院肿瘤外科2013年1月—2015年12月期间收治的肿瘤骨转移患者134例,按随机数字表法
To further improve the comprehensive properties of 42CrMo/Q235 laminated shafts produced by cross wedge rolling,the heat treatment of the shafts was studied.Ten
本文研究如下的广义方程:   求(x)∈Ω,使0∈f((x))+G((x)),(1)   其中X,Y为Banach空间,Ω为X中的开集,f:Ω()X → Y为Fréchet可导映射(单值映射),G:X→2Y为闭图的集
The oxidation behavior of a newly designed Co-Ni-based alloy with varied addition of Ti (1.4 and 2.1 wt.%,hereafter referred as 1.4Ti and 2.1Ti alloys) was explo
2005年6月2日,中央文献研究室、中国延安精神 研究会和全国党的建设研究会联合举行纪念党的七大召开 60周年座谈会。在会上我聆听了原七大代表和几位领导 同志的发言,在继承