多类多标签汉语文本自动分类的研究

来源 :情报学报 | 被引量 : 0次 | 上传用户：a1218616

【摘要】

：

本文提出了一种高效的汉语文本分类方法,并在实验中收到了良好的效果.由于汉语文本的特殊性,在训练前对训练文本进行自动分词和降维预处理.许多文本往往可能归到多个类,分类

【作者】

：

施彤年卢忠良荣融王家云

【机构】

：

上海交通大学计算机与工程系,国防科技大学电子科学与工程学院,解放军61587部队

【出处】

：

情报学报

【发表日期】

：

2003年3期

【关键词】

：

汉语文本特征提取自动分类自动分词降维预处理 BOOSTING算法多类多标签

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文提出了一种高效的汉语文本分类方法,并在实验中收到了良好的效果.由于汉语文本的特殊性,在训练前对训练文本进行自动分词和降维预处理.许多文本往往可能归到多个类,分类算法采用改进的Boosting算法.实验表明,在多类多标签的汉语文本特征提取和文档分类中,该算法收敛快、准确性高、综合效果较好.

其他文献

三种二氧化氯溶液杀菌效果的比较

三厂家生产的二氧化氯产品 ,同样加 2 0 %柠檬酸激活 30min ,溶液 pH值分别为 3 85、 2 39与2 52 ,二氧化氯含量分别为 186 53mg/L、 2 544 0mg/L与 144 50mg/L。pH 3 85的

期刊

二氧化氯杀芽胞剂枯草杆菌黑色变种大肠杆菌

Krupp—VDM GmbH厂冷轧带钢设备的现代化改造

德国Ｗｅｒｄｏｈｌ的Ｋｒｕｐｐ－ＶＤＭＧｍｂＨ厂已经实现了冷轧带钢设备的现代化改造。老式四辊轧机改造为六辊可逆轧机。通过技术改造，可生产镍、镍合金和特殊高级钢的带材，具有轧制道次少，减少中间退火工艺、带材

期刊

带钢冷轧机设备改造

外资抄底分众传媒

本统计期内（8月24日至8月30日）,美国股市一路高歌上涨,美股三大指数均创历史新高。亚太和欧洲股市则出现小幅反弹,其中A股三大指数在中阳线拉升之后再次出现回调。资金面上,8月

期刊

分众传媒外资货币市场利率美国股市资金面央行回购美股

盘点A股历史的政策底

自2000年以来，A股公认的市场底部一共有3次。以上证综指为例，分别是2005年的6月6日的998．23点：2008年10月28日的1664．93点和2013年6月25目的1849．65点。

期刊

A股政策历史盘点2008年上证综指市场

如何打造一个新牛市

A股历来都是牛短熊长，什么原因？主要是股票供给端出了问题。我们之前也谈过，A股市场选时比选股更重要。既然社保基金都注重选时，那普通老百姓为什么不呢？大资金都要注意选时的重要

期刊

牛市A股市场中小投资者股票供给社保基金选时老百姓数据表

索罗亚的“白色西班牙”

喜欢看西班牙电影的朋友一定会有这样一个印象：西班牙人似乎从不忌惮讲粗话和展示裸露的躯体。在西班牙电影中，各种直译过来会让严肃者脸红的街头俚语自成一道风景，而男女裸体的

报纸

潍坊市手足口病疫情调查分析

2007年，我省出现手足口病疫情爆发。为快速评估我市手足口病发病情况，于5月下旬开展全市疫情调查，现将调查情况分析如下。

期刊

手足口病疫情调查潍坊市疫情爆发发病情况快速评估

幼儿歌曲弹唱在高职钢琴教学中的重要性研究

对于高职幼儿发展与健康管理专业的学生来说,钢琴幼儿歌曲弹唱是必须要熟悉和掌握的一项工作技能。然而,当前幼儿发展与健康管理专业钢琴弹唱课程教材存在的陈旧化、教学模式

期刊

幼儿歌曲弹唱高职幼儿发展与健康管理钢琴教学

聚焦医疗人工智能:辅助医疗,减少误诊漏诊

<正>"内科怎么走?""请问您想找哪个内科?还是说想去内科住院大楼?""我找消化内科。""请您到大厅里乘坐扶梯或电梯到五层B区北侧,科室在五层的详细位置请看下面的地图。"这段

期刊

总医院门诊楼中山大学附属肿瘤医院人工智能食管内镜

环球股市大调整（上）

10月10日是辛亥革命107周年纪念日，这一日美国道琼斯工业平均指数大跌831点，纳斯达克指数重挫4%!次日，亚太区股市跟随大跌。中国A股市场暴跌5．9名，反映蓝筹股走势的上证50指数都暴

期刊

A股市场道琼斯工业平均指数调整中国股市辛亥革命加权指数纪念日亚太区

多类多标签汉语文本自动分类的研究

与本文相关的学术论文