基于模式聚合和决策树的文本分类规则抽取

来源 :情报科学 | 被引量 : 0次 | 上传用户：lingfangzhi12

【摘要】

：

本文首先提出一种改进的X^2统计量，以此衡量词条对文本分类的贡献。然后根据模式聚合理论，将对各文本类分类贡献比例相近似的词条聚合为一个特征，建立出文本集的特征向量空间模

【作者】

：

王煜王正欧

【机构】

：

河北大学数学与计算机学院,天津大学系统工程研究所

【出处】

：

情报科学

【发表日期】

：

2006年1期

【关键词】

：

规则抽取模式聚合 X^2统计量决策树 rule extraction pattern aggregation X^2 statistic decision

【基金项目】

：

国家自然科学基金资助项目（60275020）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文首先提出一种改进的X^2统计量，以此衡量词条对文本分类的贡献。然后根据模式聚合理论，将对各文本类分类贡献比例相近似的词条聚合为一个特征，建立出文本集的特征向量空间模型。此方法有效地降低了文本特征向量空间的维数。最后使用决策树进行分类，从而既保证了分类精度又获得了决策树易于抽取可理解的分类规则的优势。

其他文献

谈准确翻译“你(您)辛苦了!”

期刊

准确翻译使用对象接头词接尾词服务性劳动职务等句子结构日语摆老资格外交使团

谈九六、九七年大学日语四级考试作文──形式与技能

谈九六、九七年大学日语四级考试作文──形式与技能清华大学冯峰通观近两年的全国日语四级考试作文卷，除了感到学生的日语水平逐年有所提高的可喜之处外．也感到仍然存在一些带

期刊

四级考试作文大学日语日语写作写作文大学生日语学习简体大学日语教学语言基础知识文体

消化道穿孔超声检查临床应用的评价

目的：为了评价普通超声在诊断消化道穿孔中的价值。方法：１１９例经手术证实的消化道穿孔病人，术前行Ｘ线检查，６８例术前行普通超声检查。将所有的检查结果进行回顾性评价及对比分析。结果：行

期刊

消化道穿孔超声X-RAY诊断应用Digestive tract perforationUltrasonography X ray

拍照留念最重要

中国人最喜欢拍照！不管是否承认，无论何时何地，你都可以看到手里拿着相机的旅游者，在数码相机越来越普及的今天，拍照从来没有像现在这样方便过，按下快门就可以了，剩下的事情就是把你

期刊

拍照数码相机中国人冲印店存储卡

日本人对醉汉是否太宽容？

在日本铁路新大久保站发生惨祸之后，仍不断发生醉汉掉下站台的事故。也可能是由于天气骤然变冷，归家途中饮酒的人增多的缘故。酒后驾车引起的事故，几乎每天都有报导。醉酒引发的

期刊

《日本人对醉汉是否太宽容?》文学翻译杂文日本

因特网的基础知识与基本操作（2）

接着上一期的话题,今天我们起动视窗95系统的计算机,利用ィンタ一ネット·ェクスプロ一ラ(internet explorer,即IE浏览器)访问因特网3w.当然,你也可以用ネットスケ一プ&#

期刊

因特网操作技术软盘保存访问地址搜索引擎

浙江青山湖国家森林公园环湖绿道1期景观绩效评价

【目的】以浙江青山湖国家森林公园环湖绿道1期为例,从环境、经济、社会等3个方面对其景观绩效进行定量和定性评价,客观反映绿道建设的综合效益。【方法】建立相应的评价指标

期刊

绿道景观绩效评价青山湖国家森林公园greenwaylandscape performanceassessmentQingshan Lake Nation

空,回肠出血的影像学诊断

目的探讨空，回肠出血的最佳影像检查方法，方法对１０例空，回肠出血的患者，将影像学表现与手术结果进行对比分析，结果术前明确诊断９例，可疑诊断１例，其中小肠肿瘤５例，美克尔憩室２例，血管异

期刊

小肠出血X线CT空肠出血回肠出血JejunumIleumHemorrhageRadiography

知识服务与创建学习型图书馆

论文阐述了知识服务产生的背景以及在当今信息和网络时代建立相应的知识服务组织所面临的挑战，简要介绍了学习型图书馆的概念和主要特征，着重论述了创建学习型图书馆所面临的优

期刊

知识服务学习型图书馆信息资源knowledge service study type library information source

沙门菌感染对小鼠白细胞总数及其亚群动态变化的影响

为研究沙门菌感染对小鼠白细胞总数及其亚群动态变化的影响,采取腹腔注射的方法给小鼠接种6.5×10^9 CFU/mL浓度的沙门菌0.1 mL/只,分别在4、6、8、12、16和24 h采集小鼠

期刊

沙门菌小鼠白细胞总数粒细胞淋巴细胞单核细胞Salmonellamicetotal number of white blood cellsgranul

基于模式聚合和决策树的文本分类规则抽取

其他学术论文