文本分类中连续属性离散化方法的研究

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户：xingfuli2009

【摘要】

：

针对机器学习领域的一些分类算法不能处理连续属性的问题，提出一种基于词出现和信息增益相结合的多区间连续属性离散化方法．该算法定义了一个离散化过程，离散化了采用传统信息检

【作者】

：

董乐红耿国华周明全

【机构】

：

西北大学信息科学与技术学院,北京师范大学信息科学与技术学院

【出处】

：

小型微型计算机系统

【发表日期】

：

2009年11期

【关键词】

：

机器学习文本分类信息增益连续属性离散化 BOOSTING算法 machine learning text categorization informat

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对机器学习领域的一些分类算法不能处理连续属性的问题，提出一种基于词出现和信息增益相结合的多区间连续属性离散化方法．该算法定义了一个离散化过程，离散化了采用传统信息检索的加权技术生成的非二值特征词空间，然后判断原特征空间中每个特征词属于或不属于某给定子区间，将问题转换成二值表示方式，以使得这些分类算法适用于连续属性值．实验结果表明，该算法离散过程简单高效，预测精度高，可理解性强．

其他文献

梨花粉管细胞骨架结构变化的调控研究

细胞骨架在植物细胞的生长发育过程中起着重要的作用。本研究利用砂梨品种‘丰水’和‘今村秋’的花粉和花柱为试材,研究了细胞骨架在梨花粉管生长发育以及胁迫过程中的作用,

学位

细胞骨架梨花粉管自交不亲和钙离子

对椭圆一个定值问题的研究

受姜老师的文[1]启发，对椭圆另一定值问题进行了研究，整理成文如下：

期刊

椭圆定值问题高中数学解析几何

用土工膜做混凝土面板堆石坝垫层防护层的现场试验

<正> 一、前言混凝土面板堆石坝施工期安全渡汛是一个非常重要的技术问题。其技术关键,一个是坝坡面板垫层的防护,另一个是坝体的渗透稳定。本文就前一个问题,结合西北口混凝

期刊

土工膜混凝土面板堆石坝垫层料现场试验防护层

血清多肽组及其个体差异的纳升液相色谱-高分辨串联质谱分析

分析和比较疾病组及健康对照组的混合样品是血清多肽组生物标记物研究的常用方法,但对健康个体多肽组的差异和共性关注较少。本研究利用纳升液相色谱-高分辨四级杆飞行时间质

期刊

多肽组高分辨飞行时间质谱血清个体差异

护士应对方式与工作投入的相关性分析

目的:调查临床护士应对方式与工作投入的现状,并探讨二者之间的相关性。方法:采用一般资料调查表、应对方式评定量表和护士工作投入量表对郑州市2所三级甲等医院237名临床护

期刊

护士应对方式工作投入

日本护理服务的职业道德教育模式借鉴

从服务业的产业发展的角度看,职业道德教育是职业教育的核心内容之一;从社会保障的文明进步看,护理服务业的职业道德教育不仅关系到老年福利性护理服务的文明、诚信,关系到社

期刊

日本护理服务职业道德培养介护人员素质教育

内隐学习理论在高校篮球训练中的应用

内隐学习是认知心理学教育方式的一种,突出强调在学生没有察觉的情况下学习知识技能.内隐学习理论在篮球训练应用方面具有很大的优势.在篮球训练过程中构建良好的内隐学习情

期刊

内隐学习高校篮球训练应用

浅谈机场运营效率影响机制及提升策略

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

期刊

机场运营效率影响机制提高对策

急性绞窄性肠梗阻术式选择对预后的影响

目的：探讨急性绞窄性肠梗阻手术治疗中，手术方式的选择会对病情的转归和预后产生怎样的影响。方法：总结2005年~2013年65例绞窄性肠梗阻分别采用传统手术方式与改良手术方式，并对

期刊

绞窄性肠梗阻感染性休克细菌移位炎性介质

高血压脑出血术后再出血22例临床原因及对策

目的：探讨高血压脑出血术后再出血的临床原因，提出相应对策。方法：总结高血压脑出血术后再出血22例患者的临床资料，分析原因。结果：22例患者中，再次手术18例，非手术治疗2例，放弃治疗2

期刊

高血压脑出血术后再出血原因对策

文本分类中连续属性离散化方法的研究

与本文相关的学术论文