中文文本分类模型的改进

来源 :第三届中国数据挖掘学术会议(CCDM2009) | 被引量 : 0次 | 上传用户:baoxiongwen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  在中文文本分类模型中提出了文本的KWP度量。在文本分类系统中SVM决策表上建立了CKWP约简方法,利用CKWP值标注训练集文本的方法改进了中文文本分类系统。
其他文献
  形状分析是计算机视觉领域的经典问题,目前已有大量关于形状分类问题的研究。但是,当处理大的非线性失真、特别是结构上或者关联上的失真时,许多形状分类方法往往无能为
会议
宁波银泰百货(东门店、天一店)是银泰百货集团浙东片区连锁店,是集百货、餐饮、娱乐、休闲于一体的大型综合性百货公司,营业面积5万多平方米,员工3000人。2007年4月29日,企业
  针对网络博客中文章或图片被非法复制盗用及传播问题,利用自然语言处理技术,结合电子签名技术,提出了双水印版权保护算法。算法基本思想是将版权认证信息处理后双嵌入,第二次
我所在的陕西省渭南市从1999年开始启动医保,2000年末,我转行做起了医保经办工作。3年来的酸甜苦辣,使我对医保经办工作从不懂到熟悉,从熟悉到熟练,从熟练到热爱。一段不长的
  人脸识别已经成为模式识别和图像处理的最新研究问题之一,尽管人们提出了许多人脸识别算法并且取得了很大的成绩,但是由于人脸表情、位置、方向和灯光的变化,从而使得人脸识
会议
期刊
  针对如何快速有效地搜索用户所需要的Web资源问题,文中在介绍HITS算法的基础上,分析其产生主题漂移的原因,并结合内容相关度策略,提出一种新的CSHITS搜索算法,该算法通过
  在特定领域问答系统中,领域知识直接影响问答效果,本文提出了一种领域问答答案提取方法,以问题分析得到问题查询、问题类型及答案类型为基础,借助领域知识检索获得答案提取候
会议
  话题跟踪是一项面向新闻报道信息流进行已知话题跟踪的信息处理技术,它通过训练得到的话题模型,识别出后续报道中与已知话题有关的报道,属于话题检测与跟踪的一项子任务。本
会议
天峨县六排镇个体户利燕军,利用稻草、玉米芯、玉米秆、黄豆秆、木屑、野生芭芒秆等农作物下脚料,每公斤种出鲜木耳1~1.5公斤、收入3元。利燕军今年37岁,高中毕业,从1982年始