基于知网和话题更新的话题跟踪算法研究

来源 :第三届中国数据挖掘学术会议(CCDM2009) | 被引量 : 0次 | 上传用户:lyang1990x
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  话题跟踪是一项面向新闻报道信息流进行已知话题跟踪的信息处理技术,它通过训练得到的话题模型,识别出后续报道中与已知话题有关的报道,属于话题检测与跟踪的一项子任务。本文在现有的向量空间描述文档的基础上,实现了一个基于话题更新的话题跟踪算法,提出了基于知网的近义动词分析的跟踪算法以及基于知网的近义动词分析和话题更新的话题跟踪算法,实验表明话题更新和同义词近义词的消除有助于提高话题跟踪系统的性能。
其他文献
  图像阈值化是一种直观有效的图像分割技术,在图像分析、模式识别及计算机视觉中具有重要应用。传统的阈值化方法通常基于某个特定的优化问题,需要在整个灰度范围内搜索最
会议
为了提高我区柑桔的品质 ,1999年在芦柑、温州蜜柑和脐橙稳果后喷施云大—120、长效—120的试验。试验结果表明1000倍云大—120、长效—120对促进枝叶生长 ,提高结实率 ,增大
  形状分析是计算机视觉领域的经典问题,目前已有大量关于形状分类问题的研究。但是,当处理大的非线性失真、特别是结构上或者关联上的失真时,许多形状分类方法往往无能为
会议
宁波银泰百货(东门店、天一店)是银泰百货集团浙东片区连锁店,是集百货、餐饮、娱乐、休闲于一体的大型综合性百货公司,营业面积5万多平方米,员工3000人。2007年4月29日,企业
  针对网络博客中文章或图片被非法复制盗用及传播问题,利用自然语言处理技术,结合电子签名技术,提出了双水印版权保护算法。算法基本思想是将版权认证信息处理后双嵌入,第二次
我所在的陕西省渭南市从1999年开始启动医保,2000年末,我转行做起了医保经办工作。3年来的酸甜苦辣,使我对医保经办工作从不懂到熟悉,从熟悉到熟练,从熟练到热爱。一段不长的
  人脸识别已经成为模式识别和图像处理的最新研究问题之一,尽管人们提出了许多人脸识别算法并且取得了很大的成绩,但是由于人脸表情、位置、方向和灯光的变化,从而使得人脸识
会议
期刊
  针对如何快速有效地搜索用户所需要的Web资源问题,文中在介绍HITS算法的基础上,分析其产生主题漂移的原因,并结合内容相关度策略,提出一种新的CSHITS搜索算法,该算法通过
  在特定领域问答系统中,领域知识直接影响问答效果,本文提出了一种领域问答答案提取方法,以问题分析得到问题查询、问题类型及答案类型为基础,借助领域知识检索获得答案提取候
会议