基于关注度的热点话题发现模型

来源 :第七届中文信息处理国际会议 | 被引量 : 0次 | 上传用户:qzl11320583407
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
因特网已成为人们获取信息的重要途径,如何发现网站上的热点话题、跟踪和预测话题的发展对于许多领域是非常有用的。本文提出一种"话题关注度"的量化表示方法,用于描述一定时间内站点上新闻话题受关注的程度,进而提出基于话题关注度和用户浏览行为的热点话题发现模型,该模型可以自动发现一段时间内网站上的热点话题。同时,使用"话题指数"来描述话题的发展过程。实验证明,基于用户浏览行为的热点话题发现模型比基于媒体关注度的热点话题发现模型具有更好的效果。
其他文献
本文主要描述了意见挖掘中如何判定汉语语句情感词的语义倾向(极性)。我们不仅计算情感词的静态极性,而且通过分析它的上下文,计算情感词的动态(修饰)极性。从而提高了情感描
景德镇陶瓷行业经管类人才的队伍现状不容乐观.表现为平均学历职称水平远低于其它行业、人才流失严重、人才结构严重不合理、高端企业经管人才稀缺等等.集团化、专业化、品牌
长距离回指是回指的一种,其先行语一般在离回指语较远的上文中,从而增加了消解的难度。长距离回指消解一直是自然语言处理中的难题。本文以汉语为个案,旨在探讨长距离回指的
实体关系的抽取是信息抽取中的一个重要问题。针对中文句法分析研究现状,本文首先设计了一种能够直接利用浅层语言特征的混合谱核来描述关系实例的上下文,并给出了基于广义后
会议
树库的构建是语料库语言学的重要组成部分。本文提出构建一种全新的汉语树库-依存图库.依存图表示可以突破以往树结构表示的局限,更好地表示词语之间的关系,对于汉语特殊结构
本文在理论分析的基础上,并通过基准实验验证,提出一种多向量表示模型,该模型在尽量不丢失新闻报道信息的情况下,对特征集合尽可能细的划分,在模型比较时采用支持向量机对多
针对中文命名实体构成的复杂性,提出了一种基于模糊支持向量机的层叠模型。基于最长次长匹配一体化分词标注结果,在底层利用支持向量机基于单字特征进行人名、简单地名和机构
当今社会处于一个信息爆炸的时代,面对日益增长的海量信息,构建知识系统进行知识管理尤为重要.概念分类是知识系统的核心,但分类的构建是一项庞大的工作,如果完全采用人工方
批量的对文本进行关键词抽取已经成为了情报检索领域相当有挑战性的工作。在本文中,一种全新的,基于文本统计类别信息熵的关键词抽取技术将被系统的介绍。此外,根据关键词,特
基于本体与框架知识表示方法,提出并实现了一种高效并且能够半自动构建领域知识层次结构与概念间关系的方法。首先知识工程师利用BABEL结构化知识表示语言对书本知识中的章节
会议