基于关注度的热点话题发现模型

来源 :第七届中文信息处理国际会议 | 被引量 : 0次 | 上传用户：qzl11320583407

【摘要】

：

因特网已成为人们获取信息的重要途径,如何发现网站上的热点话题、跟踪和预测话题的发展对于许多领域是非常有用的。本文提出一种"话题关注度"的量化表示方法,用于描述一定时

【作者】

：

罗亚平王枞周延泉

【机构】

：

北京邮电大学,智能科学技术研究中心,北京,100876

【出处】

：

第七届中文信息处理国际会议

【发表日期】

：

2007年10期

【关键词】

：

热点话题发现模型话题关注度用户浏览行为因特网话题指数量化方法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

因特网已成为人们获取信息的重要途径,如何发现网站上的热点话题、跟踪和预测话题的发展对于许多领域是非常有用的。本文提出一种"话题关注度"的量化表示方法,用于描述一定时间内站点上新闻话题受关注的程度,进而提出基于话题关注度和用户浏览行为的热点话题发现模型,该模型可以自动发现一段时间内网站上的热点话题。同时,使用"话题指数"来描述话题的发展过程。实验证明,基于用户浏览行为的热点话题发现模型比基于媒体关注度的热点话题发现模型具有更好的效果。

其他文献

汉语情感词语义倾向判别的研究

本文主要描述了意见挖掘中如何判定汉语语句情感词的语义倾向(极性)。我们不仅计算情感词的静态极性,而且通过分析它的上下文,计算情感词的动态(修饰)极性。从而提高了情感描

会议

汉语情感词语义倾向网络评论句法分析计算动态极性情感描述项

景德镇陶瓷行业经管类人才的队伍现状与未来建设方向

景德镇陶瓷行业经管类人才的队伍现状不容乐观.表现为平均学历职称水平远低于其它行业、人才流失严重、人才结构严重不合理、高端企业经管人才稀缺等等.集团化、专业化、品牌

期刊

景德镇陶瓷经管人才人才培养

汉语长距离回指的消解策略

长距离回指是回指的一种,其先行语一般在离回指语较远的上文中,从而增加了消解的难度。长距离回指消解一直是自然语言处理中的难题。本文以汉语为个案,旨在探讨长距离回指的

会议

汉语长距离回指回指消解算法向心理论脉络理论自然语言处理

基于一种新的合成核的中文实体关系自动抽取

实体关系的抽取是信息抽取中的一个重要问题。针对中文句法分析研究现状,本文首先设计了一种能够直接利用浅层语言特征的混合谱核来描述关系实例的上下文,并给出了基于广义后

会议

汉语依存图库建设研究

树库的构建是语料库语言学的重要组成部分。本文提出构建一种全新的汉语树库-依存图库.依存图表示可以突破以往树结构表示的局限,更好地表示词语之间的关系,对于汉语特殊结构

会议

汉语树库语料库语言学特殊结构结构表示构建图表示组成图库地表词语

基于SVM的多向量文本表示模型话题关联识别研究

本文在理论分析的基础上,并通过基准实验验证,提出一种多向量表示模型,该模型在尽量不丢失新闻报道信息的情况下,对特征集合尽可能细的划分,在模型比较时采用支持向量机对多

会议

话题关联识别文本表示多向量表示模型基准实验特征集合划分

基于FSVM层叠模型的中文命名实体识别

针对中文命名实体构成的复杂性,提出了一种基于模糊支持向量机的层叠模型。基于最长次长匹配一体化分词标注结果,在底层利用支持向量机基于单字特征进行人名、简单地名和机构

会议

层叠模型中文命名实体模糊支持向量机识别精度最长次长匹配一体化机构名异常数据词特征地名单字噪声样本系统人名构成词标

基于文本的概念分类自动获取技术

当今社会处于一个信息爆炸的时代,面对日益增长的海量信息,构建知识系统进行知识管理尤为重要.概念分类是知识系统的核心,但分类的构建是一项庞大的工作,如果完全采用人工方

会议

文本概念分类知识系统知识管理原型系统信息爆炸人工方式获取海量信息构建增长效率时代设计开发方法测试

基于文本类别信息熵的中文文档关键词提取

批量的对文本进行关键词抽取已经成为了情报检索领域相当有挑战性的工作。在本文中,一种全新的,基于文本统计类别信息熵的关键词抽取技术将被系统的介绍。此外,根据关键词,特

基于本体与框架的书本知识表示与获取的研究

基于本体与框架知识表示方法,提出并实现了一种高效并且能够半自动构建领域知识层次结构与概念间关系的方法。首先知识工程师利用BABEL结构化知识表示语言对书本知识中的章节

会议

基于关注度的热点话题发现模型

与本文相关的学术论文