虚拟社区热点话题意见挖掘模型研究

被引量 : 0次 | 上传用户:cc51wang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的蓬勃发展和Web2.0应用的兴起,用户已经成为互联网不可或缺的重要组成部分,用户产生内容已经成为互联网上最活跃、最受关注和最有价值的资源。用户产生内容源于真实世界,在很大程度上体现了用户的真实想法和感悟,具有较高的真实性。虚拟社区拥有数量最多的用户产生内容,因此,对虚拟社区和其内容进行挖掘具有理论意义和实用价值。本文的主要工作和创新成果包括以下几个方面:1.以虚拟社区为研究对象,讨论了虚拟社区的特点、结构和内容的组织方式,以及虚拟社区中话题的组成、结构和特征。对虚拟社区中的话题和主题的概念进行了区分,使用树形结构对话题进行表示,为后续研究奠定基础。2.提出基于结构信息的主题相关度算法。对话题中“跑题”现象的成因、特点以及对主题质量的影响进行了研究,提出用主题相关度评估主题中讨论内容与原主题的一致性。分别介绍了基于文本相似度算法的主题相关度算法和基于主题结构信息的主题相关度算法,通过实验对两种主题相关度算法进行比较。实验结果表明,本文提出的基于结构信息的主题相关度算法效果更好。3.提出多特征融合的分类方法。对互联网文本信息的多特征性进行了研究,充分考虑各项特征对于文本表现能力的差异。提出基于朴素贝叶斯分类算法的多特征融合的分类方法,并将方法应用于博客文章分类。实验结果表明,多特征融合的分类方法可以获得更高的准确率。4.在以上几点的基础上,提出了虚拟社区的话题提取、话题热度评估和话题意见挖掘方法,并将三者结合为一个整体,构建了虚拟社区热点话题意见挖掘模型。在话题提取方面,采用分类与聚类相结合的方法;在热度评估方面,提出从主题关注度、主题相关度和时效性三个方面综合评估主题的热度;在话题意见挖掘方面,通过对每个帖子的主观性、意见极性以及意见对象进行判断,最终得到用户对于话题的整体意见。实验结果表明,本文的话题提取方法准确率较高,热度评估结果与现实情况较为符合,意见挖掘结果在一定程度上能够反映用户对于话题的整体态度。因此,本文提出的热点话题意见挖掘模型是合理、有效的。
其他文献
清崇德元年(1636),“丙子之役”李朝由明朝的藩属国正式变为清朝的藩属国。这一转变形式上看似简单,但就李朝的思想观念而言,却经历了大约一个世纪的痛苦磨合过程。其过程具
本文从民间借贷形成的历史出发,简要概述了各国学者在该领域内的研究视角和研究现状。本文以民间借贷过程中发生的违约率为研究对象,通过滚雪球式抽样访谈结合问卷调查对研究
随着现代中枢神经康复机理研究的进展,国外研究人员利用机器人技术在辅助上肢运动功能康复方面开展了大量研究,这些大型的机器人系统在研发和推广上都有较大的难度。而我国在
本文认为,建州女真对财富的需求和明廷对女真朝贡的限制是女真犯边的主要原因。明廷对女真的犯边行为,最初是以招抚为主,由于女真首领拒不接受,才决定以武力征讨。明廷对女真
明代"三征麓川"是关系西南边疆稳定和国家安危的重要事件。明清史家由于对西南边疆地理环境、历史发展缺乏准确认识,或出于某些政治需要,用政治情感代替理性的史实分析,忽略
铁路在新疆城镇发展中具有重要作用,本文认为建国以来的铁路建设,在多方面促进了新疆城镇发展,也改变了新疆城镇的空间格局。但由于新疆铁路建设还远不够完善,还有必要加速建
数字信息时代带来了“信息大爆炸”,使数据量大增,而数字图像数据更是如此,如果不对图像数据进行有效的压缩,那么图像信息的存储与传输将无法进行。显然,寻求一种高效的图像
唐至清代是云南交通发展的重要时期。云南交通线的拓建与兴衰,不仅受到社会发展、经济开发等因素的影响,与封建王朝的治边方略亦密切相关。本文考述隋唐、宋朝、元朝、明朝和
履行新世纪新阶段我军历史使命,推进中国特色军事变革,做好军事斗争准备,关键在人才。加强军事人才能力建设,实施人才强军战略,提高军事核心竞争能力,关键是培养和造就一大批
康熙五十一年 ,穆克登查边定界缘于中朝两国边民私自越界 ,这与两国界河图们江、鸭绿江两江上游至发源地段从未勘界与划界有直接关系。本文就穆克登查边定界尚未清楚的问题 ,