Web社区中话题的发现与排序

被引量 : 4次 | 上传用户:buugly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web社区的蓬勃发展,互联网正逐步跨入社区时代。Web社区以其开放性、互动性和共享性深得广大网民的喜爱,成为网民表达思想、获取信息、互相交流以及建立社交圈的主要平台。如何对社区中的资源进行分类、整理、排序,将优质、有效的资源推荐给用户,以有效地提高社区资源的分享和利用,具有重要的意义。本文面向虚拟社区领域,使用话题发现技术和话题排序技术对其话题信息进行挖掘。在话题发现中,本文通过选择合适的话题发现模型对从Web页面中提取的与话题相关的主题进行分析,然后运用单遍聚类算法实现了话题发现;在话题排序中,本文根据社区网页特点建立了话题排序特征模型,然后根据话题排序得分实现了话题排序。通过话题发现和话题排序,本文实现了将社区中的信息按照所表达的主题进行归类和组织,并以有序的形式展现给用户,从而有效地管理和组织了社区中的信息,可方便用户在动态变化的社区环境下查看自己感兴趣或需要的信息。本文的创新点如下:(1)在话题发现和建立话题模型时,将主题与评论相结合,从而使获得的话题信息更为全面。(2)在话题排序时,本文通过对Web社区网页进行分析,选出话题的最近发布时间、最远发布时间、主要发布时间、被点击次数、被评论次数、当前评论增长速度,平均评论数和当前评论数作为排序特征,从而解决了传统话题排序中使用单一的点击数或更新时间来进行话题排序的不足。(3)在确定权重向量时,结合用户参与评判的方法提出了一种新的确定排序特征向量权重的方法,实验证明,通过该方法得到的权重向量使本文得到了较好的排序结果。本文的实验对象为国内最大的三个社区网站:猫扑大杂烩、天涯社区和腾讯社区。实验证明,本文所提出的社区话题发现和排序方法是可行的,且排序结果良好。
其他文献
特殊灯芯绒,如仿平绒类灯芯绒、涤棉类灯芯绒、竹棉类灯芯绒、粘棉类灯芯绒、麻棉类灯芯绒、彩棉灯芯绒和霜花灯芯绒等,由于纤维的组织规格差异,其前处理工艺与常规灯芯绒存在很
大连海关缉私局成立十年以来,破获的走私犯罪案件数量、抓获的犯罪嫌疑人数量都有着大幅的增长。情报工作在缉私办案中的地位和作用日益凸显,所担负的职责更加繁重,任务更加
关于如何定义日本的武士道,这恐怕不单单是学术上所引人关注的研究课题。何为武士道,以一般理论阐述,就是在日本幕府时代,武士必须遵守的封建道德。从明治时代一直到第二次世
涉诉信访是目前困扰法院工作、影响社会稳定的一大难题。近年来,虽然对解决涉诉信访问题进行了诸多改革的尝试,但涉诉信访的形势却更加严峻,信访要求常常超出司法的范畴,信访
建设服务型政府是我国行政体制改革的目标之一。笔者通过分析服务型政府的研究现状,引入深刻影响当代政府治理和行政管理的“新公共服务”理论,提出在海关构建以服务型政府管
船舶轴承负荷测量结果,是检验轴系校中质量的重要标准,《钢质海船入级规范2006》要求对轴系安装后,一般应对轴系校中结果进行实测验证。通过现场检验与理论结合,对现场轴承负荷测
舰船的生命力是舰船的重要性能指标之一,水下爆炸的破坏力对舰船等水中结构物构成了严重的威胁。由于水下爆炸的各种特性,水下爆炸的研究别具吸引力。人们采用各种方法对其进
现代公司治理中,内部审计已经被人们公认为影响公司治理的一个重要因素,内部审计、外部审计、董事会以及高层管理人员被认为是有效公司治理的四大基石,在公司管理体系中起到
高校BBS论坛信息内容与学校日常工作、校园学生活动密切相关,其信息不仅丰富而且更新速度很快,但是各BBS站点的结构划分比较复杂而且混乱,如何有效地组织并利用这些资源信息
2008年全国海关关长会议首次提出了关于海关传统和非传统职能的理论论断,即“海关税收、监管、保税、打私、统计等传统职能任务更加艰巨,维护贸易安全与便利、保护知识产权、
学位