一种结合文本和链接分析的局部Web社区识别技术

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:chenliu2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前Web社区识别算法大都基于纯链接分析,忽略了Web的文本属性.针对Flake等人提出的基于最大流算法的社区识别框架的不足(如赋予网页之间的链接不公平的权重、排序策略单一等),提出了一种结合网页内容分析与链接分析的改进算法.首先,提出一种新的基于文本相似度的边容量分配方法.基于网页间内容越相似彼此传递的权威度越大的特点,将网页的内容相似度用于Web图的边容量设置上,具体策略为Max-flow+TF—IDF边容量设置和Max-flow+TF-IDF+Seeds边容量设置.其次,提出的社区结点的排序策略充分
其他文献
当滔滔长江水即将随三峡工程涨起来逼近重庆市开县旧县城,一座新县城正在快速崛起的时候,一个特殊的称谓也在这块土地上传开:“移民支书”。这位被称为“移民支书”的人,就是开县
贵州省重奖率先越过温饱线的先进县本刊记者益明,沛然1996年12月23日,中共贵州省委、省人民政府在贵阳市隆重表彰1996年率先越过温饱线的息烽、凤岗、独山、荔波、镇宁、岑巩6个县,并给予每县
乌江赤子——一个县长与一个国贫县的故事重庆予矛一武陵山系逶迤绵延,大娄山脉莽莽森森。其间龙走蛇行奔腾千里的乌江犹如一条连结母体坚韧的生命脐带。武隆的子民受孕于此,繁
基于标量场的变形技术是计算机图形学中的研究热点之一,其时效性问题一直未得到很好的解决.从自适应采样距离场的表示方法和基于物理的建模技术的优点出发,提出了一种基于GPU
微软打算成立一个开放技术子公司,以推动开源项目的建设和标准的制订.这家名为微软开放技术的子公司在声明中称,新的公司将由微软高管Jean Paoli担任该公司总裁,并且公司也将会在
扶贫攻坚重在启动贫困户的内力河北乔登贵近年来,国家从财政、金融上对贫困地区重点倾斜,大力扶持,对改善贫困地区贫穷落后面貌起到了很大作用。特别是从1994年起,国家实施了《八七扶
股静脉穿刺是婴幼儿常用的采血方法之一,我科传统的穿刺方法是直刺,1996年3月~1997年5月,笔者用股静脉斜刺与直刺两种不同进针方法进行比较,发现斜刺效果明显优于直刺,现总结如下。
根据资料揭示,结核病在发达国家发病率出现了回升趋势,在发展中国家结核病控制不力,绝对数有增无减;估计我国目前有肺结该病人600万左右.临床上将肺结核病诊断为非肺结核病,