一种结合文本和链接分析的局部Web社区识别技术

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户：chenliu2009

【摘要】

：

当前Web社区识别算法大都基于纯链接分析，忽略了Web的文本属性．针对Flake等人提出的基于最大流算法的社区识别框架的不足（如赋予网页之间的链接不公平的权重、排序策略单一等），提

【作者】

：

张宪超徐雯高亮梁文新

【机构】

：

大连理工大学软件学院

【出处】

：

计算机研究与发展

【发表日期】

：

2012年11期

【关键词】

：

Web社区识别最大流算法文本相似度 WEB挖掘信息检索 Web community identification maximum flow algori

【基金项目】

：

基金项目：国家白然科学基金项目（61272374）,教育部新世纪优秀人才支持计划项目（NCET-11-0056）,高等学校博士学科点专项科研基金（新教师类）项目（20100041120033）,中央高校基本科研业务费专项资金项目（DUT10JR02）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

当前Web社区识别算法大都基于纯链接分析，忽略了Web的文本属性．针对Flake等人提出的基于最大流算法的社区识别框架的不足（如赋予网页之间的链接不公平的权重、排序策略单一等），提出了一种结合网页内容分析与链接分析的改进算法．首先，提出一种新的基于文本相似度的边容量分配方法．基于网页间内容越相似彼此传递的权威度越大的特点，将网页的内容相似度用于Web图的边容量设置上，具体策略为Max-flow＋TF—IDF边容量设置和Max-flow＋TF-IDF＋Seeds边容量设置．其次，提出的社区结点的排序策略充分

其他文献

移民支书——记重庆市开县汉丰镇中集村党支部书记余万才

当滔滔长江水即将随三峡工程涨起来逼近重庆市开县旧县城，一座新县城正在快速崛起的时候，一个特殊的称谓也在这块土地上传开：“移民支书”。这位被称为“移民支书”的人，就是开县

期刊

村党支部书记三峡移民火电厂重庆市山区电站开县移民工作三峡工程周转房村干部

陈俊生在四川考察指出打好扶贫攻坚战贵在苦干实干

期刊

扶贫攻坚贫困地区阿坝州四川省阿坝藏族羌族自治州扶贫开发攻坚民族聚居地区农田基本建设政治稳定农村贫困人口

贵州省重奖率先越过温饱线的先进县

贵州省重奖率先越过温饱线的先进县本刊记者益明，沛然１９９６年１２月２３日，中共贵州省委、省人民政府在贵阳市隆重表彰１９９６年率先越过温饱线的息烽、凤岗、独山、荔波、镇宁、岑巩６个县，并给予每县

期刊

贵州省温饱线扶贫攻坚先进县绝对贫困桑塔纳轿车扶贫工作群众温饱省人民政府实现小康

乌江赤子─—一个县长与一个国贫县的故事

乌江赤子——一个县长与一个国贫县的故事重庆予矛一武陵山系逶迤绵延，大娄山脉莽莽森森。其间龙走蛇行奔腾千里的乌江犹如一条连结母体坚韧的生命脐带。武隆的子民受孕于此，繁

期刊

武隆县乌江烤烟生产芙蓉洞工程建设县长礼仪小姐农业综合开发解放思想对外开放

一种基于GPU的标量场驱动物理变形算法

基于标量场的变形技术是计算机图形学中的研究热点之一,其时效性问题一直未得到很好的解决.从自适应采样距离场的表示方法和基于物理的建模技术的优点出发,提出了一种基于GPU

期刊

标量场基于物理的变形粒子弹簧系统自适应动态调整GPUscalar field physically-based deformation mass-

有感于潘森仁“吃螃蟹”

期刊

领导干部纳爱斯化工股份有限公司纳爱斯公司螃蟹机构改革干部队伍浙江丽水党政干部工业企业陈旧观念

微软为开源项目成立子公司

微软打算成立一个开放技术子公司，以推动开源项目的建设和标准的制订．这家名为微软开放技术的子公司在声明中称，新的公司将由微软高管Jean Paoli担任该公司总裁，并且公司也将会在

期刊

开源项目微软开放技术Jean互通性

扶贫攻坚重在启动贫困户的内力

扶贫攻坚重在启动贫困户的内力河北乔登贵近年来，国家从财政、金融上对贫困地区重点倾斜，大力扶持，对改善贫困地区贫穷落后面貌起到了很大作用。特别是从１９９４年起，国家实施了《八七扶

期刊

扶贫攻坚贫困户贫困农民内在动力脱贫致富基本农田小尾寒羊优惠政策致富典型扶贫资金

股静脉穿刺采血方法的比较

股静脉穿刺是婴幼儿常用的采血方法之一，我科传统的穿刺方法是直刺，1996年3月～1997年5月，笔者用股静脉斜刺与直刺两种不同进针方法进行比较，发现斜刺效果明显优于直刺，现总结如下。

期刊

股静脉穿刺采血方法婴幼儿护理

加强临床思考提高肺结核诊断水平

根据资料揭示,结核病在发达国家发病率出现了回升趋势,在发展中国家结核病控制不力,绝对数有增无减;估计我国目前有肺结该病人600万左右.临床上将肺结核病诊断为非肺结核病,

期刊

肺结核误诊诊断水平临床思维X线检查

一种结合文本和链接分析的局部Web社区识别技术

与本文相关的学术论文