面向引文网络的科学文献影响力评价和社区发现研究

来源 :北京工业大学 | 被引量 : 1次 | 上传用户:yobisisi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
引文网络(Citation Network,CN)是一种特殊的社会网络,通过文献间的引用关系构建一个大规模的复杂网络,一篇文献的发表形成了网络中的一个节点,文献通过引用其他文献形成网络中的有向边。引文网络中包含丰富的期刊、作者和研究领域等内容属性,蕴含着知识流和信息流的传播。随着科学文献数量的急剧增多,如何准确识别有价值的研究文献成为了一个重要的问题。为此,本文在深入研究数据挖掘算法基础上,开展了科学文献影响力评价和主题社区发现两个研究方面的工作:(1)学术影响力评价一直是文献计量学领域的一个研究热点。已有的一些基于数据挖掘的学术影响力评价方法大多忽略了恶意活动产生的影响,导致评价结果欠佳。为解决这一问题,提出了一种称为ReputeRank的新方法,它采用信誉机制来评估引文网络中出版物的有效性。信誉机制包括三个阶段,种子集选择阶段,信誉传播阶段和集成计算阶段。首先,ReputeRank利用SCI期刊分区信息选择引文网络中潜在的好种子和坏种子。然后,根据信誉传播思想,使用TrustRank和Anti-TrustRank评价公式在引文网络中迭代地传播信任值和不信任值。最后,根据引文网络中的信任值和不信任值,利用综合集成公式对每篇论文计算评分,并根据评分结果对所有论文降序排列。在KDD cup 2003数据集的实验结果表明。与3种影响力评价方法PageRank、CountDegree和SPRank进行对比,ReputeRank能够得到更优的效果。(2)引文网络社区发现一直是复杂网络的研究热点。传统的研究方法将引文网络看做静态图来进行社区发掘,忽视了引文网络随时间演化的动态特性。为了进一步提高引文网络社区发现的准确率,本研究提出一种基于伯努利生成主题模型和引领者-追随者策略的引文网络动态社区发现方法。首先根据伯努利生成主题模型生成主题概率分布矩阵,然后结合主题分布概率和引领者-追随者策略识别每一时间段内网络中的的引领者节点和追随者节点,最后按照时间维度将跟随同一引领者的节点归为一个社区。在CiteSeer和Cora数据集的实验结果证明,本研究提出的方法与其他3种经典算法相比,在标准化互信息(Normalized Mutual Information,NMI)和模块度两项综合评价指标上效果较优。
其他文献
<正>对于中国跑步爱好者来说,整个11月几乎成了路跑主题月,从月初的杭州马拉松、上海马拉松,到月中的2014约赛网四季跑·长沙站,再到月底的广州马拉松,几乎在每个周末都会有
<正>企业名称:优客工场(北京)创业投资有限公司成立时间:2015年4月总部所在地:北京企业格言:让平行世界的人相互遇见关于优客工厂优客工场(北京)创业投资有限公司成立于2015
目的分析盐酸替罗非班联合低分子肝素治疗不稳定型心绞痛(unstable angina pectoris,UAP)的临床疗效。方法选取UAP患者110例,随机均分为2组(n=55)。对照组给予低分子肝素钙皮
厌氧消化残余物(沼渣)是沼气工程的副产品,含有较多有机物,若不加以利用,可能会对环境造成二次污染。常见处理沼渣的方式是经过简单堆沤后直接施入农田,对作物有较好的促生作用
本文主要从亏损结转、固定资产折旧、存货成本计价、业务招待费、捐赠等方面入手,结合具体案例,研究企业如何通过合理地筹划来增加其税前扣除金额,进而达到节税的目的。
在线社交网络图像通常携带大量的社交网络元数据,包含了丰富的图像语义信息,可以帮助用户区分图片中的内容.提出一种基于社交网络元数据的图像分类(multiple social metadata
目的分析长春地辛与长春新碱治疗儿童初发急性淋巴细胞白血病(ALL)的临床疗效。方法根据治疗方式的不同,将116例初发ALL患儿分为两组各58例,在化疗诱导期、强化期,A组患儿应
目的探讨原发性肾小细胞癌的病理诊断和临床病理特点。方法对1例肾小细胞癌进行光镜、电镜观察和免疫组化标记并行相关文献复习。结杲结节状肿瘤位于肾下部近肾门处,瘤组织由
中国水上项目成绩日益稳步上升,与国家队及各省市队注重科学化训练、聘请外教、接受新理念密切相关。上海赛艇队外教Tonks结合其成功执教经历,从赛艇运动员培养的基础保障、