【摘 要】
:
网络文献知识库中的海量资源及其分类的粗粒度,导致学习者容易在文献检索和阅读过程出现认知迷航和知识过载问题。该文提出一种基于Map Reduce的知识聚类与统计机制:首先,提
【基金项目】
:
国家自然科学基金(61202004;61472192);教育部科技发展中心网络时代的科技论文快速共享专项研究(2013116);江苏省高校自然科学研究计划(14KJB520014)~~
论文部分内容阅读
网络文献知识库中的海量资源及其分类的粗粒度,导致学习者容易在文献检索和阅读过程出现认知迷航和知识过载问题。该文提出一种基于Map Reduce的知识聚类与统计机制:首先,提出基于Map Reduce的共现矩阵构建算法MR-Co Matrix;其次,将共现矩阵与相似度系数结合构建相似度矩阵;然后,通过Z Scores对相似度矩阵进行标准化;最后,使用离差平方和法(Ward,s method)对相似度矩阵进行聚类,生成树状的知识聚类谱系图;基于聚类结果,提出基于Map Reduce的知识文献统计算法MR-Statistics,对每个分类的知识属性进行统计。实验结果表明:将MR-Co Matrix和MR-Statistics方法应用于网络文献知识库进行知识聚类和统计,达到较理想的聚类精度和计算效率,实现了细粒度知识聚类和多维统计,同时减少了时间开销。
其他文献
人体的衰老是许多内在和外在因素促成的复杂现象。随着社会的进步,人们越来越重视健康和寿命,因此预防和延缓衰老受到人们广泛的关注。普洱茶是我国云南特有的一种茶叶,属于
在采用联合CWH(Choi-Williams Hough)变换估计多周期线性调频连续波(LFMCW)信号的参数时,当观察时间大于一个周期时,输出信号的信噪比不再随时间的增加而增大,且时频图中会出
<正>水产饲料大约需经过清理、粉碎、混合、调质、成形、颗粒后熟化、外涂七个或其中几个工段加工,才能成为到达养殖户手中的成品。在各个工段中,水产饲料生产对设备及加工参
<正>算法通常是算理指导下的一些人为规定。实际的计算教学中算理很突出,但算法缺乏自主生成,造成算理与算法出现断层,算理清晰但算法混乱。如何从算理出发构建起合适的算法,
我国的P2P借贷平台普遍采用的担保模式被认为是行业风险根源之一,然而对该模式产生的制度基础却缺乏研究。本文发现英国的P2P平台也普遍采用担保模式,而美国的平台则不采用,
目前对公立医院的医药价格进行综合改革调整,分析改革后对医院财务及价格管理的影响。综合改革的措施是根据党中央所提出的文件,文件的主要内容是如何高效的对公立医院药价进
目的:探讨绿茶提取物茶多酚在化妆品中的抗氧化效果。方法:选取皮肤衰老患者70例,随机分为两组,观察组和对照组,每组各35例,观察组患者使用含绿茶提取物的护肤品,对照组采取
<正> 心动过速、心力衰竭是心脏病中常见病,《灵枢·邪客》载"心者,五脏六腑之大主也,精神之所舍也",心在五脏六腑中居于主宰地位,并与神志有着极为密切的关系。在针治方面《
<正> 2003年是南京市鼓楼幼儿园的80华诞,也是中国幼儿教育的百年大庆。鼓幼80年的坎坎坷坷折射了中国幼教发展的艰难曲折,而鼓幼发展的成就更是充分体现了中国幼教发展的辉