基于网络嵌入模型的DBLP数据库作者消歧

来源 :电脑编程技巧与维护 | 被引量 : 0次 | 上传用户:mir80
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
DBLP数据库是一个以作者为核心的计算机类英文文献数据库,其中存在着大量的同名作者,为数据库的使用带来了较大的不便.针对DBLP数据库中作者译名的同名问题,以网络嵌入为基础进行作者姓名消歧.提出了以下两种新方法:(1)从文章之间的相似性出发,建立有偏游走序列,在Word2vec模型进行训练后,利用聚类方法对同名作者进行区分.(2)根据文章的属性构建二部图,并基于LINE方法得到每篇文章的特征向量,用机器学习模型区分同名作者.具体来讲,构建多层感知机模型并添加Softmax函数,用以判断输入的两篇文章是否出自同一作者.模型在221位DBLP中同名作者的文献数据集上进行验证,实验结果表明,该方法可以有效地区分DBLP中的同名作者并优于对比方法.
其他文献
本文以苏埃通道海底隧道结构高耐久性能混凝土配制为研究目标,分析了海底隧道腐蚀环境类别,通过试验测试了不同水胶比和矿物掺合料掺率下混凝土的力学性能、耐久性能和变形性能,获得了高耐久性能混凝土配合比.结果表明:苏埃隧道高耐久性混凝土水胶比宜控制在0.28~0.31,掺合料掺量宜控制在20%~30%.试配混凝土的自身耐久性较好,28 d氯离子扩散系数小于4×10-12 m2/s,抗水渗透等级达到P12,抗碳化性能达到T-Ⅳ,能满足相应设计指标要求.建议现场在满足强度和耐久性指标的前提下,适当增大矿物掺合料用量,
结合东莞松山湖地区中压配电网的实际问题和工程示范规划,对中压柔性直流互联在该地区中压配电网中的应用方案进行研究.对系统的主接线方式、联接变压器配置和接地方式进行了论证;对系统中模块化多电平换流器和电力电子直流变压器进行了初步设计,确定了关键设备主要技术要求;仿真分析了系统过电流和过电压特性,提出了系统的过流耐受和绝缘配合要求;设计了系统总体控制架构和保护配置,明确了系统的控制保护策略.文章对示范工程所采用的新型主回路拓扑进行了论证,提出并采用了高纹波紧凑化的设备设计方案,提出了交流故障协调响应策略,并对这
针对电力变压器健康指数模型构建过程中指标体系不完善,指标权重确定方法单一性及片面性,文章提出一种基于粗糙集-G1(序关系分析法)优化组合的变压器健康状态评估方法.通过集合变压器老化情况、电气试验、油色谱试验、油质试验、糠醛试验以及附件情况构建变压器健康状态综合指标体系模型,采用粗糙集得到客观权重、G1法求得主观权重,利用客观修正主观的优化组合方式给各指标科学赋权,最后通过整体电力变压器健康指数模型计算出7台不同电压等级变压器的健康指数来评估其健康状态,与传统指标体系和权重方法对比,验证了文中所提指标体系更
随着配电网自动化水平不断提高,感知终端数目和接入数据量激增,数据传输慢、信息漏报误报等问题严重影响了故障处理速度和准确性.边缘计算可就地高效地快速处理数据并决策.为此,提出一种面向配电网故障快速处理的边缘计算单元优化配置方法,包括体系架构、边缘生成、划分方法等内容.首先以经济性、通信实时性指标构造目标函数,可靠性及系统要求等为约束求解实际配网中边缘的最优个数.再通过谱聚类结合k-means算法划分边缘管辖范围和位置分布,根据分区均衡性、实际要求等修正分区.最后以IEEE 33节点、IEEE 69节点系统进
面向越来越开放的能源交易市场,为充分调动用户侧资源,提出了一种考虑需求响应(demand response,DR)的电/热/气云储能(cloud energy storage,CES)优化配置策略.建立含电/热/气云储能能源集线器(energy hub,EH)结构,从参与云储能商业模式的用户侧与云储能提供商出发,构建两主体双层优化模型.底层基于长短期记忆和贝叶斯神经网络的概率预测方法,刻画新能源出力的不确定性,建立考虑需求响应的用户侧云储能充放能模型,以用户总成本最小为目标优化决策用户侧充放能行为,并将决
根据某50000载重吨半潜运输船多年运营中的意见反馈,结合新法规、新规范要求,重点从线型、分舱布置、上层建筑布置、环保排放等方面对其进行优化升级,使其安全性、舒适性、环保性得以大大提升.该优化方案对同类型船舶的研发设计具有一定参考意义.
随着能源革命与数字革命的深度融合,大数据助力能源互联网创新发展已成必然趋势.传统能源数据的存储和利用形态是以企业为中心的信息孤岛,缺乏高效可靠的数据共享机制,直接阻碍了能源大数据的信息挖掘.针对这个问题,提出一种基于区块链的能源互联网大数据知识共享模型,其中基于云边协同的能源大数据知识提取架构解决了数据隐私难以保证、海量数据传输效率低及安全性差的问题,基于联盟区块链的知识共享模型为实体间的知识共享提供了可信、可靠的平台.所提出的架构可支持能源互联网背景下各实体间快捷高效地实现知识共享,具有高透明度、高可靠
由于分布式固体电储热(distributed solid electric thermal storage,DSETS)面临多种环境气温因素影响,对其实施能量平移调度时可能出现不受控情况,从而导致含DSETS的多能源系统运行面临安全风险.为解决该问题,提出一种含DSETS的电热联合系统安全评估及预防控制方法.首先,建立一个两阶段优化模型:第一阶段以系统运行成本最小为目标,针对含DSETS的电热联合系统建立预想事故集,模拟DSETS能量转移过程中负荷需求突然增加和支路N-1预想事故扰动,并利用所提的支路重载
华东矿区上覆有厚表土地层,该区域存在立井井筒周围地表长期持续沉降的问题.此沉降是否可能含有深厚黏土层尚未完全稳定的自重固结贡献值得怀疑.结合文献中华东矿区地层地质资料,基于Gibson大变形固结理论对深厚黏土地层自重固结过程进行了计算研究,分析了不同地层厚度与地层埋深对自重固结沉降量和固结时间的影响.结果表明:对于埋深超过150 m、土层厚度小于百米的黏土地层,由于其地质年代普遍早于中更新世,其自重固结变形已经完全稳定;而对于埋深为75 m、厚度超过77 m的黏土地层,其地质年代可能处于中更新世的尾段,存
能源互联网平台作为能源互联网的重要信息支撑及市场化运营的集中体现,对提高清洁能源消纳水平、助力能源互联网战略及碳中和战略实现具有重要意义,当前研究主要针对能源互联网平台架构及其支撑技术,缺少对其市场化商业模式的探究.文章首先从物理层、信息层、应用层设计能源互联网平台总体框架,并以应用层为基础,从数据化服务、清洁能源供应、未来新业态三个层面划分能源互联网平台典型应用场景.其次,在此基础上,围绕目标用户、关键业务、合作主体以及盈利模式等维度对典型应用场景进行商业模式设计,以期促进能源互联网平台市场化运行.最后