基于多源信息融合的API知识图谱构建

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:dongyu661
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
API相关的知识通常分散隐含在多个信息源,如API参考文档、问答网站等非结构化的文本中,不利于API的查询与检索.为此,提出一种多源信息融合的API知识图谱构建方法,以提高API检索的效率.API参考文档从设计者角度描述了API的功能和结构,Stack Overflow问答网站从用户角度提供了API的使用目的及应用场景,二者互为补充,可共同为API查询与检索提供支持.通过分析API参考文档,抽取API和领域概念作为实体,构建API和领域概念之间的关联关系;利用Stack Overflow问答网站,抽取问答QA和API概念作为实体,构建问答QA和API概念之间的关联关系.在此基础上,将二者进行知识融合,构建多源API知识图谱,以实现基于知识图谱的API推荐.为验证本文方法,分别从知识抽取的准确性和推荐应用两方面对本文构建API知识图谱的有效性进行评估.实验结果表明,基于知识图谱的API推荐,在推荐效果及效率上均有提升.
其他文献
监控设备大规模安装和应用带来了运维困难的问题.本文研发了一个通用运维管理平台,平台通过前端状态采集装置获取监控设备运行时产生的各种状态信息;平台的运维管理系统汇总、存储状态信息,并提供监控、统计、分析、报警等管理功能以支持运维业务;平台的可视化展示子系统对状态信息进行可视化渲染呈现,为系统运维提供智能化的支持.状态采集装置模块化和冗余设计使得设备具有通用性、可扩展性、高可靠性和易维护性.状态信息具有时序数据特征,运维管理系统使用InfluxDB存储状态信息,大幅度降低了存储空间需求,并保证了数据查询和管理
为了解决目前多目标跟踪算法在行人遮挡后无法再次准确跟踪的问题,提出了一种融入注意力机制和改进卡尔曼滤波的多目标跟踪算法,选用联合检测和重识别框架提取特征,同时完成目标检测和重识别任务.设计了并行支路注意力机制,包括空间注意力和通道注意力两个部分,每个部分都采用并行支路的方式完成池化和卷积操作.在跟踪阶段,本文提出了速度先验卡尔曼滤波,实现对行人运动状态更精确的预测.采用CUHK-SYSU数据集对算法进行训练,并在MOT16数据集上做算法的验证和测试.本算法的多目标跟踪准确度(MOTA)达到了65.1%,多
新疆具有典型的干旱气候特征,疆内各地区经济基础薄弱、水利建设智能化程度不高,农业灌溉水资源利用率只有40%左右.吉木乃县作为新疆最为典型的干旱缺水县,近年来因全球气候变暖形势加剧,其境内唯一的水源地—木斯岛冰山的冰川雪线不断后退,情况不容乐观.传统水资源分配与管理方式较为落后,已不能解决当前吉木乃县所面临的水利管理困境,其管理效率低,产生的效益差,已不符合当前的经济发展形势.而现代化的智慧水利利用信息技术、网络技术、大数据和人工智能,使得水利管理智能化、管理效率大大提高.本文以新疆维吾尔自治区阿勒泰地区吉
针对卫星星座健康状态管理文档涉及多项遥测参数的查询和计算、文档格式要求严格、编制工作量巨大、人工耗时较长的问题,提出了一种卫星星座健康状态管理文档自动生成方法.通过对文档中所含的基本数据类型进行归类分析,制定配置文件存储规则,对文档模板进行自定义设置,并应用文档自动生成算法,利用文档模板及相关参数生成数据汇总文档.该方法能够实现文档编制过程中的知识复用和通用内容生成,建立规范有效的文档编制流程.
在大规模网络环境下,主机面临的安全威胁也愈发多样.随着基于机器学习检测恶意文件的技术快速崛起,极大的提升了对恶意软件的检测能力,也迫使对手改变了攻击策略.其中“Living off the land”策略通过调用操作系统工具或者执行任务的自动化管理程序来实现恶意行为.威胁检测可以从父子进程的上下文中发现可疑行为,将父子进程链及其派生的相关事件看作无向图,应用监督学习XGBoost算法进行权重分配,生成无向加权图.最后使用社区发现算法从图中识别出更大的攻击序列,在MIRTE ATT&CK仿真攻击数据集上进行
为了提高嵌入式实时系统软件的质量和可靠性,采用基于模型的软件测试方法是最有效的途径之一.但是,由于该类软件具有实时特性且十分复杂,一般的模型通常缺乏对其实时特性以及软件行为的描述,且需要丰富的专业领域知识才能将其建立的较为精确完整,导致建模的难度和成本增加,难以保证测试的充分性和有效性.使用场景是用户与软件之间的交互实例,详细描述了软件的系统行为而不关注其内部的复杂结构.因此,为了降低建模的难度,本文基于使用场景的规范化表示Scene来构建模型,并使用时间扩展EFSM模型来描述该类软件的实时特性;为了保证
进行基于表征学习的网络游戏流量识别研究.首先,由于流量识别领域公开数据集中缺乏游戏流量,采集各类游戏流量,并建立各种游戏与进程端口的映射关系,基于该映射关系从采集的流量中过滤游戏流量,扩展公开数据集;利用深度学习中的表征学习模型,对经过预处理的原始端到端游戏流量自动进行特征学习和特征选择;最后用分类器进行游戏类别识别.通过构建特征空间由卷积神经网络自学习原始信息的特征,成功避免传统机器学习算法中流量数据集的二次处理导致的信息丢失以及流量分类模型对特征选择的依赖.实验结果表明,相比于原数据集的分类效果,扩充
区别于传统深度强化学习中通过从经验回放单元逐个选择的状态转移样本进行训练的方式,针对采用整个序列轨迹作为训练样本的深度Q网络(Deep Q Network,DQN),提出基于遗传算法的交叉操作扩充序列样本的方法.序列轨迹是由智能体与环境交互的试错决策过程中产生,其中会存在相似的关键状态.以两条序列轨迹中的相似状态作为交叉点,能产生出当前未出现过的序列轨迹,从而达到扩充序列样本数量、增大序列样本的多样性的目的,进而增加智能体的探索能力,提高样本效率.与深度Q网络随机采样训练样本和采用序列样本向后更新的算法(
针对基于接收信号强度指数(Received Signal Strength Indicator,RSSI)的多目标定位问题,结合点估计与椭圆估计算法,提出一种新的分布式多边融合定位(Distributed Multi-lateral Fusion Localization,DMFL)算法.首先,通过多边定位算法进行粗定位,估计目标的大致位置.其次,基于区间分析理论在线获取泰勒展式高阶余项的边界,并通过集员递归算法求解多目标定位问题.最后,通过实验和仿真验证该算法的定位性能.结果表明,在相同的节点布置条件下
在软件定义网络(Soft ware-Defined Networking,SDN)中,由于配置策略的改变导致控制器需要对多个交换机中的流表项进行更新时,会出现更新不一致的情况.其内在原因是控制器无法同时对所有交换机完成更新,不同的更新时延会导致网络状态在逻辑上的不一致,从而影响数据报文的正确转发.针对分类时序更新方案应用场景适用性差和更新时延长,最优化更新方案计算复杂度高等问题,本文在两者的基础上,提出基于分类搜索的无环更新一致性方案(Categorical Search based loop-free