【摘 要】
:
随着互联网技术的飞速发展,以及智能移动终端的普及,社交网络逐渐融入人们的日常生活中,社交网络也成为了人们之间沟通分享最重要的平台。在海量的社交网络数据中包含着大量
论文部分内容阅读
随着互联网技术的飞速发展,以及智能移动终端的普及,社交网络逐渐融入人们的日常生活中,社交网络也成为了人们之间沟通分享最重要的平台。在海量的社交网络数据中包含着大量有价值的信息,包括人物、时间、地点、事件以及情感等。在社交网络结构化和非结构化数据中,蕴含这大量显式及隐式的地理信息,这些信息对提供地理信息服务,及构建地理知识图谱起着重要作用。基于社交网络数据构建的地理知识图谱不仅能提供地理知识服务,也能针对特定目标,如人物、事件等,刻画其行为轨迹,为舆情监控分析、突发事件监测等提供数据支持。本文的主要研究工作及成果包括:(1)对基于地理信息抽取任务驱动的社交网络数据的获取及预处理方法进行了研究与实现。本文研究了社交网络数据特征,结合地理信息抽取任务的自身特点,提出了一个用于地理信息抽取任务测试的数据获取及预处理方法,并据此从Twitter平台爬取了约两千万条实验数据,最终构建了一套高质量的社交网络测试数据集。(2)构建了面向社交网络数据的地理信息抽取模型。本文根据社交网络数据结构特点,构建了一个地理信息抽取模型以抽取社交网络中设备数据及内容数据中蕴藏的地理信息,其中本文设计了一个深度神经网络及多Attention机制提高了模型对内容数据部分的地理信息抽取效果。(3)对模型抽取效果进行了实验分析。本文设计了两组对比实验,分别对模型各组成部分的抽取有效性,以及深度神经网络及多Attention机制在模型中的作用进行了实验验证。实验结果表明,在本文构建的数据集上,模型各部分均能有效抽取地理信息,抽取模型抽取准确率超过30%,深度学习技术在很大程度上提高了模型的抽取能力,并且利用多Attention机制优化的网络抽取效果优于带单Attention机制网络和无优化网络。
其他文献
乡村以传统农业模式发展难以实现乡村振兴战略的目标,如何实现乡村转型发展是急需解决的问题。本文以祁阳县乡村振兴示范点龙溪村为案例,深入分析李家大院古建筑群开发利用对
论文采用基于密度泛函理论的第一性原理计算方法,研究了立方BaTi03中Ti位和Ba位替代掺杂的电子结构和光学性质,并对掺杂体系具体发生的改变做了详细的讨论。理论计算研究表明
研究背景:红花属于菊科植物,作为一种传统中药,对于跌打损伤以及血液循环系统疾病都有显著的疗效。研究证明,其水溶性成分羟基红花黄色素A已经被证实具有降脂、降压、抗肿瘤
目的:近年来,脂肪组织被认为在肿瘤发生发展中起到重要作用,本研究通过测定高危前列腺癌患者磁共振(MRI)图像上前列腺周围脂肪相关指标(前列腺周围脂肪面积、皮下脂肪厚度),
与发达国家相比,北京社区、居家养老的发展起步较晚,尚有不完善之处。养老设施数量不全、分布不均,缺少一个完整的社区、居家养老设施体系。建立健全的原居安老持续照护设施
目的:霍山石斛为兰科石斛属植物。基于Illumina MiSeqTM高通量测序技术,(1)比较五种不同生长模式的霍山石斛内生真菌的多样性和差异性;(2)比较设施栽培模式下,不同生长年限的霍山石斛茎段内生真菌的多样性和差异性;(3)通过分离、纯化霍山石斛内生真菌,筛选出霍山石斛中具有抑菌活性的内生真菌,并进行分子水平鉴定。探明不同生长模式和不同生长年限的霍山石斛内生真菌的多样性和差异,同时考察内生真
【目的】:通过X线片手工测量与三维重建技术上计算机测量Cobb角差异比较,探索改善Cobb角测量的新方法。【方法】:回顾研究2017年6月-2019年6月我院脊柱外科符合特发性脊柱侧
目的:检测自噬相关蛋白Beclin-1和P62在弥漫大B细胞淋巴瘤(diffuse large B cell lymphoma,DLBCL)患者中的表达情况,分析其表达水平与DLBCL患者各临床特征之间的相关性。探讨
流浪是人类的一种生存方式,它是远古先民为适应自然而做出的能动反应,后来随着社会的发展和环境的变迁逐渐演变成为人类的一种自主选择行为。文学作为对现实生活的能动反映,
目的:探讨血浆D-二聚体、平均血小板体积及肺动脉压力在急性肺栓塞患者危险分层中的应用价值。方法:回顾性选取2015年10月至2018年10月于承德市中心医院确诊为急性肺栓塞的患