面向多源数据的特色小镇知识图谱研究与应用

来源 :西安建筑科技大学 | 被引量 : 0次 | 上传用户:vera17
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着通用知识图谱在搜索、问答、推荐等场景的成功应用,各行业相继出现了对知识图谱的巨大需求,知识图谱技术的研究也逐渐从通用领域过渡到特定领域。与通用知识图谱不同的是,领域知识图谱包含的知识体系通常具有很强的专业性和领域针对性,因此通用知识图谱自下而上的构建方式并不完全适用于特定领域。在此背景下,本文以特色小镇为对象进行了多源数据下领域知识图谱构建和应用的研究,主要的研究工作包括:(1)在构建特色小镇领域知识图谱过程中,研究并分析了目标小镇的关键特征,据此建立了目标小镇的概念本体,并在本体指导下从多个数据源进行了特色小镇领域数据的采集,根据采集数据的结构特点采取了相应的处理方式将数据处理为知识的表现形式。(2)在进行非结构化文本数据的命名实体识别时,仅采用字向量或词向量进行模型的训练,难以避免分词不准确带来的潜在误差或是单字难以体现所在词语义信息。针对以上问题,本文采用了字向量与词向量融合的方法进行命名实体识别模型的训练,实现了对特色小镇领域定义实体的有效识别。(3)在进行非结构化文本数据的实体关系抽取时,针对训练语料较少、原始特征不足的问题,本文对部分原始语料进行了人工标注,并在训练实体关系抽取模型时融合了句子中词语的词性、实体位置等相关特征,实现了特色小镇领域定义实体间关系的有效抽取。(4)在构建完成的知识图谱基础上设计并实现了特色小镇知识图谱系统,该系统包含语义解析模块、语义转换模块和可视化模块,为用户了解目标小镇的产业优势提供了全面且准确的信息。
其他文献
自19世纪末第一台汽车问世以来,汽车工业蓬勃发展至今已经历了100多年的发展历史,由最初时速每小时18公里的三轮汽车,到现今速度从0公里加速到100公里仅需要3秒的超级汽车。
通过分析当前施工计划管理及施工安全控制中存在的问题,论述了强化施工计划管理及监控的重要性和紧迫性,并对加强施工计划管理,强化施工过程中的车务监控体系建设,优化施工安
当今的工业化生产加重了能源的匮乏和环境的污染,汽车在提供便利的同时,也大量消耗着能源,对环境进行着过渡地污染,面对这两项挑战,世界各国都在争相研发节能型交通工具。混
文献研究发现,知识型员工得到越来越多的关注和重视,如何组建知识型团队成为了组织获得可持续发展的关键所在,因为知识型团队的网络结构决定了团队内部对知识和信息等资源的
随着人们对户外运动兴趣的增加,以及高温极端环境工作需求的增多,保持服装的热湿舒适性、维持人体热平衡变得愈加重要。通常服装的舒适性研究主要侧重的是人体与服装及环境之
在社会化信息网络飞速发展的今天,以微博为首的自媒体快速兴起并深入到了人们政治、经济、文化生活的各个方面,成为了新闻传播不可或缺的手段和方式,也愈加重要地发挥着引导
论文主要为了精确控制超深孔扩裂爆破效果,解决掘进机在掘进岩石强度大于其切割强度时,截齿的损耗、小溜槽和大链磨损、整机的震动以及粉尘等方面的问题,优化爆破方案,进行了
随着现代企业的经营理念向“以用户为中心”的转变,用户满意度成为企业竞争的重点,满意度的评价成为判断企业发展好坏的重要标准。在电信行业中,用户满意度也成为影响企业发
由于生物化学作用、下覆油气资源渗漏扩散以及天然气水合物失稳分解的存在,造成了海水中溶解甲烷浓度的不均匀性分布。海水中的溶解甲烷浓度不仅对全球气候和海洋环境变化有
发展燃气轮机技术是我国改善能源结构、能源清洁利用和能源安全之必须。发展低碳能源、减少碳排放已经成为包括我国在内的全球主要国家的共识。由于我国已经是全球最大的碳排放国,而且一次能源消费以煤炭为主,因此改善能源结构是大势所趋,这不仅需要大力发展非化石能源,也需要加速天然气的利用。本文基于三种不同等级的燃气蒸汽联合循环发电机组,运用Ebsilon软件模拟循环过程,对联合循环系统分部件的热效率、(?)效率