基于领域本体与主题模型融合的语义场聚类研究与应用

来源 :华南农业大学 | 被引量 : 0次 | 上传用户:cngaofeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交网络时代的到来,评论式的文本迅速发展为人们在网络中表达的主要方式。评论的出现使得人们能够自由、快捷发表观点。同时评论也成为了一种信息获取的渠道。但随着评论数量的快速增长,如何对庞大的评论信息进行组织、归纳、提高信息获取效率是目前需要解决的问题。当前针对信息组织、归纳的方法主要是应用文本聚类。传统文本聚类方法往往存在维数过高、数据稀疏、语义缺失的问题。针对传统文本聚类的问题,本文提出了一种基于领域本体与主题模型融合的语义场聚类算法并应用于旅游领域。本文的研究工作有以下几个内容:(1)构建面向特定领域的本体。以旅游领域为例,利用旅游领域的相关资料和文献进行分析,确定领域范围及归纳重要术语,定义旅游本体的类、关系、属性,并为旅游本体添加实例,完成旅游本体的构建,表达旅游领域的知识。(2)针对基于背景知识构建的领域本体存在的问题,本文研究了基于主题模型的领域本体扩展方法,通过主题模型挖掘出隐含知识补充领域本体。运用主题模型对评论建模提取隐含主题,利用Word2vec计算隐含主题与领域本体的相似度,揭示隐含主题的内涵,建立主题与领域本体的联系。在此基础上,通过主题-本体的相似度筛选主题并添加到本体完成领域本体的扩展。以旅游领域为场景,设计多组基于隐含主题的旅游本体扩展方案,选取最优的扩展领域本体的方案并验证效果。经实验证明基于主题模型扩充领域本体方法能够有效提高领域本体的领域表达能力。(3)针对文本特征的选取缺乏先验知识指导的问题,本文运用已构建的领域本体的辅助领域文本的特征选取、变换、降维。领域本体表达的特定领域的范围及重要概念。利用领域本体提取出具备领域性的特征,转换特征中存在的实例为本体的类,将参与聚类的特征范围限制在领域本体中,解决文本特征选取的问题。(4)针对传统文本聚类缺乏语义的问题,利用基于主题模型扩展的领域本体构建语义场,对文本使用基于语义场的聚类算法,并应用于旅游领域。领域本体构建的语义场不仅表征特定领域重要概念、概念的语义联系也刻画了语义的分布。将特定领域文本聚类问题转化为文本在语义场中的相互作用力大小问题。经实验证明基于主题模型扩展领域本体结合语义场的聚类方法有助于提高文本聚类效果。
其他文献
医学图像是一种用于记录人体或人体某部位病灶点位置信息的特殊数字图像,反映的是X射线穿透路径上人体各生理组织部位对X射线吸收量的累加值,已经成为现代医疗不可或缺的一部
BGaN合金材料的禁带宽度在3.45.5 eV之间连续可调,对应的发光波长范围在225365 nm之间,可以用于紫外发光器件的制备。同时,通过调整BGaN中合金组分,其a轴晶格常数可以分别与AlN和SiC衬底的a轴晶格常数相匹配,使得BGaN材料在高性能GaN基器件制备方面潜力巨大。此外,B原子在自然界中存在同位素10B和11B(原子数比10B:11B=1:4),利用10B原子具有的较大中子俘获截
目的:采用网络药理学联合人乳腺癌细胞(MDA-MB-231)体外模型,探讨鹿角霜能否通过干预TGF-β信号通路抑制肿瘤干细胞样特性发挥抗肿瘤作用,为补肾类中药鹿角霜在乳腺癌预防及治疗的临床应用提供理论依据。方法:1.采用中医药数据库BATMAN-TCM和中国知网收集鹿角霜的化学成分信息,利用BATMAN-TCM和TCMSP数据库预测各化学成分的潜在靶点,用Gene Cards数据库获取乳腺癌干细胞
学位
鸦片战争后,中国武术在与西方体育相拒相斥、相互渗透的融合过程中,开始了近代武术转型的新道路。对此,在结合当代文化自觉和文化自信的语境中,如何从历史发展中找寻有益当代学校武术课程发展的经验,是本文的出发点。本文聚焦于武术近现代转型的关键时期即民国进行探讨。从清末民初教育体制的革新出发,以民国时期颁发、实施与武术相关的教育政策与文件为线索,溯回与厘析民国时期武术课程的变革及特征。研究结果如下:第一,民
随着中国改革开放的进一步开展和国家综合的迅猛发展,汉语在国际交往中的重要性愈加明显,国际汉语教学发展迅速,吉尔吉斯斯坦现已开设了4所孔子学院。但吉尔吉斯斯坦汉语教学
人类文明不断发展,艺术设计是满足人类需求,坚持以人为本的人类活动。从艺术设计角度来说,要思考如何通过设计生产出具有人性和情感的作品,让人们在接受产品所传达出信息同时,进行有效情感交流和审美体验,通过各种审美来缓解理性和价值观冷漠下的社会关系。因此,审美在未来的艺术设计中的作用越来越重要。围绕人类需求而开展的艺术设计,出发点和落脚点就在于审美。审美作为一种价值范畴,与不同时代出现的不同价值评判体系变
本文以宋代团扇画为主要研究视角,通过查阅文献资料,对传统绘画中与团扇相关的名画和与之有关的历史文物进行考证研究,从中归纳总结出团扇在当前艺术文化语境中的表现。并以花鸟画作为专业研究的对象,学习、分析、整理宋代团扇花鸟画的绘画语言、技法表现与形式特征,将对本人的创作有所影响与借鉴作用的材料、技法进一步掌握,同时加以提炼运用于《闻君有扇》团扇花鸟画系列创作实践中。本文以三个部进行阐述:其一,团扇文化的
本文是一篇翻译报告,翻译原文为《苏格兰社会保障法》(2018)的第一编以及第二编的第一章至第六章。在翻译原文本的过程中,译者发现所选文本中存在大量定语从句,且句式复杂,这
本文是一篇翻译报告,报告原文内容为《2017-2018亚利桑那州众议院第53届立法机构规则》,来源于美国亚利桑那州的政府官方网站--“https://www.azleg.gov/”,这些规则旨在解决
本体是一种知识的共享与复用的工具。近年来本体已应用于众多领域,如图书情报、计算机、医学、地理、生物等并且在不断的普及中未来会更加广泛。本体应用中一个重要的应用就