基于知识图谱的中文影评的实体链指研究

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:liupu555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅速发展,数据量逐渐变大,如何从海量的互联网数据中提取有用信息,使其化身为人类生活、工作的智能化帮手显得尤为关键。从自然文本中抽取信息属于自然语言处理问题,而实体链指便是自然语言处理中的一项关键性技术,它在人工智能问答系统、信息抽取和检索、机器翻译等方面发挥着无穷的应用潜力和作用。实体链指以辨别出被查询实体名称指代的是哪一个具体客观存在的事物为目的,它的实现分为候选实体生成和候选实体排序两部分。目前对候选实体生成关注较少,而大多着眼于如何实现候选排序。针对现有实体链指研究中存在的问题,本文提出了一种基于知识图谱的中文影评的实体链指算法,主要研究内容有:1.本文基于本体提出了知识图谱建模方法。分别对知识图谱中的基本元素,即概念、关系、规则等进行形式化定义,并以(概念,关系,规则)的三元组模式体现概念间的语义关联,形成网络图型结构的知识图谱模型。利用知识图谱进行实体链指,省略了候选实体生成的步骤。2.在知识图谱模型的基础上,本文提出了基于网络图型结构的实体链指算法。该算法改进了传统的概念相似度模型,充分考虑了知识图谱网络图型结构中各个概念节点间连接路径长短,节点深度及节点密度的影响因素,利用条件概率对概念节点间的关系边进行加权,运用改进后的模型计算概念节点间语义相似度的方法来度量待链指实体与候选实体的实体相似度大小,实体相似度最大的即为实体链指的目标实体。结合CCKS-2016年度全国知识图谱与语义大会的评测任务,本文基于知识图谱模型首先对大会给定的知识库进行预处理,然后详细叙述了中文影评在知识图谱的基础上利用网络图型结构的实体链指算法的实现过程。评测结果显示,实体链指准确率高达89.2%,效果良好,证明本文的知识图谱建模方法和基于网络图型结构的实体链指算法具备一定的有效性和较高的准确性。
其他文献
通航(通用航空)是一个国家科学技术水平和航空工业发展水平的集中体现,也集中体现了一国的国防实力。当今世界主要发达国家都十分重视通航的研究、运用和发展,将其作为推动新兴产
报纸
文章阐述了土壤水分入渗的主要影响因素,对入渗试验方法进行了比较分析,总结了土壤水分入渗的影响因素、土壤水分入渗试验研究等方面的国内外研究进展。土壤水分入渗一直是研
<正>党的十八大明确提出了稳步推进大部门制改革的重要任务,广受关注的我国政府大部制改革将迈入新的阶段。从十七大开始的大部制探索,不可避免地走了一条外延式改革道路,在
为了对物流需求进行科学预测,文章在主成分分析的基础上,选取了对物流需求影响较大的3个主要因素:人均社会商品消费额、人均GDP和商品零售价格指数为自变量.分别建立了多因素
<正>当前推进廉政文化建设的几个着力点:一是加强反腐倡廉的制度建设。要将廉政文化贯穿于制度建设的所有方面和全部过程。着重在改善制度和体制上下功夫,进一步完善市场经济
照明系统作为各项生产和生活活动的基础保障,必须加强智能化控制的研究,从而设计出更加可靠的智能照明控制系统,并且进一步实现绿色照明和节能照明。论文对一般智能照明控制
目的探讨对骨科卧床患者便秘使用综合护理干预治疗的临床效果。方法选取2010年12月~2013年2月期间科室骨科卧床便秘患者100例,随机分为普通组和护理组,各50例,普通组实施番泻
《三国演义》所蕴含的人才思想潜移默化地影响着后来的读者。本文从小说的实际出发,结合作家的创作实际,全面、系统地分析了《三国演义》所展示出来的人才价值、人才标准、用人
目的观察表没食子儿茶素没食子酸酯(EGCG)是否具有增强氟尿嘧啶抑制肝癌细胞Hep G2的生长作用,并探讨内在的机制。方法应用MTT法观察肝癌细胞的生存率;Western-blot测定p-ACC