基于关联规则的Wikidata人物名称数据分析——以诺贝尔文学奖得主为主题

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:mc76759
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的/意义]挖掘不同名称数据之间的关联关系,将关于某一实体或主题的领域知识表现出来,这对实现不同层次、不同粒度的知识体系的解构和重构、提供满足多种需求的知识服务工作具有重要的研究意义.[方法/过程]提出一种基于人物实体数据运行关联规则挖掘实验的研究框架,通过对人物实体条目的抽取、预处理及属性识别与分类等处理方法,利用R语言得到人物实体集的关联规则,实现多种名称数据的关联,最后从Wikidata知识库提取113位诺贝尔文学奖得主的实体条目进行实证分析.[结果/结论]分析右部为地点名称、机构名称、时间名称和主题名称等4种不同类型规则的关联特征,实现不同名称数据类型的关系挖掘问题.本研究可为知识的揭示、聚合和关联提供新的视角,探索了数据挖掘技术在名称数据中的应用.
其他文献
[目的/意义]哈佛燕京学社引得编纂处是民国期间重要的索引编纂机构,最兴盛时也只有10余人,却在20余年时间内编纂出版了64种81册《汉学引得丛刊》.通过对引得编纂处成员予以分
[目的/意义]先秦典籍在古代典籍中的地位极为重要.本文提出对先秦典籍进行词性自动标注的解决方法,以便更加准确地挖掘先秦典籍中的潜在知识.[方法/过程]通过条件随机场模型,
[目的 /意义]在深入解读《高等教育信息素养框架》核心理念和内容的基础上开展元素养课程的教学设计,并在教学实践中进行评估和修正,以期为研究和构建元素养教育模式提供参考
现今社会计算机技术与信息技术飞速发展,科技变化日新月异,对现代企业的发展方式、生产经营方式、组织模式、内部机制等都产生了潜移默化的影响。面对越来越激烈的竞争环境,
[目的 /意义]探索搜索引擎、网络健康社区、问答社区、社交软件四类健康信息平台下,人格特质对青年人健康信息搜寻行为的影响,以期能够改善国内健康信息服务,为青年用户提供
第一部分:绪论;包括选题依据、价值、国内外研究现状、具体使用的研究方法,以及对于文中出现的核心概念的厘定。  第二部分:理论依据;从UGC的巨大优势出发,正视如今档案文化宣传
[目的 /意义]运用文本分析与可视化等方法绘制基本科学指标数据库(Essential Science Indicators,简称ESI)研究前沿的科学全景图谱,在此基础上绘制全球研究前沿视野下的纳米
[目的 /意义]在大数据时代面对海量的数据用户有时会束手无策。因此,越来越多的学者们开始关注互联网热点话题发现的算法,帮助用户快速获取热点话题。[方法 /过程]基于DBSCAN
“竞争力影响因素”作为竞争情报研究中的核心问题,成为众多学者的关注点。针对现有上市公司竞争力研究中分析对象多以年报中财务信息为主,忽略非财务信息的现象,本文尝试对上市
头颈部恶性肿瘤是全球第五大肿瘤,每年新增病例约644000例~([1,2])。临床上,头颈部恶性肿瘤以手术治疗联合放化疗的综合治疗为主,然而常难以根治性治疗~([3]),因此寻找新的治