基于异构中文百科数据的互联语义知识库构建

被引量 : 0次 | 上传用户:bmw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从古老的《永乐大典》到世界权威的《大英百科全书》,再到如今随网络覆盖全球的“维基百科”,人类长期以来从未停止过知识的整理和知识库的构建。随着计算机技术的发展,人们开始关注构建可供机器阅读和推理的语义知识库,以实现人工智能的远大理想。近年来,利用语义万维网技术并基于在线百科数据构建语义知识库的工作愈发受到重视。英语领域的语义知识库自动化构建工作稳步发展,相关商业化的应用也在不断涌现,但是中文方面的相关研究和工作还基本处于起步阶段。中文在线百科(如百度百科和互动百科)的数据量早已比肩英文维基百科,本课题正是利用如此丰富的源数据,进行中文语义知识库的构建研究和实现。我们利用启发式规则、中文分词、关联规则挖掘等技术完成了语义数据的抽取、清理和挖掘的基础工作。将这些从异构数据源抽取的语义数据进行融合(也即数据匹配)则是本课题的重点。具体来说,我们提出了一个半监督学习的算法来迭代挖掘匹配规则并找出等价语义信息。这种方法极大减轻了人工设计匹配规则和相似度计算标准的代价,并仍能保持很高的精确度。最后我们简单介绍如何通过链接数据标准,发布和浏览这个整合互联的中文知识库(Zhishi.me)。
其他文献
当代大学生是中国青年中的优秀群体,是祖国的希望和未来,生长在这个时代的大学生,幸逢盛世,既是无限幸福,值得羡慕的一代,又是责任重大、任务艰巨的一代。他们肩负着推动社会进步和
离心压缩机被广泛应用于石油、化工和冶金等各个领域。作为衡量一个国家重大装备制造业发展水平的标志性设备之一的大型离心压缩机技术含量高,开发、制造难度大。压缩机的叶轮
有关心理逆反的研究关注的是当个体的自由行为在不同情况下受限时,他们如何反应的问题。心理逆反是一种旨在恢复被取消或受威胁自由的动机状态。已往研究表明,心理逆反既是一种
当今信息社会,频谱利用率越来越高,另外对于通信的隐蔽性、安全性的要求也越来越高,跳频技术正是在这种背景下应运而生,其工作原理是指收发双方传输信号的载波频率按照预定规律进
<正>4月29日,省国资委召开的2019年第二次新闻发布会上,水发集团打造乡村振兴齐鲁样板的业绩引起广泛关注。由水发集团发起组建我省新旧动能转换乡村振兴产业母基金100亿元,
农民工返乡创业是农村劳动力与城市双向流动发展的必然产物,是劳动力要素资源重新优化配置的结果;农民工返乡创业是加快我国农村地区发展、统筹城乡劳动力、加强城乡互动、促进
并网变换器在分布式发电系统和当代电力系统中发挥着关键的作用。LCL型滤波器以其更高的滤波效率正逐渐替代L型滤波器,但其固有的谐振特性给控制系统的稳定性带来了较大挑战。
由于围护结构传热系数对建筑能耗的影响至关重要,传热系数成为了建筑节能现场检测中的一个重要检测参数。而目前国内围护结构传热系数现场检测中使用最多、最具权威的热流计法
近年来,旅游集聚区的建设在全国的旅游城市中风起云涌,各大城市以旅游集聚区为空间实体发展城市旅游业;《中国旅游业十二五发展规划纲要》也提出要以培育旅游集聚区为重要任务,由
小学作文教学是小学语文教学中非常重要的一个组成部分,对于学生理解能力和写作水平的提升起着决定性的作用,对学生表达能力和人文素养的提升也有着深远的影响。但是从目前教