基于相似网页文本演化的数据溯源

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:a83312259
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的/意义]为解决现有网页文本缺乏起源标注的问题,提出一种借助PROV本体发现相似网页文本起源关系的方法.[方法/过程]通过聚类算法、自动语义标注和关联数据构建等技术的综合应用,结合PROV-POL溯源模型,检测网页文本实体的演变过程,实现文本级和属性级两级溯源方案.[结果/结论]实验验证了借助语义网技术和数据溯源模型实现网页文本数据溯源的可行性,但实验过程中聚类算法的召回率有待提高.
其他文献
[目的 /意义]图书馆员技术压力受到多方面因素的影响,其中组织因素对图书馆员的技术压力高低有着至关重要的意义,基于组织视角的技术压力水平分析有助于获知新技术环境下馆员
“一时期之学术,必有其新材料与新问题,取用此材料以研究问题,则为此时代学术之潮流”。19世纪末至20世纪初,殷墟甲骨、敦煌经卷文书、西北汉晋简牍、明清内阁大库档案的发现被学
[目的 /意义]揭示2009年以来国际图书情报领域研究前沿的主题结构及其演化规律,探测未来研究的前沿趋势,为相关研究者追踪前沿信息提供参考。[方法 /过程]以Web of Science为
[目的/意义]厘清转型时期高校图书馆员专业学习过程中存在的问题,以便更好地改善高校图书馆员专业发展的路径和方式.[方法/过程]通过问卷调查对高校图书馆员的专业学习现状进
[目的/意义]探讨高校用户使用图书馆OPAC系统遭遇检索失败时提问调整的应对方式.[方法/过程]以北京师范大学图书馆为例,收集并对OPAC日志数据进行编码,分析用户采取停止检索
本文探讨海量数字信息存储过程中的网络存储的配置问题,在对DAS、NAS、SAN、iSCSI-SAN等主要网络存储构架进行比较的基础上,利用排队理论对NAS、SAN和iSCSI-SAN网络存储中的
[目的/意义]技术机会识别对企业技术创新具有重要的意义,而企业对技术机会的警觉度则在识别过程中扮演着重要角色,对企业警觉度的影响因素进行研究探析,有助于企业提升对技术
[目的 /意义]研究北美地区大学图书馆数字学术中心服务创新模式与空间资源配置以及再造过程,为国内大学图书馆转型和发展提供参考和借鉴。[方法 /过程]采用典型案例分析法,对
习惯是在知识观念的参与下反复按一定的方式从事的思维活动。它对人的活动影响很大,学生的学习习惯,从小学到中学无论家长或是老师都在注意培养。有了好的习惯他会把时间和精力
A boronic acid-based anthracene fluorescent probe was functionalised with an acrylamide unit to incorporate into a hydrogel system for monosaccharide detection.
期刊