基于主题爬虫的本体非分类关系学习框架

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:axu4g00
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种借助主题爬虫自动从返回的相关网页进行本体非分类关系学习的框架与方法.针对利用互联网进行本体学习的特点,所用到的主要方法是词频、共现统计和分割聚类算法K-Means,并没有采用复杂的语法结构分析和半指导聚类算法如EM、BIRCH和SOM,因此自动化程度和效率较高.学习结果将用于指导主题爬虫进行网页相关性的判断.这种非分类关系的学习质量将由主题爬虫在实际应用中的表现来客观评价.
其他文献
摘 要:随着我国经济的不断发展,人民对于房屋或是建筑的质量也越来越重视。建筑行业作为我国各类建筑的主要施工单位,其自身的发展也逐渐受到了人民的关注。在建筑工程中,工程造价是建筑的重要组成部分,工程造价的主要作用就是对施工过程中的成本进行预算控制。本文主要针对建筑工程造价预算的控制方式展开讨论,首先从工程施工超预算的原因入手进行分析,结合建筑工程造价预算应该控制的要点展开研究,最后总结出建筑工程造价
知识创新是高技术虚拟产业集群形成综合竞争能力和保持竞争优势的重要因素。通过分析知识创新的类型和层次,建立高技术虚拟产业集群知识创新绩效评价指标体系,结合灰色关联度
风湿骨病患者都知道“冬病夏治”的概念。很多人都选择在夏季采取药物的方法治疗风湿骨病,郁鑫膏自然成为众多患者的首选。出汗洗澡不脱落郁鑫膏完美升级夏季炎热,出汗、洗澡
引文分析工作是中文社会科学引文索引(CSSCI)的重要组成部分,对期刊、学者、机构等指标做出评价,引文分析系统在其中起着至关重要的作用,关系到这些评价指标的科学性和准确性
本文研究的内容包括:现阶段Web结构研究的主要方法,社会网络分析法的原理和指标,社会网络分析法在Web结构研究中的具体应用方法与过程。其中应用部分是本文的最重要的部分,具
基于系统与控制理论,通过分析组织间知识转移过程及知识转移对各主体知识存量的影响,运用系统动力学的方法分析组织间知识转移的因果关系和行为演化特性,在此基础上构建知识
网络评估是企业知识网络研究中的重要内容,完整的企业知识网络评估应吸收借鉴社会网络分析(SNA)、基于结果管理(RBM)、结果测绘(outcome mapping)等多种评价方法,涵盖预评估
知识发掘是撷取隐含、有用、未被发掘、有潜在价值的知识资源的一种过程,采用先进和传统的技术、方法和手段,对数据库内外的知识进行系统分析、挖掘、发现和利用,区别于数据
“建设社会主义现代化强国,对教师队伍建设提出新的更高要求,也对全党全社会尊师重教提出新的更高要求.”在2018年9月10日教师节当天召开的全国教育大会上,习近平总书记发表
期刊
高中信息技术这门课是从该课程的特点和内容出发,主要是为了培养学生分析问题能力和解决问题的能力,信息技术具有很强的可操作性、应用性和实用性,所以必须要重视这门课程,如