基于本体思想的网页信息抽取方法

来源 :计算机与现代化 | 被引量 : 0次 | 上传用户:linxi054
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了抽取特定主题的网页信息,本文提出一种基于本体思想衡量主题相关度,以提高网页信息抽取质量的方法。该方法采用向量空间模型,结合特征词权值,利用本体思想分析并计算主题相关度,从而达到提高特定主题的网页信息抽取质量的目的。该方法不但简化了向量空间模型的维度计算,而且扩展了语义范围。最后采用一个分层体系结构的实际应用系统来演示该方法的实现过程。实际应用结果表明,该方法较准确抽取了特定主题的网页信息,同时降低了系统运算复杂度,提高了网页信息抽取的查全率和查准率,减少了网页信息的遗漏,提高了网页信息抽取的质量。
其他文献
乳腺DCE-MRI扫描过程中,病人运动等会使图像序列产生运动伪影。消除运动伪影的影响,需要对DCE-MRI时间序列图像进行运动补偿。本文充分利用图像信息和强化率在时空上的先验信息,提出采用基于B样条的自由形变模型描述组织的形变场和自由形变模型控制点的位移场,使用离散马尔科夫随机场进行建模。以基于高斯核的残差复杂度为图像间相似性度量,离散马尔科夫随机场的能量函数采用Fast-PD算法快速优化求解组织
当前,作文教学的现状依然堪忧。学生害怕、厌倦写作,老师怕改、烦改学生写作的现象随处可见,作文教学低效已成为不争的事实。尤其是学生的作文言之无物,内容空洞,或脱离生活,以知识
嘹歌是传承千百年来壮族丰富多彩的民俗文化的重要载体,以其原生态的风貌详细记录了壮族先民在民族节庆、婚恋习俗、宗教信仰、生活方式等各方面所蕴含的民俗风情,堪称壮民族
针对现有多数交通仿真系统在交通状态估计问题精确度不高的缺陷,引入粒子滤波方法对交通状态进行预测估计,设计并实现基于粒子滤波的交通仿真系统。首先介绍系统粒子滤波的初始
目的探讨人文关怀理念对未成年女性人工流产术后焦虑、抑郁情绪的影响。方法选取82例自愿要求人工流产术的未成年女性,随机分为观察组与对照组各41例。对照组常规实施人工流
目的:探讨综合性心理干预在未婚初次人工流产患者护理中的应用价值。方法:选取绍兴市柯桥区妇幼保健计划生育服务中心2014年3月-2016年5月初次行无痛人工流产手术的未婚患者9
如果说PC的普及为软件产业的发展奠定了基础,那么互联网的迅速发展则为软件产业开辟了一个更新的天地。
近日,冠群金辰公司签约北京嘉润天地科技有限公司,做为“KILL”系列安全产品在北方区域的中小企业安全产品分销商,共同拓展中小企业安全用户市场。
游牧定居已成为各牧区的发展趋势。该文通过入户访谈法、层次分析法对霍城县牧民集中定居与插花定居效应进行对比评价,得出集中定居和插花定居均有较好的经济效益,集中定居的社
南宋晁公武之《郡斋读书志》,以文献著录与“解题”的形式展现出了巨大的学术价值。作为一部私藏目录,《郡斋读书志》最为难能可贵之处便在于晁氏在具体著录中,用一人之笔录一代