网络信息采集中链接与主题相关性的判定研究

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:laoka
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面向主题的Web信息采集需判断提取的URL链接主题相关性。基于主题链接上下文提取,主题型语义块采用提取链接周围一定长度的文本,目录型和图片型语义块利用DOM树层次结构,对链接数据进行URL相关性判定;利用知网基于语义相似度的链接判定,给出一种综合内容和链接结构分析的URL主题相关性判定NPR算法,比较PageRank算法能提供更精确的主题页面。其成果对我国信息机构进行学科网络信息资源的深度建设有实用价值。
其他文献
目的比较平导、多曲方丝弓治疗深覆[牙合]的效果。方法随机选择深覆[牙合]Ⅱ度以上儿童患者30例,年龄12~17岁,随机分为2组,采用方丝弓矫治技术,分别使用平导和多曲方丝弓打开
目的探讨毛囊bulge区神经嵴细胞的体外生物学特点。方法采用体视显微解剖分离毛囊bulge区组织块,贴壁培养获取神经嵴细胞,通过形态学,结合Sox10,pTS,nestin免疫细胞化学,观察神经嵴
本文介绍了GPS系统的基本原理 ,并结合在森林调查中的实践应用情况 ,简要的总结了GPS系统在森林监测、区划、定位和调绘等方面的使用效果
在Banach空间中,给出了平均非扩张映射||Tx-Ty||≤a||x-y||+b||x-Ty||的Ishikawa迭代收敛的充要条件,所得结果改进和推广了平均非扩张映射的Ishikawa迭代收敛的性质.
采用三维有限元分析方法,计算分析了具有接缝的旧水泥混凝上路面上沥青加铺层在行车简载作用下应力随板底脱空的变化情况,从理论上深入研究了不同板底脱空对沥青加铺层反射裂缝
为实现电网安全与经济运行,对调度计划进行闭环安全校核具有重要意义。基于SOA架构,对电网调度支持系统中的安全校核应用进行结构设计,实现安全校核应用与其他应用的数据共享及服务调用,通过重构安全校核流程,整合计划数据与实时数据,实现安全校核的闭环控制。实现过程应用并行计算技术提高了计算效率,采用JAVA 2D等技术展示安全校核计算结果,直观形象地反映出电网的安全水平。安全校核应用的实现,提升了电网安全
目的分析女性骨性Ⅱ类错[牙合]非拔牙矫治上颌牙槽弓宽度的变化及对矫治效果的影响。方法选择女性骨性Ⅱ类错[牙合]不拔牙矫治患者20例,使用口外弓颈牵引及固定矫治器联合治
人的自然状态是霍布斯社会思想的基石。他认为在自然状态中,人和人在能力上是平等的。他不同意亚里士多德关于人的社会性的说法。有论者认为霍布斯的自然状态是建立在人性恶
目的观察斯康杜尼对牙髄治疗的麻醉效果。方法将392例病人的392颗牙髄病患牙,随机分为斯康杜尼组和盐酸利多卡因组,每组196颗,进行局部粘膜下浸润麻醉,行开髄术或拔髄术观察
提出一种基于共聚焦图像的深度估计方法。采用虚拟孔径技术把相机阵列获得的多视角图像合成得到共聚焦图像序列,并将其作为聚焦测距的数据源进行聚焦分析,实现对场景深度信息的估计。针对共聚焦图像的特点,将传统聚焦测距方法中的清晰度评价算法与颜色一致性评价算法相结合,提出一种聚焦度测量算法,该测量算法同时适用于图像中强纹理区域和弱纹理区域的聚焦分析。实验结果表明,该方法对聚焦判别的有效性较高,可以获得较准确的