一种基于源网页质量的锚文本相似度计算方法——LAAT

来源 :情报学报 | 被引量 : 0次 | 上传用户:tdwh14226
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
锚文本作为对目标网页的描述,往往分布在不同的源网页上,质量也参差不齐.本文利用了超链接分析算法的成果,提出一种基于源网页质量的锚文本相似度计算方法--LAAT(Link Aid Anchor Text).实验表明,利用源网页质量能够有效地综合各源网页上的锚文本组成,从而能够提高检索性能.
其他文献
自1981年作者同被引技术(ACA)开发以来,作为一种揭示科学结构行之有效的方法,被学术界认可并广为采用,但烦琐的程序、计算中存在的问题严重阻碍了其发展.信息可视化浪潮为ACA
1发病原因1.1微生物因素引起奶牛乳房炎的病原微生物主要是多种非特定的微生物,各种微生物的感染程度因地区不同而异,包括多种细菌、病毒、支原体。
简要介绍了2015年空调温控监察工作,提出了存在的主要问题、解决方法及今后空调温控监察的打算和建议.
给出了一种汉语分词有向图的快速生成算法。所构造的有向图可以作为机械分词、消除歧义以及进一步分析句子的基础。