【摘 要】
:
针对大规模网页相关性排序工作中使用的多来源网页信息形式多样、利用困难的问题,提出了一种新的自动网页特征获取方法.该方法利用一组事先定义好的规则自动地从网页中获取相
【基金项目】
:
The National Natural Science Foundation of China ( No. 60673087).
论文部分内容阅读
针对大规模网页相关性排序工作中使用的多来源网页信息形式多样、利用困难的问题,提出了一种新的自动网页特征获取方法.该方法利用一组事先定义好的规则自动地从网页中获取相关性特征,这些特征可以有效地表达网页的实际内容并改善搜索引擎的排序性能.该方法所获取的网页相关性特征具有格式统一、噪声数据少的特点,能够非常方便地应用于网页的相关性排序.为了评价网页特征和用户查询之间的相关性,还提出了一个特征级别的相关性判定标准.最后,实验结果证明了所提出的特征获取方法和特征相关性等级判定标准对于提升搜索引擎的排序性能具有显著的
其他文献
对于一般的消费者来说,15英寸的液晶显示器也是个不错的选择,一方面其实际的可视面积与17英寸的纯平显示器大致相同,对于大众用户来说完全可以满足使用需求,而另一方面相对17
就多诺水电站拦污栅前、后水位信号远传至闸首LCU3种方案的可行性进行了比较,在无法布线及布线不便的情况下方案3具有结构紧凑、安装调试方便快捷、维护简单、节约土建成本和
根据复用分割原则,提出2种新的两跳固定中继蜂窝网的频谱分配方案,即:侧重于覆盖面积的频谱分配方案和侧重于频谱效率的频谱分配方案.相对于侧重频谱效率的频谱分配方案,侧重于覆
首先给出了一种远端天线单元选择的分析模型,并定义了分布式移动通信系统中2种类型的切换:小区内切换(intra—cell HO)和小区间切换(inter—cell HO);然后提出了一种小区间切换的模
【正】 在“非典”肆虐之前,我们有很多娱乐方式可供选择,我们可以去酒吧、可以去迪厅、可以去游泳、可以去KTV、可以外出旅游,至少我们还可以出去大吃一顿……可是现在,我们
与相干检测相比传统差分检测会带来约3dB的性能损失.提出一种新的差分酉空时调制检测方案.该方案分为2步:首先将传统差分检测获得的数据序列进行差分再编码,作为对发送符号序列的
为了将纳米颗粒的强化传热吸收作用应用于氨水吸收制冷中,提出了在氨水溶液中添加铁酸锌纳米颗粒和复配阴/阳离子表面活性剂SDBS和CTAB的纳米流体的配制方法,并对其稳定性进
【正】 液晶显示器的普及程度越来越高,其拥有的众多优势令消费者不得不为之心动。15英寸的液晶显示器逐步在走入主流的位置,但是如果你想要追求更好的使用效果,更加宽阔的视
为了解决频繁闭项目集挖掘中时间和存储开销大的问题,提出了一种基于FC-tree(频繁闭模式树)的频繁闭项目集挖掘算法max-FCIA(最大频繁闭项目集挖掘算法).该算法利用哈希表映射事
设k和d是2个互素的正整数且k≥2d.G^dk是一个图,它的顶点集合为{0,1,…,k-1},边集合为{ij|d≤|i-j|≤k-d,i,j=0,1,…,k-1}.图G的圆色数χc(G)定义为使得图G与G^dk同态的2个正整数k和d的最小比