【摘 要】
:
文章提出了一种基于网络用户行为的相关页面挖掘模型。模型采用统计的方法对proxy日志进行挖掘。模型的输入是一个WEB页面,输出是一组与之相关的页面。模型的假设基础是一组
【机 构】
:
中国科学院计算技术研究所北京100080
论文部分内容阅读
文章提出了一种基于网络用户行为的相关页面挖掘模型。模型采用统计的方法对proxy日志进行挖掘。模型的输入是一个WEB页面,输出是一组与之相关的页面。模型的假设基础是一组兴趣相似的人访问的页面有可能相关。模型从用户群中找出对输入页面感兴趣的用户,通过聚类从这些用户中找出一类具有相似兴趣背景且对输入页面最感兴趣的用户,综合这类用户感兴趣的页面,从中挖掘出与输入页面相关的页面。该模型与目前流行的相关页面检索算法的最大区别在于分析的对象是网络用户行为,因为模型认为页面是否相关的最终判定者应该是用户,通过分析网络用户行为能够更好地挖掘用户在页面相关判定上的潜在意识。用户对页面的兴趣度基于用户对页面的访问频率而定义。实验表明,该模型是可行的。该模型可用于改进传统的IR,提供相关反馈和查询扩展,使其更加适应Internet检索。该模型也可用于内容安全方面的相关主题预测。
其他文献
随着我国改革开放的快速推进,我国参与全球经济一体化步伐不断加快,国际贸易取得重要进展。企业是我国国际贸易的基础性力量,也是推动我国国际贸易继续加快发展的强大推动力
法国陆军一直处于世界陆军武器装备现代化的潮头浪尖。1993年,"勒克莱尔"主战坦克率先实现数字化并装备部队,开创了地面装甲突击装备数字化的先河。2010年9月,法国陆军领先于
<正>每当谈及"数字化",焦点往往都放在通信以及士兵间通过各种平台建立的联系之上。虽然信息系统在部队战术、战役和战略层面建立连接十分重要,但是人们经常会忽略信息和数据
<正>"全员参与、全面覆盖、全程监控"的财政大监督理念的提出,改变了专职监督机构唱"独角戏"的时代,使财政监督与财政管理有机融合。为进一步推进财政大监督机制建设,从机制
<正>东莞市盆协于10月1日在真趣园举行了东莞市科协2012年第11期"科技创新论坛"——"国家新品种真趣松学术论坛"和国际盆景人士学术交流会议。出席论坛的有原东莞市政协主席
<正>摩托车以快捷灵活,价格易接受,适应性强等优势,成为大众喜爱的代步工具.但是车架焊接接头断裂的事故时有发生,虽然所占比例非常小,但直接威胁着乘骑人员的安全,必须解决.
<正> 伴随汽车工业的迅猛发展和普及,作为汽车行驶保障供应环节的加油站也如雨后春笋般涌现,成为大众生活中的一部分。那么加油站是如何产生呢?发展历史中曾受哪些因素的影响
机器视觉通过图像摄取装置将采集到的物体图像转换成像素,根据像素亮度、颜色等信息,转变成数字化信号,传送到图像处理系统,然后运用数字图像处理技术对图像进行处理和理解,
金词属于"歌本"与"辞本"同体统一的"声学",其创作接受系文学—文化现象;"词曲递变"发生、词体蜕变下元词的创作和传播方式走向案头化,大部已仅是"辞本"的案头之作,书册阅读为
<正>在全球化的背景下,英语在大多数国际场合逐渐建立起主导语言的地位。为顺应这一潮流,越来越多的国家开始重视本国的英语教育。与很多母语非英语的国家一样,中国也在积极