网页排序中的随机模型及算法

来源 :中国科学:数学 | 被引量 : 0次 | 上传用户:lfwvb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网规模的日益增长,搜索引擎已经成为互联网上有效的信息获取工具.而在众多搜索引擎的背后,是信息检索技术,也即网页排序算法在起作用.网页排序包括重要性排序和相关性排序.通过我们研究发现,尽管这两类排序所依据的准则不同,但是都可以通过建立适当的随机过程模型来研究.对于网页重要性排序,我们通过分析用户浏览网页的行为建立了Markov骨架过程的框架.基于该框架我们分析了三种不同的随机过程模型对用户行为模拟的合理程度,并设计了名为BrowseRank的一组新算法,该算法可以根据用户上网行为来计算网页的重要性.在网页相关性排序中,我们主要针对排序结果联合问题建立了一个基于Markov链的监督学习框架.通过将传统方法的监督化,使原来难于解决的问题变的易于学习,将原来的NP-难问题转化为一个半正定规划问题,提高了效率. With the increasing size of the Internet, search engine has become an effective tool for obtaining information on the Internet, and behind many search engines, information retrieval technology, that is, web page sorting algorithm at work.Web page sorting, including the importance of sorting and related We found that although the two types of ranking are based on different criteria, they can be studied by setting up an appropriate stochastic process model.For the ranking of web page importance, we construct a Markov framework by analyzing the behavior of users browsing web pages Process framework.According to this framework, we analyze the reasonableness of three different stochastic process models to simulate user behavior and design a new set of algorithms called BrowseRank, which can calculate the importance of web pages according to the behavior of users In the web page relevance ranking, we mainly establish a Markov chain-based supervisory learning framework for the joint result of the ranking result.On the basis of supervising the traditional method, making the original difficult to solve the problem easy to learn, the original NP- The difficult problem transforms into a semi-definite programming problem, which improves the efficiency.
其他文献
在做计算题时,很多学生普遍有轻视、粗心的态度。一些计算题并不是不会做,而是由于注意力不够集中、抄错题、运算粗心、不进行验算等造成错误。在计算教学中,笔者比较重视培
“Imaginal thinking” epitomizes the ba-sic contents and characteristics of the tradi-tional mode of thinking in China. It is deter-mined by the property of non
教师的论坛校长的参谋师资培训者的助手中文核心期刊教育部主管东北师范大学主办《中小学教师培训》是教育部主管、东北师范大学主办的研究中小学教师培训,促进教师专业发展
随着新课程改革的不断深入,微视频越来越被一线体育教师广泛地运用于课堂教学中。由于小学生的第二信号系统不发达,很难直接感知抽象性的事物,注意力很难集中,且集中时间较短
跟前一篇通讯(见《读书》一九八四年第一期)所介绍的第三十五届国际书籍博览会一样,这次书展举行的地点也在德国西部的文化中心法兰克福,然而时间却要早得多,即在半个多世纪
兴趣,是学生学习的动力,小学生对什么都感兴趣。如果在数学教学中教师思维僵化,只是一味机械的讲课留作业,学生感受不到数学学习的快乐,那时间一长,学生就失去了对数学学习的
目的:探讨血清弓形虫-IgM(TOX-IgM)阳性与C-反应蛋白(CRP)含量的关系。方法:采用ELISA法检测非孕妇血清TOX-IgM;采用免疫比浊法检测受试者血清中CRP含量;血清TOX-IgM阳性40例
1.专著、论文集、学位论文、研究报告格式[序号]主要责任者.文献题名[文献类型标识].出版地:出版者,出版年,起止页码(任选).2.期刊文章格式[序号]主要责任者.文献题名[J].刊
<正> (本刊讯)国家出版事业管理局责成中国印刷科学技术研究所起草编制的《校对符号及其用法》,经局批准为专业标准,并决定于1982年元月起,在有关出版印刷业中试行。
2016年12月2日,“全国儿童食品安全守护行动”城市行活动在北京市海淀区中关村第二小学百旺校区举行了盛大的启动仪式。本次活动的主办单位是中国儿童少年基金会、中国营养保