论文部分内容阅读
本文系统地讨论研究了一个新的随机过程类—网络马氏骨架过程,该随机过程是在解决网页重要性排序问题时被提出来的.
直观上,马氏骨架过程是一个以马氏链作为骨架结构的随机过程.网络马氏骨架过程不仅是一个马氏骨架过程,它还是一个跳过程,而且在给定骨架链信息的条件下,跳之间的时间间隔是彼此条件独立的.网络马氏骨架过程的随机结构可以描述为以下方式:
X0Y0→X1Y1→…XnYn…
其中{Xn,n≥0}是一个马氏链,{Yn,n≥0}是跳之间的时间间隔序列.每个Yn的长度可以依赖于马氏链{Xn}的信息,但在给定马氏链信息的前提下,与其它的{Yk,k≠n}是独立的.
上面所描述的随机动力结构在各种自然社会学科中都有它的身影出现,比如生物学,经济,排队论,工程等等.但是对这种随机结构开展研究的直接动机则来源于网络信息检索.网络马氏骨架过程的概念是在[20,21]中被首次提出的,在该文中作者们发现这个框架可以很好地用来刻画用户在网络上的浏览行为.在这种情况下,过程的状态空间E是我们关注的网页集合,X={Xn,n≥0}描述的是用户在网页上的跳转行为,它正好形成了一个以E为状态空间的马氏链,而Y={Yn,n≥0}代表了用户在每个网页上的停留时间.在当前网页上的停留时间是随机的,它的取值可能依赖于之前的,现在的或者以后要访问的网页信息,但与在其它网页上的停留时间是条件独立的.
网络马氏骨架过程框架在计算网页重要性上非常有用,它给我们所熟知的众多网页网络重要性排序算法提供了一个统一的数学框架,比如PageRank[7,40,52], AggregateRank[3,4,19], TrustRank[23], Block-level PageRank[8],PopRank[50],BrowseRank[41-43]等等.不仅如此,该框架还可以用来设计新的算法来解决更复杂的问题.例如,作为网络马氏骨架过程的一个新的子类,镜面半马氏过程在给移动网络进行重要性排序时发挥着核心作用,由此设计出来的MobileRank算法表现出优异[20,21].众所周知移动网络与通常的因特网在结构上是有很大不同的[32].
理论上,网络马氏骨架过程框架涵盖了很多大家熟知的过程,如离散时间马氏链,时齐的连续时间马氏过程(Q-过程),半马氏过程等等.它也包涵了一些重要的新过程类,比方在理论上很重要的简单网络马氏骨架过程和用来模拟移动网络上的浏览行为的镜面半马氏过程.正是由于这种自然的易处理的结构,我们希望将来能在网络马氏骨架过程的框架下发现更多有用的新的过程子类.
在这篇论文中,我们系统地研究了网络马氏骨架过程的理论方面.我们给出了网络马氏骨架过程的严格数学定义,顺便我们指出,为了满足网络信息检索的需要,我们的马氏骨架过程概念与之前侯振挺等人提出的概念[27,28]更为宽广.然后我们描述了网络马氏骨架过程的时齐性,这里定义的想法可能在其它地方也是有用的.基于时齐性,我们讨论了它的平稳性,构造,和与多变点过程的关系.我们详细地讨论了一般状态空间上的半马氏过程,我们也细致地研究了在手机网络排序中发挥重要作用的镜面半马氏过程这一新过程类.我们给出了关于网络马氏骨架过程的两个极限分布的结果,它们将直接应用于计算网页的重要性.最后我们简单地介绍一下网络马氏骨架过程在网页重要性排序算法中的应用.