论文部分内容阅读
本文提出了一个新的研究问题即考察属性信息与图拓扑的关联程度,它涵盖了相当广泛的一类现实问题,有着很强的实际背景和应用前景。比如,人们常常会因为朋友的推荐而去购买某种商品,这种购买行为与消费者所在的社交网络有着深刻的联系。对商家来说,如果能了解购买行为与社交网络关联性的强弱,便能通过优化广告的投放策略而获利,因此对这个问题的研究蕴含着很大的商业价值。
在一些直观思想的引导下,本文提出了一个有意义的度量属性与图结构关联程度强弱的方式——p-measure。p-measure直观意义明显,计算简便,并且易于拓展。利用p-measure,我们可以很容易地看出某种属性与图结构关联程度的强弱,了解关联性程度随着时间演化的特点,也可以发掘不同属性与图结构关联程度的差异。
本文给出了计算p-measure的核心算法——M算法。度数限制规则的引进则大大提高了算法的效率。我们还从理论上分析了算法的复杂度。
本文通过大量有代表性的实例来考察算法的有效性和实用性。从各个例子来看,算法能比较好地反映我们的构建意图。考虑到处理现实中大型数据的时间经济性的要求,我们利用机器学习和假设检验的基本思想,使得算法在采样次数不大的情况下仍能给出具有统计精度的解。
本文对p-measure做了一个直接的推广,使得它稍加修改就能用来计算多种属性关于图结构的关联程度,这大大地拓展了p-measure的理论价值以及应用前景。