论文部分内容阅读
随着通信技术的发展与智能设备的普及,社交网络逐渐成为人们进行信息交互与分享的关键平台,在生活文娱、市场营销、社会舆论等多个方面有着重要的应用。在这些应用场景中,如何确保信息在社交网络中进行高质量的传播,对于提升网络用户体验、优化社交网络运维起到了至关重要的作用。实际社交网络中,信息的高质量传播通常体现在三个方面1,即更快、更广和受众度更高。具体而言,(1)信息能以更快的时间被传送到网络用户中(速度快);(2)信息可以传播到更广泛的网络用户中(范围广);(3)多元信息竞相传播时,目标信息能被更高比例的网络用户接收(受众度高)。对此,本文聚焦社交网络中的信息高质量传播,从保障信息高质量传播的上述三个维度出发,分别解决提升各个维度传播质量所面临的实际问题,以最终实现信息传得快、传得广和占比高的目标,为实际社交网络的高效运维提供理论指导与技术支撑。本文的具体研究内容、挑战和创新点总结如下。首先,在传播速度方面,本文研究了社交网络中信息在全网中传播时间的分析与优化。在实际社交网络运维中,网络结构通常呈现出不断演进的特性:新的用户不断加入,并与网络中的用户不断建立新的连接关系。一方面,网络的演进致使网络规模不断增长,用户关联结构愈加复杂。信息传遍全网时需要覆盖更为庞大的用户数量,处理更为复杂的用户连接关系,容易导致更长的信息传播时间。另一方面,先前的大量研究表明:社交网络的演进也带来了一些结构上的独有特征,如网络直径逐渐缩减(Shrinking Diameter)、网络链接不断变密(Edge Densification)。这些演进结构的特性在一定程度上增加了信息被用户知晓和请求的可能性,如能高效利用,将有助于改善信息传播至全网的时间。为此,本文先对演进网络的结构密集特性进行了量化分析,得到了任一用户多跳范围内邻居数量的上下界,并发现该值在阶次上显著大于非演进网络。然后,利用该特性,本文设计了基于多跳邻居搜索的传播算法,使得用户有更多机会获知信息并发出请求。同时,算法设置了用户搜索邻居的限制条件,以避免过多用户同时请求带来较长的等待时间。最终,理论分析发现,所提算法合理利用了演进网络的结构特性,实现了仅为次线性的传播时间O(?)(其中n为用户数量,i为搜索跳数,D为网络直径,γ和τ为用户度参数),显著优于传统算法。进一步真实网络下的实验结果表明,所提算法实现的传播速度可达传统算法的1.38倍。其次,在传播范围方面,本文研究了社交网络中信息传播范围的最大化。为了获得较大范围的信息传播,人们常常会选择有影响力的用户提供样品、折扣等福利(称为“播种”)以吸引他们成为信息源(称为“种子”)散播信息。但是,在实际社交网络中,用户的线上信息不一定真实有效,例如,用户注册使用的手机号码可能并不常用,登记的地址信息常常没有实时更新。因此,人们难以对社交网络中的任意用户进行福利分配,而是只能接触到一小部分有效的用户进行种子选取。在较小的用户范围内,有影响力的用户尤为稀少,常常只能带来有限的信息传播范围。为了突破该用户接触限制,进一步扩大信息传播范围,本文利用朋友悖论现象(Friendship Paradox,即用户邻居的度数期望值比用户本身更大)提出了双阶段的播种框架:先对可接触用户分配福利以接触其邻居,然后对邻居用户进一步分配福利以扩大影响范围。在该框架下,本文首先采用传统的非适应性思想设计了具有收敛性的双阶段坐标下降算法。然后,为了克服播种和传播过程中的不确定性,本文设计了一系列具有理论保障的适应性算法,理论传播范围可达最大值的0.468倍,优于原有最佳算法。最后,本文在大规模真实社交网络上开展了大量实验,实验结果表明本文算法的传播范围显著高于对比算法,提升可达116%。最后,在传播受众度方面,本文研究了社交网络中目标信息在竞争传播中用户占比的提升问题。社交网络作为理想的信息投放渠道,吸引了大量发布者竞相投放自己的信息。面对激烈的信息竞争,如何准确把握信息竞争传播的规律,发现影响传播竞争力的关键要素,对于提高目标信息的受众度(即采纳该信息的用户所占网络比例)具有重要的指导意义。然而,在实际社交网络运维中,信息竞争传播过程的刻画同时面临来自网络和用户两方面的挑战:竞争传播所依赖的社交网络拓扑常常难以准确获得;用户收到的信息数量超过其处理能力,产生信息过载导致用户多变的信息选择行为。对此,本文首先采用链路预测常用的网络嵌入技术(Network Embedding)提取用户相似度,并基于用户之间的相似程度恢复网络链接;然后考虑了传播过程中信息过载的影响,对过载前后用户的信息选择行为分别进行了理论表征。基于此,本文分析得到了信息过载的临界时刻及其与网络拓扑、用户特征等因素的关系,并分别给出了过载前后,信息的用户占比随时间动态变化的显式表达式。利用该结果可知,在信息过载前,通过提升信息的感染能力可以使其理论用户占比达到100%;而在信息过载后,还可以通过提升用户信息处理能力、限制用户链接形成等方式提高信息的用户占比。进一步的实验表明,利用所揭示的竞争规律可以使信息的用户占比获得98.2%的提升。基于上述研究内容,本文对信息传播速度、传播范围和传播受众度三个典型维度进行了深入研究,取得了一系列的研究成果,促进了社交网络中信息的高质量传播。在未来的研究工作中,本文将研究实际网络运维中信息高质量传播可能涉及的其它方面,例如,如何引导信息准确传播到感兴趣的用户、如何避免信息在逐级传播中产生失真等等,以进一步优化社交网络运维。