论文部分内容阅读
利用“马太效应”的积极作用,Kleinberg提出了针对科研社区项目博弈的两种特殊情形的重加权机制,在新的分配机制下,能够使得社区收益最优化。本文重点研究Kleinberg重加权机制在大众生产社区的机制拓展,并给出生产者选择行为的重加权机制引导模型。对于科研社区项目博弈的一般模型,单纯对参与者重加权或者对项目重加权不一定能够使得最优指派恰是非合作博弈的纳什均衡。本文提出了广义指派&项目博弈模型,该模型是Kleinberg重加权机制在科研社区项目博弈一般模型的拓展模型,其目标函数是社区收益最大化,约束条件是要求广义指派是参与者非合作博弈的一个纳什均衡。广义指派&项目博弈模型的求解问题是一个NP难题,因此本文主要讨论该模型的求解问题,提出了模型求解的贪婪算法和改进贪婪算法。通过仿真实验发现,贪婪算法能够求得广义指派&项目博弈模型较优的解,而且与模拟退火算法相比贪婪算法能够求得模型更优的解,与贪婪算法相比基于后悔值改进贪婪算法能够求得模型更优的解。大众生产是互联网用户通过在线合作,共同生产知识产品的一种新型生产模式。这些互联网用户称为大众生产者。开源社区和在线百科都是典型大众生产社区。要研究大众生产社区的Kleinberg重加权机制拓展以及生产者选择行为引导模型等问题,首先需要研究大众生产者的选择行为特征。本文以百度百科大众生产社区为例,研究了词条生产者的选择行为特征。首先,将百科词条按词条领域、词条类型和词条编辑类型进行分类。建立了从词条集合分别到词条领域集合、词条类型集合和词条编辑类型集合的映射。对于生产者词条选择序列做了如下两方面分析和研究工作:(1)分析了生产者基于词条领域、词条类型和词条编辑类型的选择频率随编辑次数的变化情况;(2)利用L-Z复杂度和信息熵分析了三类序列的复杂性。发现词条生产者针对词条的每一种分类都有个体偏好,信息熵和L-Z复杂度得到的生产者选择行为复杂性非常一致。其次,基于词条的三种分类,进一步定义了生产者针对同一词条领域、同一词条类型或者同一词条编辑类型的间隔次数时间序列和间隔时间时间序列。对两类时间序列做了以下分析和研究工作:(1)利用L-Z复杂度和样本熵对两类时间序列的复杂性进行了研究,发现间隔时间时间序列的复杂度小于对应间隔次数时间序列的复杂度;(2)分析了两类时间序列的幂律分布特征,发现序列长度在1000以上时,词条领域、词条类型和词条编辑类型的两类时间序列均服从幂律分布,但幂指数的范围不同;(3)利用MF-DFA方法分析了两类时间序列长程相关和多重分形特征,发现绝大大部分间隔次数时间序列具有“持久性”长期记忆,间隔时间时间序列具有“持久性”或“反持久性”的长期记忆;当序列长度在1000以上时,两类时间序列都不是一个单重分形结构,而是一个多重分形过程。最后,根据大众生产社区生产者选择行为特征,提出了两类Kleinberg重加权机制拓展及其引导模型:基于期望收益r次重加权机制及其引导模型和基于引导量指数重加权机制及其引导模型。利用百度百科词条生产者针对词条类型的选择行为特征对引导模型进行了仿真验证,验证了基于引导量引导模型能够很好地描述词条生产者选择行为的引导机制。