论文部分内容阅读
摘要:本文针对“拍照赚钱”类APP任务标价问题,提出基于任务打包的定价模型。通过多元回归拟合、BP神经网络给出了项目任务标价模型。采用非线性规划,以最大任务效用为规划目标,对定价模型进行改进,得出打包联合发布不仅可以使任务完成率提高,还可以降低劳务众包平台的成本。
关键词:多元回归拟合;非线性规划;BP神经网络
1 非线性回归模型
首先将任务定价按照由低到高的顺序排列,相同的任务定价划分为一类,共划分为23类,求出不同任务定价的中心点,求得23个中心点的具体位置(下表位其中2个)。
Table 123类任务定价中心的经纬度
假设地球是一个完美球体并以零度经为基准,地表任意两点的经纬度就可计算出这两点的地表距离。按照0度经线的基准,东经取经度的正值,西经取经度负值,北纬取90纬度值,南纬取90-纬度值[1]。计算公式为:
(1.1)
其中,LatA,LatB 、MLonA,MLonB分别是经过上述处理的A,B两点的纬度与经度,D为两位置间的实际距离。
由此得出每个中心点和会员的距离,挑选出每一个会员到所有中心点的最短距离,找出最短距离所对应的任务定价。在得到对应关系之后,对数据进行回归拟合,把任务定价作为因变量,距离作为自变量,得到任务定价和距离的关系是:
R方的值为0.983>0.5,拟合效果良好。所以该回归的公拟合式可以使用,由此我们得出了任务定价与距离的关系表达式。
再把距离与经纬度之间的公式带入上式,得到定价和经纬度之间的关系
其中,LatA,LatB 、MLonA,MLonB 分别是经过处理的任务、会员的纬度与经度,D为两位置间的实际距离。
对模型进行检验,利用所得公式计算附件一的标价得到模型标价,再与平台标价进行比较,得到下图。
Figure 3模型标价与平台标价曲线图
其中,红色为平台标价,蓝色为模型预测标价。
综合上述分析,任务定价和地理位置有良好的线性关系。
任务未完成的原因主要有以下几点:任务定价不够合理;人文地理因素:主要包括交通、城市、人口;任务发布规则。
2 BP神经网络模型
BP神经网络是由误差反向传播算法训练的多层前馈人工神经网络,是目前应用最广泛的一种人工神经网络,不需要任何先验公式,就能从已有数据中自动地归纳规则,获得这些数据的内在规律。
算法具体步骤如下:
(1)应用随机函数生成一组初始权值,包括输入层和隐含层之间的权值矩阵及隐含层和输出层之间的权值矩阵。
(2)提供一组训练模式,对网络进行训练,直到满足要求。
(3)前向传播,对于给定的输入模式,计算其输出模式,并与期望输出模式比较,若误差大于给定闽值,则继续执行,否则,返回。
应用上述神经网络模型,用处理过的附件一数据及因素数据作为训练样本,训练神经网络,最后输出任务为完成的相关数据预测出标价及任务完成情况并观察实际值与预测值曲线,发现预测值与实际值几乎重合,任务完成率由原来的62.5%提高到84.07%。
Table 2重新标价后的数据对比(部分)
3 多目标优化模型
对于需要打包的任务,以这些任务的中心点作为圆心,以R为半径做圆,众包的任务只能分配给该圆域之内的会员,并优先分配给信誉值高的会员。由于会员的预定任务限额与会员信誉度呈正相关,并且信誉度越高挑选任务的优先级越高,由此我们引入会员能力值来衡量一个会员完成任务的能力:
信誉值过低的会员对任务完成度的影響基本可以忽略,对值小于0.5的数据进行剔除。
我们依据Kazemi等人提出的空间众包平台上的任务分配问题以及考宋天舒等人改进的空间众包环境下的3类对象在线任务分配模型,建立基于会员—
—任务最优定价模型。建立关于平台会员以及平台任务的集合:
众包任务:
平台会员:
其中jix、jic分别代表众包任务和平台会员的经度,Wix,Wic分别代表众包任务和平台会员的纬度,rix代表最大半径范围,代表会员能力值。
众包任务Xi由平台会员Ci 完成定义为该任务的效用。
求解的最优化目标就是最大任务效用,并且该优化目标满足以下约束条件:
(1)限额约束:每个会员所接受的任务不能超过该会员的最大任务限额。
(2)范围约束:任务只分配给以该打包任务为中心,以rix为半径的范围之内。
通过求解该模型,我们发现由于将多个任务联合打包发布时该任务标价大大提高,对会员的吸引力加大,提高了任务的完成度,这种现象在深圳市尤为明显。
参考文献:
[1]黎珍惜,黎家勋,基于经纬度快速计算两点距离计测量误差[J],测绘与空间地理信息,2013,11(03):36-11.p235-237,2013.
[2]Porter.M. Competitive Strategy. [M]. New York :Free Press, 1980.
[3]韩中和. 企业竞争力--理论与案例分析. 上海: 复旦大学出版社, 2002.P12
关键词:多元回归拟合;非线性规划;BP神经网络
1 非线性回归模型
首先将任务定价按照由低到高的顺序排列,相同的任务定价划分为一类,共划分为23类,求出不同任务定价的中心点,求得23个中心点的具体位置(下表位其中2个)。
Table 123类任务定价中心的经纬度
假设地球是一个完美球体并以零度经为基准,地表任意两点的经纬度就可计算出这两点的地表距离。按照0度经线的基准,东经取经度的正值,西经取经度负值,北纬取90纬度值,南纬取90-纬度值[1]。计算公式为:
(1.1)
其中,LatA,LatB 、MLonA,MLonB分别是经过上述处理的A,B两点的纬度与经度,D为两位置间的实际距离。
由此得出每个中心点和会员的距离,挑选出每一个会员到所有中心点的最短距离,找出最短距离所对应的任务定价。在得到对应关系之后,对数据进行回归拟合,把任务定价作为因变量,距离作为自变量,得到任务定价和距离的关系是:
R方的值为0.983>0.5,拟合效果良好。所以该回归的公拟合式可以使用,由此我们得出了任务定价与距离的关系表达式。
再把距离与经纬度之间的公式带入上式,得到定价和经纬度之间的关系
其中,LatA,LatB 、MLonA,MLonB 分别是经过处理的任务、会员的纬度与经度,D为两位置间的实际距离。
对模型进行检验,利用所得公式计算附件一的标价得到模型标价,再与平台标价进行比较,得到下图。
Figure 3模型标价与平台标价曲线图
其中,红色为平台标价,蓝色为模型预测标价。
综合上述分析,任务定价和地理位置有良好的线性关系。
任务未完成的原因主要有以下几点:任务定价不够合理;人文地理因素:主要包括交通、城市、人口;任务发布规则。
2 BP神经网络模型
BP神经网络是由误差反向传播算法训练的多层前馈人工神经网络,是目前应用最广泛的一种人工神经网络,不需要任何先验公式,就能从已有数据中自动地归纳规则,获得这些数据的内在规律。
算法具体步骤如下:
(1)应用随机函数生成一组初始权值,包括输入层和隐含层之间的权值矩阵及隐含层和输出层之间的权值矩阵。
(2)提供一组训练模式,对网络进行训练,直到满足要求。
(3)前向传播,对于给定的输入模式,计算其输出模式,并与期望输出模式比较,若误差大于给定闽值,则继续执行,否则,返回。
应用上述神经网络模型,用处理过的附件一数据及因素数据作为训练样本,训练神经网络,最后输出任务为完成的相关数据预测出标价及任务完成情况并观察实际值与预测值曲线,发现预测值与实际值几乎重合,任务完成率由原来的62.5%提高到84.07%。
Table 2重新标价后的数据对比(部分)
3 多目标优化模型
对于需要打包的任务,以这些任务的中心点作为圆心,以R为半径做圆,众包的任务只能分配给该圆域之内的会员,并优先分配给信誉值高的会员。由于会员的预定任务限额与会员信誉度呈正相关,并且信誉度越高挑选任务的优先级越高,由此我们引入会员能力值来衡量一个会员完成任务的能力:
信誉值过低的会员对任务完成度的影響基本可以忽略,对值小于0.5的数据进行剔除。
我们依据Kazemi等人提出的空间众包平台上的任务分配问题以及考宋天舒等人改进的空间众包环境下的3类对象在线任务分配模型,建立基于会员—
—任务最优定价模型。建立关于平台会员以及平台任务的集合:
众包任务:
平台会员:
其中jix、jic分别代表众包任务和平台会员的经度,Wix,Wic分别代表众包任务和平台会员的纬度,rix代表最大半径范围,代表会员能力值。
众包任务Xi由平台会员Ci 完成定义为该任务的效用。
求解的最优化目标就是最大任务效用,并且该优化目标满足以下约束条件:
(1)限额约束:每个会员所接受的任务不能超过该会员的最大任务限额。
(2)范围约束:任务只分配给以该打包任务为中心,以rix为半径的范围之内。
通过求解该模型,我们发现由于将多个任务联合打包发布时该任务标价大大提高,对会员的吸引力加大,提高了任务的完成度,这种现象在深圳市尤为明显。
参考文献:
[1]黎珍惜,黎家勋,基于经纬度快速计算两点距离计测量误差[J],测绘与空间地理信息,2013,11(03):36-11.p235-237,2013.
[2]Porter.M. Competitive Strategy. [M]. New York :Free Press, 1980.
[3]韩中和. 企业竞争力--理论与案例分析. 上海: 复旦大学出版社, 2002.P12