论文部分内容阅读
[摘 要]采用k-means聚类算法将数据分为四类,精确求出每一个聚类的中心点任务的理想定价。计算理想定价与实际定价之差的算数平均,有一个较大的正数偏差,这是造成任务未完成的主要原因。对logistic回归模型进行改进,得到新的多元线性回归模型。并利用粒子群算法优化模型中的参数,得到其中一簇聚类的参数值。
[关键词]聚类算法;多元线性回归模型;粒子群算法
中图分类号:S837 文献标识码:A 文章编号:1009-914X(2018)18-0400-01
1.研究现状
随着我国经济快速发展,基于移动互联网下的自助式劳务众包平台发展迅猛,“拍照赚钱”是其中的一种模式。用户在APP上领取任务,完成任务赚取酬劳。目前许多任务因为定价不合理而无人问津。本文通过研究任务未完成的原因,来达到优化定价模型使任务尽可能多的被完成的目的。
2.1 基于K-means聚类算法的定价分析
K-means算法是将事先输入的n个数据对象以空间中k个点为中心进行聚类,。本文利用K-means算法对附件一中已结束项目任务的经纬度做聚类分析,得到了4个聚类簇以及对应的聚类中心。
2.2 logistic回归模型分析未完成的原因
任务完成度是一个二分类变量,取值为=1和=0。在本文的四个聚类簇中,选取聚类簇一为例计算任务完成情况与经纬度、定价以及距离的关系。
利用spss对四簇数据分别进行logistic回归分析,可知,在聚类1中,任务完成情况与经纬度、定价以及距离的关系式为:
3.1 多元回归模型
假定被解释变量Y与多个解释变量之间具有线性关系,本文通过考虑定价与纬度,经度,离心距离之间的关系,来建立新的定价模型。由相关系数图可知离心距离、经度、纬度与定价之间的线性关系如下:
由R2的值可知,直接进行多元线性分析的效果并不佳。利用改进POS算法,搜索回归系数的最优值,由此得到离心距离、经度、纬度与定价之间的线性关系的最优解。
3.2 PSO算法
粒子群优化算法的基本思想是通过群体中个体之间的协作和信息共享来寻找最优解,由n个粒子组成的群体0.对Q维空间进行搜索。
(1)定义适应度函数:用来评价种群中的每个粒子,当适应度函数的取值越小,则有因变量定价Y与自变量纬度X1,经度X2和离心距离X3的之间的拟合度越好。
(2)种群大小的选择N:一般粒子数取粒子自身维数的5-10倍时可搜索足够的解空间。在本文中,分别尝试M=25,30,35,40,45,50,通過分别求解,得出M的最合适的值为30。
(3)惯性权重W:在惯性权重PSO模型中w为定值0.7298.
(4)粒子的维度:在本问题中,所求目标函数带有四个未知量,所以粒子的维度为4.
(5)终止条件:在本文中最小误差可以设定为10-8,最大迭代次数设定为1000。终止条件为目标函数取到最小值时,得到的最适合解。
参考文献
[1] 汪晓银,邹庭荣,周保平,数学软件与数学实验(第二版),北京:科学出版式,2012.8.
[2] 马立新,单冠华,屈娜娜.基于改进粒子群算法的电力系统无功优化[J],控制工程,2012,19(6):34-39.
[关键词]聚类算法;多元线性回归模型;粒子群算法
中图分类号:S837 文献标识码:A 文章编号:1009-914X(2018)18-0400-01
1.研究现状
随着我国经济快速发展,基于移动互联网下的自助式劳务众包平台发展迅猛,“拍照赚钱”是其中的一种模式。用户在APP上领取任务,完成任务赚取酬劳。目前许多任务因为定价不合理而无人问津。本文通过研究任务未完成的原因,来达到优化定价模型使任务尽可能多的被完成的目的。
2.1 基于K-means聚类算法的定价分析
K-means算法是将事先输入的n个数据对象以空间中k个点为中心进行聚类,。本文利用K-means算法对附件一中已结束项目任务的经纬度做聚类分析,得到了4个聚类簇以及对应的聚类中心。
2.2 logistic回归模型分析未完成的原因
任务完成度是一个二分类变量,取值为=1和=0。在本文的四个聚类簇中,选取聚类簇一为例计算任务完成情况与经纬度、定价以及距离的关系。
利用spss对四簇数据分别进行logistic回归分析,可知,在聚类1中,任务完成情况与经纬度、定价以及距离的关系式为:
3.1 多元回归模型
假定被解释变量Y与多个解释变量之间具有线性关系,本文通过考虑定价与纬度,经度,离心距离之间的关系,来建立新的定价模型。由相关系数图可知离心距离、经度、纬度与定价之间的线性关系如下:
由R2的值可知,直接进行多元线性分析的效果并不佳。利用改进POS算法,搜索回归系数的最优值,由此得到离心距离、经度、纬度与定价之间的线性关系的最优解。
3.2 PSO算法
粒子群优化算法的基本思想是通过群体中个体之间的协作和信息共享来寻找最优解,由n个粒子组成的群体0.对Q维空间进行搜索。
(1)定义适应度函数:用来评价种群中的每个粒子,当适应度函数的取值越小,则有因变量定价Y与自变量纬度X1,经度X2和离心距离X3的之间的拟合度越好。
(2)种群大小的选择N:一般粒子数取粒子自身维数的5-10倍时可搜索足够的解空间。在本文中,分别尝试M=25,30,35,40,45,50,通過分别求解,得出M的最合适的值为30。
(3)惯性权重W:在惯性权重PSO模型中w为定值0.7298.
(4)粒子的维度:在本问题中,所求目标函数带有四个未知量,所以粒子的维度为4.
(5)终止条件:在本文中最小误差可以设定为10-8,最大迭代次数设定为1000。终止条件为目标函数取到最小值时,得到的最适合解。
参考文献
[1] 汪晓银,邹庭荣,周保平,数学软件与数学实验(第二版),北京:科学出版式,2012.8.
[2] 马立新,单冠华,屈娜娜.基于改进粒子群算法的电力系统无功优化[J],控制工程,2012,19(6):34-39.