论文部分内容阅读
随着互联网技术的发展,市场营销朝着智能化方向发展。一方面,基于互联网技术的社交网络成为市场营销的重要平台,受到工业界和学术界的广泛关注。另一方面,互联网使得信息和数据更加透明化,基于对大量数据的挖掘分析,可以为市场营销决策提供支持。本文通过研究基于社交网络的病毒营销和基于Web的房地产营销,探索了市场营销中两个重要因素,即营销受众和售卖时间。具体地,本文的研究贡献总结如下:第一,我们发现传统的用于对病毒营销进行建模的影响力最大化模型下,被影响人群的类别分布通常并不均衡,这意味着被影响人群的多样性较低,因此我们提出多样化的影响力最大化计算框架,然后我们提出一类多样性指标,得到了一个具体的优化目标。我们证明,该优化目标具有单调非减和子模性质。考虑到计算每个节点的影响力分布的时间复杂度很高,我们对问题做了一个条件松弛,用种子节点集合的多样性代替被影响人群的多样性。我们进一步将这种思想拓展到影响力最大化的一些启发式方法上,如度中心性和PageRank等。实验结果表明,我们提出的方法可以使得被影响人群更加多样化,而且可以很容易地在多样性和影响力之间取得平衡。第二,房地产售卖时间(Days On Market,DOM)是衡量房地产市场活跃程度的重要指标,对于房地产卖家和买家的决策有重要意义。已有的研究注重分析和解释价格和售卖时间的关系,却缺乏定论。本研究中,我们将研究重心从价格与售卖时间的关系转移到通过运用机器学习方法来精确预测DOM。具体地,我们首先获取了一个商业地产公司在北京的房地产交易数据集,以及相关的地理信息。基于这些数据,我们提取了五类特征,即房产属性特征、小区属性特征、地理信息特征、时序特征、元特征。接着,我们提出了基于地理学第一定律的多任务学习模型,并给出了求解的优化算法。最后,实验结果表明,我们的方法在归一化的均方根误差(nMSE)和平均绝对误差(MAE)等指标上均优于基线方法。