论文部分内容阅读
大数据时代的到来为传统的机器学习领域带来了新的机遇和挑战,如何将传统的机器学习方法应用到大数据时代是当下研究的一个热点。大数据具有4V特征,即海量化、多样化、快速化、价值化。本文主要针对其海量化的特点,以经典的统计机器学习算法SVM为例进行研究。首先,本文分析了原问题的时间复杂度、对偶问题的时间复杂度和数据的维度、数量之间的关系。原问题的时间复杂度由维度决定,对偶问题的时间复杂度由数量决定,而维度和数量构成了数据的规模,因此可以根据数据的规模特点选择不同的求解空间。然后,我们通过将对偶问题的解转化为原空间的分类面来提高算法速率。最后,我们得到结论,通过对传统机器学习算法计算速率方面进行改进,可以使传统的机器学习算法满足大数据时代的要求。