基于支持向量机的性别预测

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:mybose
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网行业的飞速发展,网络在人们生活中的地位日益重要。伴随互联网而来的是信息爆炸,用户需要花费大量的时间在海量的数据中寻找自己需要的信息。与此同时,随着电子商务的不断发展和完善,电商企业之间的竞争也日趋激烈。为了刺激消费,商家不断地寻找着更加高效的营销模式,而个性化营销就是在这样的背景下走进了人们的视野。凭借着可以有效改善用户体验的巨大优势,个性化营销逐渐受到重视和关注。与推崇大规模集约生产技术、标准化的理念、生成标准产品的传统营销模式不同,个性化营销的核心是量体裁衣,根据顾客的不同需求设计出不同的产品或者提供不同的服务。作为个性化营销的基础,利用数据挖掘技术对用户特征的分析识别技术成为了一个重要的课题。   本文以某大型电子商务网站提供的(经加密处理的)用户数月的购买记录为数据基础,以分析预测用户特征中的性别特征为主要目标,详细论述了基于支持向量机方法的完整数据建模过程。文章为性别特征预测提供了较为完整的结构与框架,其中主要包括:获取原始数据、数据解释与分析、数据预处理、获取数据矩阵、划分训练集与测试集、建立模型、分析预测结果和改进等多个过程。虽然受到了数据质量在内的一些因素的制约,本文模型的预测精确度仍然达到了一定的水平,为以性别特征为例的用户特征分析提供了思路。
其他文献
在本文中,我们讨论了一类二重量可约循环码,得到这类二重量可约循环码可以由两个一重量simplex码的直和构成.对这一类型的二重量可约循环码,利用特征标和高斯和的一些结论和性质
在统计推断中,从分布未知的总体中获取样本通常采用都是简单随机抽样。但是,在某些实际问题中,当采用简单随机抽样比较耗时耗费时,这时可采用排序集抽样。排序集抽样发展至今在参
P2P(Peer-to-Peer)即对等网络,目前已经成为Internet应用系统中最重要的成员之一。由于P2P网络具有的开放性、匿名性以及松耦合性等,使得网络系统中的实体之间由于缺乏信任而带
本文利用收缩(contraction)的方法由两个变量的量子环面构造出一个新的无穷维李代数,并对它进行了研究.本文第一部分研究了这个李代数的结构,并证明它可看成Virasoro-like代数
设()是复数域上的一个n× n阶的可逆矩阵群.我们称()是一个伪置换矩阵群,如果()中的每一个矩阵都相似于一个置换矩阵.一个中心问题是:在什么条件下一个伪置换矩阵群将等价于一
本文主要运用变分方法研究如下带Hardy奇异项和Sobolev临界指数的拟线性椭圆方程-N∑(l)=1(e)/(e)x(l)|▽u|p-2(e)u/(e)x(l))-μ|u|p-2u/|x|p=|u|p*-2u+g(x),u∈D1,p(RN).其中N
排序就是在一定的限制条件下,分配时间资源去完成一些任务,使得一个或者多个目标达到最优.近年来,平行分批排序和在线排序是两个发展比较迅速的排序模型.平行分批排序模型中,