基于SAS数据挖掘的C2C信用评价研究

被引量 : 0次 | 上传用户:woshishen654123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
2007年中国C2C电子商务市场保持健康增长,交易规模为410.4亿元人民币,较2006年增长90%。预计未来两年我国C2C电子商务网站的总营业收入规模将分别为678亿元和1023亿元。C2C交易在快速发展的同时,其交易体系的信用问题也逐渐暴露出来,成为阻碍C2C交易发展的主要问题之一。因此本论文的主要分析内容是C2C交易信用评价系统。本论文的研究内容主要是研究当前的C2C信用评价系统是否有效及相关的建议措施。对于信用评价系统的有效性,本论文从默认评价和买家行为模式的角度进行分析。对于默认评价,本论文使用SAS Enterprise Miner的决策树建模分析,得出买家做出默认评价的规则,并利用这些规则提高信用评价有效性。对于买家行为模式,本论文使用SAS Enterprise Miner的关联规则进行分析,得出买家的购物模式,分析得出信用评价系统有效。同时基于信用评价系统有效性,利用SAS Enterprise Miner进行序列分析,预测买家的未来购物模式。本论文还分析了影响信用评价的因素,以此来提高信用系统有效性和可靠性。第一章是绪论,包括研究背景和研究意义,当前研究现状,本论文的主要研究内容、研究方法和创新点。当前研究现状从国内外的角度对相关文献进行阐述,指出虽然有众多的研究,但对信用评价缺乏更有效的研究。本部分也对SAS软件进行了介绍,指出其数据挖掘功能是商务智能软件中最强大的。第二章是C2C交易信用评价的发展及现状,包括有关电子商务及C2C信用和信用评价的相关理论。本章的重点是信用评价的基本原理和其运行机制,指出了其在推动C2C交易中的重要作用。同时,本章分析了当前C2C交易中存在的关键问题,从而为后面的分析做好准备。第三章是数据挖掘及其在电子商务中的应用,包括数据挖掘的概述,数据挖掘工具分析和数据挖掘在电子商务中的应用。本论文分析了数据挖掘在数据爆炸时代的重要作用,指出了其在海量数据分析中的重要作用。同时也说明了数据挖掘与传统数据分析的区别。本章通过比较分析流行的数据挖掘工具来说明SAS的优势性。最后本章研究了数据挖掘已经应用于哪些方面的电子商务研究。第四章是C2C交易信用评价有效性研究,包括决策树分析、关联规则、序列分析和回归分析。这一章是本论文的核心部分,是整篇论文最重要的部分。本章首先对使用的数据进行了描述,接着利用SAS Enterprise Miner进行了决策树分析、关联规则分析和序列分析,从不同的角度对C2C交易信用系统有效性及改进策略进行分析。最后分析了影响信用评价的因素,并利用这些因素来提高信用评价。第五章是本论文的结论和建议,是论文的最后一部分。通过前面的分析,本论文得出了相关的建议。并阐述了论文的局限性和未来研究方向。本论文从C2C信用评价的角度对论文进行了深入的分析,主要观点包括以下五个方面:(1)当前主流C2C交易平台的信用评价系统有效。当前研究主要着眼于对信用评价系统指标的批评,根据信用评价指标的不合理之处,提出具体指标设定,但这些指标过于复杂,不利于买家进行有效的信用评价,因此本论文从默认评价的角度分析当前信用评价系统,说明其有效性。(2)信用评价系统可以利用决策树模型进行改进。虽然当前信用评价系统是整体有效的,但仍存在改进的空间。利用SAS Enterprise Miner进行数据挖掘,使用决策树建模的方法提出买家进行默认评价的规则,通过决策树规则来预测买家进行默认评价可能性,淘宝卖家和C2C交易平台可以根据得出的可能性的大小来对买家评价进行预警,以提高主动评价的比例。(3)从关联规则的角度分析得出C2C交易信用评价系统是有效的。信用评价若有效则其对买家的购物决策有导向性作用。利用数据挖掘的关联规则得出买家总是购物于高信用度的卖家,因此信用评价系统是有效的。(4)基于信用评价系统的有效性,利用序列分析预测买家未来购物行为模式。因为信用评价系统有效,其有效性引导买家购物于高信用度的卖家,同时序列分析可以预测买家购物于卖家的顺序,从而为买家及淘宝网等提供一个预测结果,利用预测结果提高交易的成功率和效率。(5)分析信用评价的影响因素,以提高信用评价水平。这里分析了除传统因素外还有哪些因素会影响信用评价,分析得出价格及买家作为买家的信用是主要影响因素。本论文创新点主要有两个方面:一是信用评价研究内容的创新,二是使用的研究工具的创新。(1)内容创新。本论文是对电子商务交易信用评价系统的研究,尽管已经有众多论文关于信用评价,但总体来说,这些论文的研究是基于电子商务交易信用评价体系的指标的,是对各种评价指标的设定,主要是建立了一个更合理的指标评价体系。更合理的指标体系意味着更复杂的买家操作过程,其可操作性较差。这就可能成为阻碍电子商务交易的一大障碍。当前论文对于当前信用评价系统的有效性没有进行研究,实际上电子商务网站诸如淘宝网及易趣网等已经注意到评价体系的缺陷性,但如果设定复杂的信用评价指标,买家可能无所适从。不如在当前的信用体系的基础上进行改进。因此,本论文并没有对信用体系设定新的指标体系,而是对当前的信用评价系统进行研究,在已有信用评价的基础上提高信用评价系统的有效性,即研究默认评价的比重,预测买家的评价模式,提高主动评价的比例,这是一创新点。当前的研究主题主要是对电子商务的交易商品质量,卖家服务质量及商品运输情况进行研究,而没有对除去这些因素以外的其他因素进行研究。本论文研究了除去传统的能够影响信用等级评价的因素外,还有哪些因素会影响买家对卖家的信用评价,进而影响信用等级。这是一个创新的方面。(2)研究工具创新。本论文采用SAS Enterprise Miner(企业数据挖掘)工具进行数据挖掘,使用决策树,关联规则和序列分析来进行信用评价系统的有效性研究,同时使用SAS编程进行其他的统计分析以研究信用评价,具有创新性。数据挖掘在中国的发展仍处于开始阶段,随着各行各业的数据累积量的日益增多,数据挖掘的发展必然是一个趋势。而数据挖掘的最重要工具——SAS在中国的普及率并不高,需要有更多的利用SAS数据挖掘进行商务智能的研究。本论文就是利用SAS Enterprise Miner数据挖掘进行的创新性研究。虽然当前有一部分有关数据挖掘在电子商务中应用的研究,但研究的范围主要集中于对电子商务的智能推荐系统,而且使用的工具诸如sql等,并没有使用世界上公认的最强大的数据挖掘工具——SAS Enterprise Miner。因此,本论文的不仅从内容上有创新,而且从使用的数据分析和数据挖掘工具上也有创新。
其他文献
<正>家用清洁剂给人们带来了情节的便捷,但是殊不知,清洁剂本身带来的化学效应也会改变人们的健康状况。人们的肌肤和身心健康有可能正遭受这些化学用品潜移默化的侵害。特别
改革开放带来我国经济高速发展的同时,使居民收入水平进一步提高。经济的发展和各项体制的改革使人们更多的关注自己的财务状况,不再满足于传统的储蓄方式来增加财富,而迫切
风险投资(Venture Capital Investment)是指个人或机构通过一定方式筹集资本,以股权投资的方式将其投入具有高成长潜力的未上市的创业企业,并通过提供管理服务参与企业的经营
为了比较黄铁矿、钛铁矿、磁铁矿、钒钛磁铁矿、零价铁以及亚铁催化双氧水氧化处理T酸废母液的效能,研究了不同体系的催化氧化反应动力学以及p H值变化情况,考察了H2O2投加量
以行程时间、行程车速、断面客流量、乘客出行节省时间、公交专用道利用率等为效益指标,提出城市公交专用道产能效益计算方法。以福州市某公交专用道为例,应用仿真软件分别建
二肽基肽酶-4(DPP-4)抑制剂是治疗2型糖尿病的新靶点,强效和选择性DPP-4抑制剂已成为糖尿病治疗新药的开发热点。本文主要对已在国内上市的西格列汀、沙格列汀、维格列汀和利
随着油气资源勘探与开发的深入,对致密砂岩气藏的研究显得十分重要,同时其产能评价也成为一个难点,简单的利用测井曲线对气藏进行产能评价已不能准确评价气藏产能。利用自然
近年来小额保险在发展中国家出现,并且取得了一定的成效,实现了以低廉的保费服务中低收入人群,为其提供基本的生产生活保障。从某种意义上讲,小额保险的实施是一种扶贫措施,
伴随信息技术的快速发展,办公室信息工作从内容到形式都发生了很大变化。本文就此分析了当前办公室信息工作存在的一些问题,并提出了几点解决问题的办法,希望对相关工作者有
目前临床上用到的降糖药物种类众多,作用机制各异。本文依作用机制将降糖药物进行了分类,并对各类药物的作用机制和特点进行了简要介绍。对全球首个上市的胰高血糖素样肽-1(G