基于Web日志挖掘的铁路客户行为分析模型与算法的研究

来源 :首都师范大学 | 被引量 : 3次 | 上传用户:yang97yang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
铁路网上售票系统的上线运行,在其后台数据库中堆积了大量的客户信息,这些信息中蕴含着客户的行为模式和偏好的潜在信息。如何从这些数据中发现用户的使用偏好等行为信息,对铁路客运部门的运营决策具有重要的实际价值。本论文以铁路网上售票系统的web日志和客票数据库为分析基础,采用聚类分析、人工神经网络等为建模方法,对铁路客户的行为、网上售票量预测等问题进行了研究。本论文的主要工作如下:1.构建了基于客户特征、购票行为和使用偏好三个维度的铁路客户行为分析指标体系。该指标体系以姓名、年龄、旅客类型、所在地、购买时间、购买次数、页面访问次数、页面停留时间、页面操作、操作返回状态为二级分析指标,并结合铁路电子商务的实际需求,给出了具体指标的定义及相应的度量方法。2.提出了基于客户偏好和SOMKmeans混合算法的铁路客户群聚类模型。该模型以web日志数据为分析基础,结合相关指标的定义和度量,来建立铁路客户在网上售票系统中的使用偏好矩阵,以用户的使用偏好作为细分依据来实现铁路客户群的分析。3.提出了基于改进的BP神经网络的铁路网络售票量预测模型。该模型采以不同客户特征的客户数量和节假日影响度为影响因子,结合铁路网上售票系统客户交易成交量的季节性变化趋势,对铁路网上售票量进行预测。4.设计并实现了铁路客户行为分析系统原型。基于以上模型及算法,采用VC++和SQLServer2005为开发环境,实现了铁路客户行为分析的系统原型,验证了上述模型的有效性和可用性。本论文的研究结果为铁路客运部门了解分析客户行为、预测未来网上售票系统的售票量提供一定的参考。
其他文献
建立一种简单的重组质粒构建方法——二步PCR,不需要限制性内切酶对基因和载体进行酶切.第一步常规PCR中,用正向引物(IF)和反向杂合引物(IR)扩增黑曲霉木聚糖酶Xyn基因,IF与
我国的江河湖库水体污染主要包括氮、磷等营养物和有机物污染两方面。目前国际上采用的技术主要有物理方法、化学方法和生物—生态方法。本文从外源和内源两方面对目前国内外
<正>构建食品药品安全社会共治格局是新时期构建和谐社会的重大战略举措。当前,食品药品社会共治还存在一些问题:企业诚信缺失,责任感不强,从业人员素质较低;政府对监管部门
人类田野调查的特征主要有长期性、参与性和深入性。人类学田野调查通常有四大原则:客观性原则、科学性原则、系统性原则和尊重性原则。从不同的角度划分,田野调查可分为多种
分析了大气污染源、评价等级范围的确定,环境空气质量现状评价,施工期环境影响评价要点,营运期环境影响预测内容、方法及预测结果;探讨了生活垃圾焚烧厂烟气治理措施和可行性
每一个制造工艺都必须具有工艺可靠性能。纵观整个工艺的全部过程,工艺产品的可靠性能首先是由产品的设计开始制作的,产品的整个核心就是工艺的可靠性,每一个产品都是要依靠
为提高高铁服务质量,从而获得更多的客流,将列车运营服务质量、列车响应性服务质量、车站服务质量作为外生潜在变量,再搭乘意愿作为内生潜在变量,构建结构方程模型,探讨高铁
<正> 当前,我国粮食和经济作物的生产增长同需要增长之间的矛盾都很尖锐。在这种情况下,如何做到粮食和经济作物都能增产,既不象过去那样片面强调粮食种植挤了一部分经济作物
非物质文化遗产保护是我国建设社会主义和谐文化的基础工作,政府在其中处于主导地位。通过法律明确政府的职权职责是必要的,但规范政府的行为过程,加强对政府行为的法律监督,