基于电子商务平台的数据分析系统

来源 :广东外语外贸大学 | 被引量 : 0次 | 上传用户:h563268898
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务的发展,数字营销市场也逐渐扩大,与传统零售业相比,数字营销的最大特点就是一切都可以通过数据化来进行监控和改进。通过监控数据的变化,能够有效地掌握店铺、商品、活动的营销情况。通过分析整体销售情况、用户画像、活动效果等,提炼出有价值的结论,用于辅助运营者更好的进行店铺运营,提高利润。因此,数据分析在电子商务和数字营销领域非常重要。对于需要进行数字营销工作的相关人员来说,包括客户部人员、策划人员、运营人员、设计师、数据分析师等,对数据的使用频率高且频次多。在这样的情况下,出现了无权限查询信息、不同平台需要登录多个账号、平台提供的第三方数据应用未能贴近业务以及未能根据业务进行定制和扩展等问题。针对以上情况,本文以天猫平台为对象,设计并实现了一个基于电商平台的数据分析系统。具体研究内容如下:(1)研究涉及本系统后台数据处理模块相关的技术,包括Selenium工具在动态网页爬虫中的应用;分词方法及分词系统;评论特征提取的方法。(2)介绍系统的需求分析及整体框架,并阐述了系统4大模块的内容:数据获取、数据处理、数据存储和数据呈现。同时介绍了系统前端的功能及页面设计、系统数据库的设计。系统前端是基于B/S架构的,并按照三层架构进行设计,包括数据访问层、业务逻辑层和用户表示层,采用Asp.net+C#实现;数据库采用Sql Server 2012构建;后台模块采用Python及Java实现。(3)结合Selenium工具,实现商品基本信息、素材信息和买家评论信息爬虫,覆盖PC端和Mobile端,Mobile端的爬取是在PC端上模拟进入Mobile端。(4)利用爬虫爬取平台上的品类/品牌/属性信息,以及通过Tamll对商品标题的分词信息,设计了评论领域专用词典构建方法。利用积累的评论,运用分词工具,对评论进行分词、词性标注、词频统计,通过人工归类的手段,构建了通用型的买家关注点模型。(5)实现了买家关注点识别的两种方法,词语匹配模型法和模型匹配评论法。词语匹配模型法的核心是对评论进行分词、标注、特征抽取后,利用抽取的词语与模型中的词语进行匹配及统计。模型匹配评论法的核心是不进行分词,直接利用模型中的词语,匹配评论中是否含有与该词语一致的字串,并进行统计。实验结果证明,在系统当前条件下,两种方法都能够适应跨类别评论的分析,而在算法表现是,模型匹配评论法的有效评论查全率和各个类别的匹配准确率要优于词语匹配模型法。
其他文献
文章分析了福建省危险废物的产生、利用、处置、分布等情况,指出了福建省危险废物管理存在问题,提出了建议开展重点行业危险废物专项调查,加强危险废物监管能力、加快危险废
中专虽然不是升学教育而是就业教育,但它的目标也是培养有理想、有道德、有文化、有纪律,适应社会主义现代化建设需要,身体健康,具有较强实际工作能力的应用型中等专业人才。因此中专生的素质是综合性的,包括:思想政治素质、职业道德素质、科学文化素质、心理素质、社会交际素质等。下面就上述几个方面的素质教育问题谈点粗浅的看法。    一、思想政治教育与职业道德素质教育    中专阶段是学生形成人生观、世界观的重
基于中国人体头部尺寸参数,采用非均一线性缩放方法对混合Ⅲ型(HybridⅢ)假人头部模型进行缩放获得了符合中国50百分位人体尺寸的假人头部模型。利用该模型建立头部标定试验仿
新闻是对于国家,社会,甚至是全世界在一定的时间内所发生的事情的一种总结与概括,对于普通民众以及各行各业的从业人员及时了解与自己相关的各种动态有着非常重要的作用。新
2006年初,教育部函告东华理工学院(原华东地质学院):学校被列为国控核类专业战略人才储备培养的11所高校之一。在核类专业的人才培养领域,东华理工学院正式跻身国家队。此前,学校还
3月12日,中核集团公司党组书记、总经理康日新和浙江省委常委、常务副省长陈敏尔一道考察了浙江龙游核电项目,对积极有效推进龙游核电项目前期各项工作,争取项目早日开工建设作
目前在小学语文教学中,“单元整合·群文阅读”是一项新的教学策略,主要是在突破传统教学模式的背景下,构建更利于学生进行学习的课堂,保证教学效率的提高。然而结合实际发现
<正>关节置换术是当前治疗严重关节功能障碍的主要手术方式,而关节置换术后的疼痛、肿胀、出血以及肌肉痉挛等术后早期并发症明显影响患者术后康复过程[1]。冷疗法是将低于人
10月13日,洪都航空工业集团公司为巴基斯坦生产的11架K8P飞机正式交付给巴国空军使用。此次交付的11架飞机是巴方采购的27架飞机中的最后一批。
针对批量式算法增量维护性能差的缺点,提出了一种贝叶斯增量学习算法(ILA)。检测到新数据集时,构造WTUN函数来判断结构是否需要更新,若结构需要更新,则构建影响度(Affect)函