基于云计算的海量旅行数据分析

来源 :北京邮电大学 | 被引量 : 12次 | 上传用户:q7okl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着旅游业与交通的迅速发展,旅行信息爆炸性的增长,旅行数据已经形成一个巨大的海量信息空间。如何快速、准确、方便地对日常所积累的反映旅客信息的海量旅行数据进行客户关系分析,对于分析旅游市场经营状况、预测旅游业对相关行业影响、调整旅游业宏观政策具有极其重大的意义。本论文针对海量旅行数据的挖掘分析开展了研究工作。主要工作包括:1)提出了一种基于约束关联规则的旅行数据并行挖掘算法。该算法可解决由于海量旅行数据频繁项目集较长,导致现有数据挖掘分析方法难以应用的问题。算法可根据旅行数据主要特点来很好地组织和挖掘各种旅行数据,并可针对某一特定地域、某一特定人群或某一特定需求提供更有价值的信息。2)为应对旅行数据客户关系网络大规模和动态的特点,提出了一个基于动态链接的可视化分析框架(作者参与部分核心功能的设计与实现)。框架实现了高效的网络分析算法,主要包括:大规模网络的统计分析,网络中节点重要性打分与作用分析,网络中社团的发现与展示,大规模网络的可视化展示等,从而可更有效地分析海量旅行数据中人物关系。3)在1)2)的基础上,实现了一个基于云计算技术的海量旅行数据分析系统。该系统基于Hadoop平台,集成了针对旅行数据的关联规则并行挖掘算法,提供了基于动态链接的可视化分析框架,可为用户提供对海量旅行数据更加有效的分析。该系统面向实际应用,可支持从数据预处理、数据管理、数据挖掘到最终决策支持的全部处理流程。论文还采用了海量真实旅行数据,验证了系统及所提供方法的高效性和有效性。
其他文献
随着计算机网络得到广泛的普及和发展,网络技术在为人们提供了方便的同时,黑客入侵也不断出现,信息安全事件频频发生,计算机信息安全越来越成为各个国家防止大规模计算机安全事件
在计算机芯片飞速发展的同时,计算机软件性能成为计算机系统的重要短板,在计算机科学进入多核/众核时代之后,随着片上并行度和复杂度的增加,这一问题变得更加严峻,如何将芯片潜力
全过程计算机辅助动画自动生成技术(简称动画自动生成技术)是一个将计算机动画与人工智能结合而产生的研究领域。将它应用到手机短信领域,完成中文短信到3D动画的全过程转化,
PDCP协议(Packet Data Convergence Protocol)是LTE无线接口协议栈中的主要组成部分之一,围绕PDCP的主要功能,本文对LTE PDCP协议中的关键技术进行了研究分析和实现,其中具体包括:P
在信息爆炸的时代,数据间的关系和数据的规律常常隐藏于纷繁芜杂的数据海洋中。近年来,与日激增的社会网络数据更是成为现代社会学研究中的研究热点。与此同时,相关科研团队
生产实践中存在很多难以优化的约束优化问题,智能进化算法与传统约束处理方法相结合成为解决这类问题的有效方法。拟态物理学优化算法是一种最近提出的启发式算法。矢量拟态
随着经济全球化的日益加快,以客户为中心的业务创新和差异化竞争逐渐成为企业战略的主旋律,企业为了保持持续的竞争力,一直不断努力的开展各种方式的业务创新,企业信息化建设
在计算机技术和信息技术的高速发展的当代,计算机通讯网络以惊人的速度拓展,将世界的各个角落连成一个地球村信息网。随着高新技术的发展,实验室的测试技术、设备与数据应用也得
EAST是中科院等离子体物理研究所自行研制的世界首个全超导非圆截面托卡马克实验装置,目前已经进行了6轮核聚变放电实验。随着EAST实验的不断深入,实验正在由过去几秒钟的短
随着计算机与网络通信技术的高速发展,在开放的网络平台中部署企业级的网络应用也越来越多,网络与信息安全成为了网络技术研究的重点。针对网络安全技术体系,国际化标准组织