基于双聚类方法的旅游数据挖掘与研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:Empty0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双聚类算法(Biclustering Algorithm)于2000年被Cheng和Church提出后,在基因表达数据分析领域已有较为成熟的发展,但在其他领域的应用仍有待发掘,尤其在旅游大数据领域还未有应用。旅游大数据近年来作为热门话题,多被用于预测出行高峰期,旅游景点接客数量等。随着人们生活水平的提高,对旅游质量的要求越来越高,自由行、个性化旅游成为更多人的选择。因此对游客进行分类,针对不同类型的游客制定个性化旅游线路及服务,是非常有意义的课题。本论文将双聚类算法应用于旅游大数据研究,由此得到用户聚类结果,可以发掘潜在游客,也可针对不同用户制定个性化旅游路线,同时也能对旅游景点的热度进行预测。本论文采用python对旅游网站的用户数据进行采集,采集到的内容用Excel进行清洗,然后用ICTCLAS中文分词系统进行分词,并用TF-IDF算法提取高频关键词,同时对这些高频词进行词频统计。将出现频率较高的词作为变量,用户作为对象,建立用户-关键词矩阵。之后,再对建立的矩阵用双聚类算法进行聚类。通过对不同的聚类算法进行比较,找出了适合该高维旅游数据的算法。数据分析结果表明,双聚类算法对挖据到的游客数据有较好的聚类效果。
其他文献
本文分别研究了 Camassa-Holm方程与Degasperis-Procesi方程相互作用系统和推广的高阶非线性交叉耦合Camassa-Holm系统Cauchy问题解的持久性和最佳衰减性.持久性是指,当初值
纤维增强复合(Fiber Reinforced polymer,简称FRP)筋具有良好的耐腐蚀性能,作为一种新型钢筋替代材料在土木工程领域中将得到广泛的应用。将FRP筋替代部分钢筋应用到混凝土结构中,不仅可以减轻结构的自重还可以提高混凝土结构的耐久性能。由于FRP筋在实际工程中的应用时间较短,对其在服役期内的长期力学性能研究还缺乏足够的数据分析,这在一定程度上限制了FRP筋的应用与推广。近年来随着
含镁硅酸盐矿物是硫化铜镍矿中常见的脉石矿物,部分含镁硅酸盐矿物零电点较高、质软、易泥化,在硫化矿浮选常用的弱碱性pH区间,这些含镁硅酸盐矿物表面荷正电,而硫化矿物表面荷负电,亲水的含镁硅酸盐矿泥通过静电作用罩盖在硫化矿物表面,降低了硫化矿物的表面疏水性。本论文针对含镁硅酸盐对硫化矿可浮性抑制现象,采用新型纳米颗粒作为混合硫化矿捕收剂,利用纳米颗粒对硫化矿的选择吸附性和强疏水性,强化硫化矿可浮性。研
随着建筑产业对全球环境带来的影响越来越大,建筑的节能减排已刻不容缓。本文利用全生命周期评价理论(LCA)分别对现浇建筑及预制装配式建筑进行碳排放分析。通过基于投入-产
目的本文通过免疫组化技术联合检测孕激素受体(PR)、CD146、PTEN及P53在子宫内膜样腺癌中的表达情况,分析这些蛋白与临床及病理特征的关系,并进一步探讨PR阴性子宫内膜样腺癌中各蛋白联合检测的意义。方法收集2014年1月至2018年3月在长江大学附属第一医院接受手术治疗,术后由病理科专家确诊为子宫内膜样腺癌的病理组织共96例。同时确保患者术前未行放疗、化疗及内分泌等特殊治疗。采用Envisi
多酸(多金属氧酸盐,POMs)是由氧与过渡金属原子连接而形成的一类含氧多酸盐,其中Keggin型多酸因为其丰富的结构和优异的性质成为材料科学和光电催化领域的研究热点。作为一种光氧化还原反应的催化剂,实验上合成了各类新型的Keggin型多酸衍生物,这些多酸氧化还原的性能需要进一步理论研究。本论文使用密度泛函理论(DFT)方法主要探究了双取代与单缺位Keggin型多酸的电子结构和氧化还原性质。本文第三
硫元素自然界中广泛存在的元素之一。近年含有π共轭分子材料体系成为有机合成领域的热点,含有硫元素的π共轭分子及衍生物是一类重要的材料体系。这类材料主要为双键和苯环
细水雾灭火剂因其具有清洁高效,廉价易得,对环境友好的特点,在消防灭火技术中应用广泛。但细水雾释放初期的火焰强化在一定程度上影响了细水雾灭火技术的安全适用性,因此寻找
滤泥是制糖生产的一项大宗产物,由于含水量高,不便于运输、保存和使用等弊端,成为环境的负担。然而,滤泥是很好的生物质资源,具有良好的综合利用前景。开发滤泥的综合利用对
曲面偏微分方程被定义在嵌入三维区域的微分流形上,在许多领域有着广泛的实际应用价值,例如,在材料科学,流体力学,生物学以及地理科学等领域.对流扩散方程作为一类基本的偏微分方程,自然地被用在了曲面数理模型的建立中.曲面对流扩散方程继承了平面对流扩散问题的求解困难,即当对流现象明显强于扩散现象时,用标准的有限元方法、有限差分方法和有限体积方法会产生非物理震荡,甚至影响数值解的全貌,尤其是在解的非光滑区域