基于熵加权子空间算法的旅游数据聚类分析

来源 :旅游研究 | 被引量 : 0次 | 上传用户:KurtJohns
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据背景下,高维旅游数据的急剧增长使得传统聚类算法效果欠佳,而熵加权子空间算法可有效地实现高维数据聚类,获取特征对不同类的影响,从而提升聚类效果。文章通过爬取同程网上的部分云南游记数据,获取有关云南旅游的游记信息;借助中文分词、关键词提取、词性识别等自然语言处理技术,并结合百度地图API游记信息,构建所需旅游数据矩阵;基于用户—关键词矩阵,采用熵加权子空间算法对旅游景点和作者进行聚类;综合考虑邓恩指数和轮廓系数两个内部指标,对聚类结果进行评价。评价结果表明:采用熵加权子空间算法对云南游记数据聚类时,其集
其他文献
文章疏理了旅游企业社会责任的相关研究,从利益相关者理论、资源基础理论和风险管理理论三个视角分别阐述旅游企业社会责任的价值创造效应。在对已有文献系统梳理和评价的基础上,构建旅游企业社会责任价值创造的整合性分析框架。该框架从中介机制和调节机制两个方面,进一步阐释了旅游企业社会责任价值实现的路径和边界机制,并从旅游者、企业员工、投资者以及地方居民四个层面探讨旅游企业社会责任的价值响应。
目的:了解常见外阴阴道炎与高级别宫颈上皮病变(CIN)的相关性。方法:选取2015年1月~2018年12月收治的237例高级别宫颈上皮内病变患者作为试验组,与同期随机选取的200例非宫颈病变患者作为对照组,回顾分析两组阴道分泌物pH值,清洁度和细菌性阴道病、外阴阴道假丝酵母菌病和滴虫性阴道炎发病情况。结果:试验组阴道分泌物pH值平均值高于对照组,分别为(5.48±0.33)和(5.16±0.33),清洁度Ⅲ度~Ⅳ度试验组明显高于对照组(比率分别73.83%和28.50%);试验组细菌性阴道病比率14.34
随着社会的快速发展,加强金融行为监管已成为国际监管的共同发展方向。《构建金融消费者保护的市场行为监管机制》一书通过对行业监管的核心概念、理论体系、国际检验和监管手段等的研究,以优化市场行为监管手段达到更好的保护金融消费者合法权益的目的。在内容的安排上该书共分为十二部分,通过阐述我国金融消费者保护行为监管的现状与问题,进一步提出如何有效运行行为监管手段。