AP聚类算法在商圈挖掘中的应用研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:liuchy2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
城市商圈是现实世界中经济网络的一种基本结构。通过挖掘城市中的商圈数据,扩展新的应用场景,可以使终端用户受益。用户在访问商圈后产生的基于位置的签到数据可以被用于挖掘商圈,并提供数据支持。然而,基于签到数据的商圈挖掘工作面临几方面的问题。(1)在传统的商圈挖掘模型和方法中,存在参数难以设置的问题;(2)标准AP聚类算法的计算复杂度较高且只能发现球形状商圈,不适合用于大规模数据聚类问题和挖掘商圈呈非球形状的情况。针对以上问题,为了有效地挖掘城市商圈,本文提出了改进的AP聚类商圈挖掘算法,主要研究内容如下:首先,提出并设计了基于签到数据的AP聚类商圈挖掘算法。将标准AP聚类算法引入城市商圈挖掘领域中,并通过利用位置签到数据中的签到量特征来合理地设置AP算法的偏向参数值,使得在聚类实施的信息更新过程中,增加了类代表点的约束条件。通过使用Yelp数据集为实验数据,对比标准的AP聚类算法以及贪心搜索算法,实验结果证明了所提出的算法的有效性。其次,提出并设计了改进的AP聚类商圈挖掘算法。首先通过分析标准AP聚类算法的信息传播过程,利用密度最大值聚类算法挖掘出潜在商圈中心,从而压缩了算法的输入相似度矩阵,进而提升了算法计算效率;然后对经过标准AP聚类算法处理而得到的初始商圈集合,分析其内部的距离属性,设计了与类内距离和类间距离相关的合并策略,提高了挖掘结果的准确性;最后使用Yelp数据集为实验数据,对比标准的AP聚类算法,所得实验结果证明了算法在基本保留全部信息的基础上,提升了算法执行效率。本研究具有重要的应用价值:(1)通过对标准AP聚类算法的改进,使其具有有效分析、处理数据的能力,为数据科学的发展提供了新的工具;(2)从给定的签到数据中挖掘出城市商圈的分布,可以为探测商圈内的热点、分析商圈的动态变化提供数据支持。
其他文献
总结接收83例院际转运危重症传染病患儿的护理。做好充分的转运设备准备和合适人员的配备;到达当地医院后护士先与家属沟通,签订转运知情同意书,详细评估患儿的病情,配合医生维持
目的了解我院抗抑郁和焦虑药物的使用状态及趋势。方法对我院抗抑郁和焦虑药物的购销、发放、盘点以及用药频度及日均费用等进行分析。结果抗抑郁、焦虑药物销售金额逐年上升
高职院校辅导员工作的课程化有利于增进辅导员工作的科学性和系统性,有助于辅导员提升工作的实效性和针对性,有助于辅导员的专业化和职业化提升。推进辅导员工作的课程化,需
在本文中,主要是研究一九七八年到二零零九年三种较为显著的农村经济结构变化对于农业能源利用效率影响进行全面分析,并且在此基础上提出下文内容,希望能够给与同行业工作的
本文介绍和分析房屋增层纠偏工程中的一些重要问题,结合我国国情说明重视并搞好旧房增层改造的意义;对房屋增层工程进行利弊分析,对选择增层的合理结构形式提出见解;对影响旧
本案反映了政府采购活动中出现的几个相关问题:一是采购人未在5个工作日之内在评审报告推荐的中标候选人中按顺序确定中标供应商。二是采购人不得要求评审委员会违法重新评审
国家最新颁布体质监测结果显示,我国人群体质健康相关指标进一步下降,主要表现为体型指标如身高、体重、胸围的逐渐增长与体能方面指标如爆发力、力量、耐力的逐年下降,人群
中医虽然没有血脂异常这一概念,但有关此症的论述在古医籍中已有记载。《内经素问·通评虚实论篇》云;“凡治消瘅、仆击、偏枯、痿厥、气满发逆,肥贵人则高梁之疾也”。随着
【目的】明确磷肥用量对甜荞根系形态、产量形成和籽粒品质的影响。【方法】以甜荞品种丰甜1号为试验材料,设置不施磷(CK,0 kg·hm^-2)、低磷(LP,35 kg·hm^-2)、中
<正>政府性基金预算收入是我国财政收入的重要组成部分。2018年,全国政府性基金预算收入是75405亿元,占一般公共预算收入、基金预算收入和国资预算收入之和的比重达到28.82%