基于社交媒体数据的个体活动语义识别

来源 :北京建筑大学 | 被引量 : 0次 | 上传用户:RTTR123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网和多功能移动设备的普及对于移动对象数据的获取提供了更多的方案,数据类型和数据量都更加丰富。社交媒体数据从多个角度记录了个体在真实世界的活动行为和移动轨迹,并且随着传感器精度的提高,数据也更加真实权威。基于位置的社交网络服务平台微博、微信、Four Square、Twitter等,每天有许多用户在这些平台分享动态,包含了时间、位置和其他以图片、视频、文本形式存在的信息。这些信息直接或间接的体现了个体的活动行为。而个体活动城市交通出行、公共服务、基础设施等密切相关,个体活动行为的识别对构建用户画像、精准推荐、定制服务、群体移动性分析具有重要价值,还可以为城市规划和城市建设提供决策支持。本文通过社交媒体签到数据来对个体进行活动语义识别,个体签到时的时间信息、空间信息和文本信息,刻画了个体的活动行为。当前研究在个体活动语义识别主要集中于时间特征和空间特征的探究,缺乏文本中语义信息的挖掘。针对这些问题,本文提出了一种多特征融合的个体活动语义识别算法,在时间特征和空间经纬度特征外,从群体偏好和个体偏好的角度进一步挖掘了空间活动偏好特征和签到地点名称中的文本语义特征。本文具体研究内容包括:1.社交媒体签到数据的时空特征提取。分别从时间信息、空间信息中提取活动相关的特征,对于时间信息中所包含的活动行为周期性和序列性信息使用季节、月份、日、星期、工作日和时刻信息来描述。空间信息则挖掘空间活动偏好特征,对于空间位置中的热点访问区域,通过空间偏好量化算法进行量化,将这种被视觉或者知觉所感知的特征使用数值表达出来,从数量关系中来体现活动行为的空间偏好。2.社交媒体签到数据的文本语义特征提取。签到地点名称和场所属性密切相关,场所属性和个体活动行为相关。本文从签到地点名称中挖掘文本语义信息,使用双向深度自注意力网络模型进行签到点名称的文本语义提取,将文本中潜藏的活动语义信息使用向量表征,完成词的语义向量转换。3.个体活动语义识别模型分类器的构建。本文分别对比了极限梯度提升模型、支持向量机、随机森林模型和K-最近邻算法对多特征融合特征向量的分类识别能力,选择出了最优的分类器。本文提出的多特征融合个体活动语义识别方法,对于个体活动语义识别的精度达到了87.6%,各实验证明了本文所提取特征的有效性,与相关算法的对比中,本文算法性能也有更好的表现。
其他文献
京津冀地区是我国发生局地特强降雨的相对多发区,同时也是水资源严重短缺的地区,为缓解水资源短缺及其他城市水问题,需要加强雨水的收集利用。然而气候变化对降雨量带来很大的影响,会导致未来降雨的时空分布以及各种规律特征都发生巨大变化,对未来雨水收集能力产生不确定性影响,仅使用历史数据来确定雨水收集设施的规模,可能在未来难以达到预期效果,因此需要参考未来降雨变化的预估结果探求雨水收集能力的变化与不确定性。本
原子分解作为研究鞅空间理论的重要手段,由于其在处理问题时的简捷和有效,近年来一直备受关注.本文以原子分解作为工具来研究弱型和强型二进制变指数鞅空间和B值弱型拟鞅空间上的性质及其应用.本文首先对弱型和强型二进制变指数鞅空间的研究.建立弱型和强型二进制变指数鞅空间的原子分解定理,并利用原子分解的方法,证明次线性算子T从wHp(·)σ到wLp(·)有界;Cesaro算子从Hp(·)M到Lp(·)有界以及
开发海洋油气的过程中,对双相不锈钢制备的开采设备的耐高温能力和在腐蚀环境恶劣的情况下的耐腐蚀性能的要求越来越高。本论文采用不同含量的稀土La和Cu来处理试验钢(S32205双相不锈钢),经过热处理后进行了浸泡腐蚀实验和动电位阳极极化实验,并采用扫描电镜(SEM)与扫描电镜能谱(EDS)、透射电子显微镜(TEM)与透射电镜能谱(EDS)相结合的试验方法对双相不锈钢中夹杂物以及夹杂物与钢基体的交界处进
本研究针对自动驾驶和机器人领域中,汽车或机器人对大场景中小目标的高效和精确感知问题展开研究,在分析和总结现有方法的基础上,基于Point-Voxel CNN网络,研究点云相关性优化方法,提出一种新的三维特征提取网络PVSCNN(Point-Voxel Submanifold Sparse Convolution),使用子流稀疏卷积实现高效和深层地提取局部信息,以提高场景点云之间的相关性,从而达到提
随着交通行业覆盖领域不断扩展,安全生产事故内容日益复杂,而交通行业安全生产事故数据多以文本的形式存储,价值量高但价值密度低,单靠传统运动式、人工式的监管方式,很难实现风险的预见和防范。如何通过信息化技术有效的管理文本类的交通行业安全生产事故数据,对交通行业安全生产事故进行科学的分析,成为目前研究领域内的热点问题。针对以上问题,本文设计并实现了一种基于词向量的文本数据处理方法,通过关键词分类及知识抽
随着物质的极大丰富,社会科技进入高速发展时代,人们的生活水平也在不断提高,促使人工智能的相关领域研究飞速前进。机器人已经进入到我们生活中的各个领域,在室外,机器人可以代替人类进入危险、狭小等人类难以到达的位置进行搜救、探查等专业工作;在室内,机器人的普及,为人类生活的提供了方便,机器人可以实现货物搬运、医疗护理、大型区域指引等功能。但是,随着机器人技术的不断发展,机器人所工作的环境也变得越来越复杂
地震作为主要自然灾害之一,造成了大量人员伤亡及财产损失。我国是地震多发的国家,在2008年汶川大地震及之后的玉树地震中均出现了大量梁式桥的倒塌与破坏,有关此类桥梁抗震能力的提升得到关注。隔震技术从上世纪60年代起逐步应用于工程并已发展为减震控制领域最成熟的技术手段之一,其原理是在桥梁的上、下部结构中间设置隔震装置以提高桥梁结构的抗震能力。其中,叠层钢板橡胶支座、铅芯橡胶支座等因其成熟的制作工艺、稳
将三维建筑绕流简化为二维圆/方柱绕流,不考虑端部效应,研究二维建筑流场尾流涡街及颗粒运动情形。通过大涡模拟(Large Eddy Simulation,LES)方法对雷诺数(Reynolds number,Re数)在100至700范围内的顺排多柱体形成的分离漩涡结构以及颗粒的流动、分布和沉积进行了模拟和计算。以三维方腔充分发展层流速度解析解,求解并定义二维方腔充分发展层流入口速度自定义函数(Use
传统的园林绿地管理中,获取数据信息是缓慢的,发现问题时又不能及时解决,为了实现精细化管理,引入物联网技术,故在园林绿地中埋入大量的传感器设备以采集相关数据,这让园林绿地中产生的数据呈爆发式增长,从数据中获取信息的速度发生质的改变,大量的数据往往数据类型不一,且人们以数据为基础,根据使用目的构建了不同平台或系统来对数据进行操作,获取所需要的信息。这些不同的数据类型和系统,根据使用目的不同或因各操作人