【摘 要】
:
伴随着GPS全球定位系统、传感器设备、可穿戴移动设备等在日常生活中的普遍应用,人们获得了大量移动对象的轨迹数据。此外,新浪微博、微信、Foursquare、Twitter、Instagram等社交网络的兴起给用户提供了互相交流和分享经验的平台,并因此产生了大量的社交网络数据。连接跨时空数据库和社交网络的用户能够获得更加丰富的数据,基于此构建的用户画像可以为诸多实际应用提供数据支撑。具体来讲,本文的
论文部分内容阅读
伴随着GPS全球定位系统、传感器设备、可穿戴移动设备等在日常生活中的普遍应用,人们获得了大量移动对象的轨迹数据。此外,新浪微博、微信、Foursquare、Twitter、Instagram等社交网络的兴起给用户提供了互相交流和分享经验的平台,并因此产生了大量的社交网络数据。连接跨时空数据库和社交网络的用户能够获得更加丰富的数据,基于此构建的用户画像可以为诸多实际应用提供数据支撑。具体来讲,本文的研究内容主要包括以下三个部分。(1)基于聚类的跨平台用户连接。要实现跨平台的用户连接首先需要提取用户的特征,并基于此计算用户之间的相似度。相较于直接比较两个用户的历史记录,聚类是一种更加有效的方式。在空间领域,可以使用聚类算法DP找到用户的停驻区域分布。在时间领域,可以使用高斯混合模型找到用户的时间分布。此外,为了进一步提高连接准确度,本文基于TF-IDF思想为所提取特征赋予了相应的权值。突出用户区别度高的特征,并弱化区别度低的特征。基于真实数据集的大量实验表明本文所提算法的连接准确度明显好于已有的同类算法。(2)数据稀疏情况下的用户连接。基于聚类的方法有一个必要的前提是提供的数据集是高密度的。然而,在现实生活中虽然轨迹数据是高密度的,但社交网络数据通常是稀疏的、不对称的。因为许多用户会同时活跃在多个不同的社交平台上,而且出于安全考虑,用户在分享和转发状态时经常不提供位置数据。在这种情况下,很难提取用户的停驻区域以计算任意两个用户之间的相似度。为了解决该问题,可以使用高斯核密度估计直接计算两个用户之间的相似度。但是,基于高斯核的算法效率很低。因为在计算相似度的过程中需要针对每个单独的点计算它和另一个数据集所有点的相似度。为了提高效率,可以将空间领域划分成网格,将时间划分成片段,并计算用户在相应网格和时间段的概率。此外,可以基于任意熵计算网格和时间段的权值以更加精确地计算用户之间的相似度,来极大地提高连接的准确度。实验结果表明,综合考虑网格、时间段和权值的算法能同时保证连接效率和准确度。(3)用户画像的构建及应用。完成用户连接以后,单一用户的数据将变得更加丰富。基于此可以为用户构建更加完整的画像。具体过程包括:基于网格使用DP算法提取用户的停驻区域分布;基于历史轨迹分析用户在区域间的转移概率和路径;基于历史数据的时间信息计算用户在停驻区域的时间分布;基于LDA模型分析用户在停驻区域上的主题分布。根据该画像,并使用真实数据集,可以研究用户画像在位置预测、时间预测、主题预测和路径预测方面的应用性。实验结果表明,该画像在行为预测方面能获得良好的性能。最后,本文对上述研究内容进行了总结,并对其中可以拓展的内容进行了展望,也提出了相应的解决方案。
其他文献
细胞信号通路在细胞内部构成了一个庞大的网络,其维持着细胞的生存和代谢,控制着细胞体的“生老病死”,因此了解细胞信号的传递机制能够帮助人们探索生命运行的奥秘。细胞信号包括很多方面,其中细胞信号的强度和持续的时间对细胞功能的发挥起重要作用。胰岛素信号通路作为细胞信号网络中的重要组成部分,其调节机制错综复杂。胰岛素诱导的胰岛素受体底物1(insulin receptor substrate 1,IRS1
第一部分突变p53通过Egr-1/p300介导电离辐射诱导Cathepsin L表达目的:阐明p53基因突变对电离辐射诱导Cathepsin L的意义,研究Egr-1/p300与突变p53之间的关系,证实在电离辐射作用下Egr-1/p300是突变p53上调Cathepsin L的重要靶点,阐明Cathepsin L是突变p53功能获得的重要参与者。方法:Western blot检测10 Gy电离辐
RMP(RPB5 Mediating Protein)是RNA聚合酶II第五个亚基RPB5的结合蛋白,目前研究发现其介导了多种肿瘤的发生发展,本研究将分为三个部分探讨RMP在肿瘤发生中的功能及其分子机制。上皮间质转化(EMT)是指上皮细胞获得间质细胞所具有高转移和高侵润性,这一过程在生物体的发育以及肿瘤细胞的转移过程中发挥重要的作用。虽说目前已有很多研究报道了上皮间质转化与肿瘤转移的关系,但其具体
目的:低氧相关的代谢重编程具有调节免疫细胞和非免疫细胞生物学功能的作用,继而影响免疫应答的类型和强度。树突状细胞(Dendritic cells,DC)作为连接固有免疫和适应性免疫的桥梁,对炎症的发生、发展甚至转归起着至关重要的作用。DC的调控作用不仅体现在抗原提呈作用,还可引发针对T细胞的抑制效应,比如通过吲哚胺2,3-双加氧酶(Indoelamine 2,3-dioxygenase,IDO)负
Elongator是一个多亚基复合物,包含有六个亚基,其中Elp3为核心亚基。Elongator具有多种功能,与多种细胞活动相关。本研究将分为两个部分探讨Elongator在肝癌细胞中的功能及其分子机制。第一部分为Elongator对肝癌细胞迁移和侵袭的影响及其机制研究。本研究中,我们发现Elongator可以促进肝癌细胞的迁移和侵袭。根据我们的实验结果,Elongator可以通过磷酸化AKT激活
双辊连铸连轧工艺是生产金属薄板的前沿技术。原理上,双辊连铸连轧与近年发展起来的薄板坯连铸连轧(Flexible Thin Slab Rolling,FTSR)、紧凑式带钢生产(Compact Strip Production,CSP)和在线带钢生产(Inline Strip Production,ISP)等技术有着较大的区别。课题组在调查研究的基础上,以铅带双辊连铸连轧生产线为课题进行了成功研发,
随着互联网的快速发展,网络入侵的类型和发生率正在迅速增加。在此基础上,本文尝试分析传统算法和以人工技术特征为基础的机器学习算法特征、指标变化情况,结果表明:(1)通过使用基于人工智能的Sparktool工具进行机器学习算法和传统算法优化调节后,数据安全精准性、精度、TPR、TNR和F测量效率精度均显著提升;(2)相较于传统算法,人工智能机器学习算法执行时间低,互联网数据分类管理优质,入侵式防治效果
地域性是特定区域在发展演变过程中生活方式、文化背景、自然条件等元素的抽象反映,可分为自然地域特色和社会地域特色。城市广场是城市中重要的公共空间,肩负着传播区域文化、提供休闲娱乐空间等责任。将地域特色融入城市广场设计中,有助于增强市民的地域认同感,赋予城市广场更加浓厚的地方韵味。因此,应当重视地域特色在城市广场设计中的体现与运用,促使地域属性在城市广场这一特定载体中得以体现。
第一部分中线枕下经小脑延髓裂锁孔入路的内镜解剖学研究目的应用神经导航系统量化评价中线枕下经小脑延髓裂锁孔入路下第四脑室及脑干侧方的内镜解剖,探讨其可行性和手术适应症。方法福尔马林固定的成人尸头标本8具,模拟中线枕下经小脑延髓裂锁孔入路,分别导入0°和30°内镜观察第四脑室及脑干侧方的解剖结构。使用导航系统测量内镜下暴露的第四脑室底面积,内镜下最大暴露范围,分别测量第四脑室底长度、寰椎后弓中点到达导
第一部分基于磁共振成像的侧脑室三种手术入路的对比研究背景与目的侧脑室三角区的手术入路种类多样,各有利弊,迄今尚无达成共识的标准术式。本研究从微创理念出发,拟设计并验证小脑上经天幕-侧副沟显露侧脑室三角区的微创手术入路。本部分基于磁共振成像技术,模拟规划三种侧脑室手术入路并进行对比研究,探讨其各自优缺点。方法选择身体健康成人志愿者10名,行头颅磁共振薄层扫描,构建人脑三维(3D)数字模型。以模型侧脑