【摘 要】
:
伴随着全国各地志愿服务活动的蓬勃发展,越来越多的个人和团体投身于公益志愿服务领域中来,与此同时也积累了海量的志愿服务大数据。从2008年全国志愿服务信息系统启用开始,截止至2019年2月底已经在全国31个省级行政区中累积了超过1.2亿志愿者、73万志愿团体和232万志愿项目的海量数据。在大数据和人工智能相关技术快速发展的背景下,如何将志愿服务大数据通过机器学习相关算法进行分析挖掘,并且反哺助力志愿
论文部分内容阅读
伴随着全国各地志愿服务活动的蓬勃发展,越来越多的个人和团体投身于公益志愿服务领域中来,与此同时也积累了海量的志愿服务大数据。从2008年全国志愿服务信息系统启用开始,截止至2019年2月底已经在全国31个省级行政区中累积了超过1.2亿志愿者、73万志愿团体和232万志愿项目的海量数据。在大数据和人工智能相关技术快速发展的背景下,如何将志愿服务大数据通过机器学习相关算法进行分析挖掘,并且反哺助力志愿服务活动的后续发展,成为了亟需解决的问题。同时随着智慧城市的快速发展,志愿服务的分析研究结果也对城市中的征信、风控和社会服务等问题存在重要指导作用。例如在城市的冬奥会、企业家论坛等重大活动的志愿者招募中,志愿者诚信度等指标会帮助主办方进行候选人筛选。并且在海量数据纷繁复杂的情况下,当下的志愿服务领域缺乏可视化的管理平台,从而无法对志愿服务的发展现状做直观清晰的展示。本文将通过志愿者诚信度的评分模型构建志愿城市信用与风控体系,从志愿团队和志愿项目的角度去挖掘城市志愿场景,进而构建志愿城市的活跃度模型,同时搭建志愿者和志愿城市的大数据可视化平台,帮助政府的管理者进行志愿服务信息的管理和分析。论文的主要工作内容包括如下三个部分:一、构建志愿者的诚信度评分体系,首先针对志愿者数据集的诚信度影响因子,进行清洗处理和特征工程。根据逻辑回归算法和分箱算法建立评分卡模型,利用线性函数的转化将评分模型输出的结果标准化至[0,300]区间,并通过信息值判断各个影响因子与预测结果的关联性大小。对评分卡模型的结果指标进行评估,AUC(Area Under Curve)面积达到0.9651,KS值达到0.8521,准确度和划分能力符合预期。然后通过神经网络和后向传播梯度下降的算法,设计一个多层的神经网络模型,并利用交叉熵作为损失函数建立志愿者诚信分类模型。最后针对模型结果指标进行对比,对于准确率指标而言,评分卡模型和神经网络模型的结果分别是0.8995和0.6667;对于精准率指标而言,这两种模型分别是0.9195和0.7253;对于召回率指标而言,这两种模型分别是0.9159和0.7336。评分卡模型的结果均优于神经网络模型的结果。二、基于城市志愿服务信息数据,进行志愿城市的场景挖掘,其中包括志愿团体和志愿项目的场景研究以及志愿城市活跃度的分析。首先针对城市中的志愿团体,采用层次聚类的方法对min-max归一化后的影响因子进行聚类分析,轮廓系数达到0.9655,从而得到城市中12种不同属性的志愿团体。然后针对城市中的志愿项目,利用高德地图的逆地理编码进行兴趣点信息挖掘。将城市中的志愿项目进行时间域分析和空间域分析,得到时空维度上城市志愿项目的分布情况。随后对志愿项目的进行归一化,并对转化后的数据进行聚类。最后利用层次分析法构建志愿城市的活跃度模型,并得出城市活跃度和常住人口数之间的关系。三、基于志愿者诚信度和志愿城市服务场景的研究结果,搭建志愿者诚信度可视化平台和志愿城市服务可视化平台。利用SpringMVC的系统处理框架,构建可视化平台的业务逻辑处理系统,并通过MyBatis的持久层框架与服务器上的MySQL数据库进行连接,完成志愿服务相关数据的增删改查。同时利用Bootstrap的前端应用服务架构和异步动态页面刷新等技术,搭建平台的Web页面展示业务处理得到的可视化模型和视图。最终针对两个可视化平台进行完整的功能测试,从而得到通过测试用例的平台。
其他文献
随着第五代通信技术的普及和互联网业务不断增多,网络虚拟化将在最新的互联网体系架构构建中起着更加重要的作用。网络虚拟化技术的作用是可以在同一个物理网络中承载多个虚拟网络架构或者应用,从而将多种定制化的端到端服务提供给网络用户。实现网络虚拟化的主要途径是虚拟网络映射技术,它借助虚拟网络映射算法在物理网络中根据虚拟网络的节点和链路各自资源需求进行合理的资源分配。随着人工智能的不断发展,越来越多的虚拟网络
与传统网络不同,软件定义网络将控制与转发功能分离。控制器是控制平面的核心设备,主要负责路由的决策。交换机是数据平面的重要组成部分,主要负责数据的转发。目前控制平面的体系架构分为单控制器架构和分布式多控制器架构。与单控制器架构相比,分布式多控制器架构有效地提升了网络的服务质量,但也带来了一些问题。例如,在分布式多控制器架构中,控制器的数量和放置位置会影响整个网络的性能,因此如何合理地放置控制器成为了
互联网技术在不断更新迭代,中心化系统已不满足当前日益增长的数据需求,因此分布式存储网络系统应运而生,然而关于分布式存储网络系统的实现还存在着诸多问题,如数据存储备份多,数据信息传输安全性低,数据传输记录易被篡改,缺乏数据细粒度访问控制。其中安全性问题是阻碍系统被大规模应用的主要原因之一。针对以上问题,本文从安全性、可靠性、实用性三个方面着手,基于Ethereum和IPFS加密算法,对分布式存储网络
网络在当今高度连接的世界中发挥着重要作用,Internet接入网及骨干网容量的提升,带来了传统广域网市场的变革,对云服务的巨大需求意味着对广域网连接、安全性和带宽的巨大需求。传统的网络体系结构不适合满足现代数据中心和运营商基于云的服务要求。作为一种新兴的网络架构范例,软件定义网络(Software Defined Network,SDN)正在改善网络的可扩展性和灵活性。软件定义广域网是将软件定义网
近年来,时间敏感网络(TSN)技术作为新一代以太网技术,因其符合标准的以太网架构,拥有精准的流量调度能力,兼具技术及成本优势,可以保证多种业务流量的共网高质量传输。其在音视频传输、移动承载、车载网络等多个领域受到关注,并且成为下一代工业网络的演进方向。但是针对时间敏感网络的测试问题,国内外缺乏深入有效的方案研究,给这项技术的进一步研究开发和落地实用带来了一些障碍。开展时间敏感网络相关测试工作,可以
在未来的空地融合网络中,具有充足计算和通信能力的非地面设备将作为基站直接为用户提供服务,这在很大程度上改变了传统卫星网络的架构和运行机制,使其更具灵活性。然而,对于此类功能强大的非地面网络节点,拒绝服务(DoS)攻击将可能成为其潜在的安全威胁,需要在接入弱认证环节加以防御。现有防御机制主要针对的是传统地面节点的DoS攻击,并未考虑对非地面网络节点进行攻击的特殊性。此外,在受到不同强度的DoS攻击时
当今社会正处在信息急速发展的时代,随着5G的正式商用,互联网产业得到进一步发展。光通信传输网络作为信息时代的基础传输建设,为新技术的发展奠定了基础,同时急剧增长的流量及带宽需求也给通信网络造成巨大的挑战。面对海量数据的传输需求,提高光通信传输网络的性能是通信领域研究者的研究重点。四维调制是在光载波的两个正交偏振上的同相和正交分量构成的四维空间进行调制的方式,增加了星座点之间的最小欧氏距离,解决谱效
随着物联网的不断广泛应用,窄带物联网以其低功耗、覆盖广、低成本的优势日益受到关注。随着物联网中节点数目不断增加,物联网传输系统面对的并发压力愈加严峻,为解决上述问题,本文研究了面向窄带物联网的并发技术,主要工作如下:首先,本文分析了 CoAP协议的传输机制,针对并发请求不断增长引起的网络拥塞问题,研究了物联网的业务数据增长对服务器造成的并发压力。总结了窄带物联网技术、拥塞控制方法和负载均衡方法,为
联邦学习是通过用户节点之间的协作训练,从而得到全局模型的一种新型人工智能技术。在联邦学习中,用户无需上传本地数据,可大大减少了通信成本,并保护用户的隐私。随着边缘设备计算和存储能力的不断提升,大量功能下沉至网络边缘,催生了边缘雾计算。在边缘雾计算中,可以在更接近于数据生成的地方进行模型训练,降低了时延,减少了网络流量并提升了应用效率。将联邦学习部署在边缘雾计算系统中,既可以利用边缘设备的计算和存储
近年来,社会各界对心理问题的重视程度在逐渐提高,心理测评活动也越来越普及。通过对心理测评数据的统计分析,可以从不同视图角度展示心理测评情况。同时利用关联关系挖掘技术可以分析出无法直观得出的蕴含在数据背后的内在关联关系,这种分析得到的数据是十分有价值的。本论文基于心理云平台设计并实现心理测评数据分析系统,为心理云平台提供心理测评数据分析功能。本论文首先对在线心理健康评测数据分析系统的系统需求进行分析