论文部分内容阅读
研究目的:随着当前大众健身意识的增强、体质测试的普及以及健身设施的改善,体质健康数据和健身信息急剧增长,已积累到相当规模。如何有效收集存储这些数据,理顺体质健康管理中的数据"整合-管理-分析-再利用"通路,从中挖掘获取有价值的信息,逐渐走出依赖专家经验的人工开具运动处方的传统服务模式,是实现"互联网+""大数据+"科学健身的新型服务模式和业态的关键问题。本研究基于体质健康数据本体模型,设计了基于关联规则的推荐算法,构建了个性化运动处方推荐系统,以最大限度地满足用户的个性化需求。同时研究引入运动处方解释机制和处方有效性校验,定量分析个体运动健身的作用和效果,以指导运动处方和干预措施的调整和校正,形成"检测-评估-干预-效果"的闭环反馈。研究方法:本研究通过对数据采集接口和多种数据源抽取方式融合方法的调研,制定了数据获取标准,建立了数据分层融合模型。采用本体进行知识存储,建立体质健康领域的本体库,基于自顶向下的方法构建了体质健康本体模型。利用关联规则挖掘算法发现体质健康指标和运动项目、运动强度、运动频率等运动处方项目之间的关联关系,设计了基于关联规则的个性化运动处方推荐算法,并在此基础上构建了个性化运动处方推荐系统。研究结果:1)建立体质健康数据融合模型。通过不同技术手段和途径采集的体质健康数据在结构、种类、格式、采集方式、时空维度等方面均不统一,体现了明显的多源异构的特性,反映出个体体质健康状况的不同侧面,需要融合到一个统一的标准体系下。首先设计通用的标注格式,对采集来的数据进行标注。其次对来自存储层的数据进行转换、过滤、清洗,进行进一步集成化描述和管理并重新抽取加载到结构化数据库中以满足后续应用的查询需求。然后建立数据分层融合模型,对数据在接入层、存储管理层、特征层和应用决策层的分别处理,给出决策分析所需要的特征信息,建立该个体的综合特征库。同时分析各应用平台业务系统特征描述,结合体质健康评价术语、体质健康评价方法与智能化技术要求之间的关系,构建系统所需的领域本体模型。以freebase本体库为基础上,抽取医疗健康medicine、人people、运动sport等领域的相关本体,进行体质健康本体库的搭建。2)设计并实现个性化运动处方推荐系统。在本体模型的基础上,将用户基本信息、体质健康数据和运动意愿作为X项集,各运动处方项(包括运动项目、运动强度、运动时间、运动频率等)作为Y项集,试图通过关联规则算法,找到所有频繁项集,再由频繁项集生成关联规则,并输出强关联规则,设计基于关联规则的推荐算法;在基于关联规则的推荐算法基础上,引入人工干预机制,由专家对关联规则进行手工核查修正,经过多轮的迭代训练得出一个稳定且较为精准的推荐结果。基于上述推荐模型,构建个性化运动处方推荐系统,在体质健康本体模型的基础上,以用户的体质健康测试数据为基础,综合考虑影响体质健康的诸多因素(包括营养状况、生活方式、作息规律和慢性疾病等),评估用户的运动能力、预测其可能的运动风险,给出体质健康评估报告;并结合用户的运动意愿制定个性化的运动处方。3)进行处方的有效性校验。借助多源异构体质健康数据融合平台,利用数据仓库集成的大量历史数据,取使用运动处方的群体和未使用运动处方的群体进行对比。以时间为轴,首先对使用运动处方的人群进行个人纵向分析,获得各类体质得分变化情况。然后对未使用运动处方的人群进行个人纵向分析,获得各类体质得分变化情况。(1)验证使用运动处方的人群,个人体质健康得分的促进情况。随机抽取100个拥有4个月连续使用运动处方标记的记录进行数据统计分析。依次统计这100个样本分别连续使用1个月、2个月、3个月、4个月运动处方后,体质健康得分变化情况。(2)对使用运动处方的人群和未使用运动处方的人群进行数据分析对比。随机抽取各100个1个月未使用运动处方、首次使用1个月、连续使用2个月、连续使用3个月、连续使用4个月的记录分别作为A、B、C、D、E组数据。分别对A、B、C、D、E五组数据计算体质健康评价得分的变化。通过数据分析比较得出坚持使用运动处方相较于未使用运动处方的人群的体质健康得分情况有明显提高,第一次使用运动处方时相对变化比较明显,其后较平稳,连续四个月使用运动处方的体质健康评价得分最高。研究结论:本研究从解决体质健康管理中的数据整合与处理问题入手,结合计算机科学中的本体模型和关联规则算法,从解决体质健康管理中的数据整合与处理问题入手,结合具体应用场景需求,设计了基于关联规则的个性化运动处方推荐算法,并在此基础上构建了个性化运动处方推荐系统。弥补了对特定目标需求人群的定制化解决方案的缺失,以及同类产品在智能化个性化针对性方面的不足,为进一步解决全民大健康管理的科学化数据化问题提供重要的理论依据和实践价值。