面向健康饮食营养挖掘与推荐关键技术研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:lillian0606
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人们对健康的重视程度加大和医疗水平的提升,目前已得出防控慢性病的最佳公认结论:“保合理膳食,持良好生活”。然而,治疗费用高昂、周期漫长等因素造成临床康复效果较差,而大数据时代又带来健康数据量大、关系类型多以及解决方案复杂等问题,从而导致仅通过临床医学来快速减少因慢性病造成的死亡显然不现实。因此,辅助医疗多学科交叉运用数据挖掘(DM)、深度学习(DL)、知识图谱(KG)等成熟的应用技术来防控慢性病已成为当下关注热点,从而开展面向健康饮食营养挖掘与推荐关键技术的研究具有重大理论意义和应用前景。本文主要对健康饮食中的营养挖掘、知识图谱嵌入(KE)和个性化营养食谱推荐(PNRR)等三大内容展开研究:第一,围绕食物、食谱、营养、疾病四者的关系分别从营养、食谱和疾病三个角度开展食物与慢性病的关联挖掘、机器学习环境中营养食谱的科学制作和基于多因素挖掘的疾病分类等技术研究;第二,利用擅长揭示实体之间关系且能自动发掘知识动态关联的KG技术对前面研究内容进行深入挖掘;第三,利用挖掘出的健康知识展开PNRR关键技术的研究。本文具体研究工作和主要贡献概括如下:一、健康饮食营养挖掘技术研究。(1)从营养角度开展饮食食物与慢性病的关联挖掘工作。首先,利用多种爬虫技术抓取大量疾病数据,并融入健康病例构建健康大数据知识库H-bdkb。运用DM相关技术(如信息熵)提出多个方案找出食物中有益于慢性病康复的营养素。其次,基于粗糙集提出了一种符合健康数据特性的属性约简改进算法CVNDARed,来更加准确地挖掘出对疾病起决定性作用的营养成分。最后,选择性能较优的提出方法采用投票机制进行融合,进而提升挖掘准确率。(2)从食谱角度开展机器学习环境中营养食谱的科学制作工作。在H-bdkb中填充大量食谱数据,通过核典型相关分析法证明营养成分与食谱之间存在内链关系。对于同种食物在不同食谱中的重要度差异,本文提出了一种新颖食谱表达方法EDexp。应用自动编码器进行食谱的制作,并提出了一种堆栈自动编码器融合方法FSAE。围绕非负矩阵分解过拟合和不稳定问题,本文提出了使用Frobenius表达目标函数和引入平滑系数的FSNMF方法。对于相似食物具有相近味道但其营养成分差异较大,本文提出利用营养成分矩阵作为两步正则最小二乘方法中的一个核矩阵,以避免食谱制作过程中类似食物容易组合的问题。(3)从疾病角度开展基于多因素挖掘的疾病分类工作。本文通过分析各因素对疾病的制约影响,采用分层思想提出了一种基于数据驱动可拓展的强健疾病分类框架d-DC。为结构化和非结构化数据设计了一个数据收集模型,既可以实现数据自动补充又能够有效解决模型冷启动问题。本文首次将KG与DL结合应用于疾病分类,通过KE对医学文本进行向量化为计算机辅助医学提供了技术支撑。针对结果不一致问题,本文通过构建的专家系统给出解决方案,并利用KG技术直观展示多关系推理结果。二、健康饮食中的知识图谱嵌入技术研究。本文主要围绕KE过程中对存在多关系环、复杂关系下辅助信息高效提取和相似度量方式选择等三个问题的求解展开。本文对多关系环进行定义和建模,提出了一种基于PageRank算法计算节点权重和传递能量的TransEE翻译模型。指出十余种不同度量方式在翻译模型中有较大结果差异,并采用矩阵分解思想提出了两种嵌入方法(sMFE和tMFE)来增强结果。引入传递能量将嵌入求解转换为图上挖掘问题,本文提出了一种基于传递能量和卷积神经网络的CNNe模型,在确保模型性能不减的同时降低了引入额外信息成本。完全关联矩阵(CIM)具有图最全面的拓扑性质,本文提出了一种基于CIM的知识嵌入方法ComInE,拓宽了图内部结构特征提取表示学习。三、健康饮食个性化营养食谱推荐技术研究。在前文挖掘出的健康知识基础上,为终端防控慢性病提供具体营养膳食而开展个性化食谱推荐工作。一方面,由于用户需求多目的性、兴趣多样性,PNRR在需求不明确且无合理解释的情况下会出现难以精准问题,本文首先采用多模态和分层思想构建了以用户底层更加细粒度的多个因素为中心的食谱图谱RcpKG,并提出了一种基于多模态和KG的多角度图节点表示与多关系抽取的双阶段处理食谱推荐模型RcpMKR。它不但可以充分顾及食谱图结构的全局信息,还能考虑其内部分层用户的不同关注点以及食谱内部的局部关联。另一方面,本文应用了多个基于BERT的多模态模型和生成式对抗网络,结合图片和视频生成较为合理的健康饮食推荐解释。通过在真实数据上进行大量实验,说明了本文提出的方法在提高PNRR性能和生成健康文本解释两方面具有很好的优越性。此外,本文提出的三模态食谱推荐框架KG3MRR不仅能够为慢性病防控提供应用可能性,还可以推动整个个性化推荐理论体系的研究。
其他文献
中国新型政党制度话语权是指中国共产党领导的多党合作和政治协商制度在国际和国内两个话语场域的影响力与控制力,具有引导制度认同,维护我国政治安全,宣扬中国方案等功能。当前,制度竞争是国家间最根本的竞争。中国新型政党制度作为我国的基本政治制度,其话语权的强弱与生存权、发展权密切相连。与西方政党制度具有三百多年的历史相比,我国的政党制度可谓一项新生制度。由于西方占领了政党制度的话语先机,在我国政党制度发展
学位
随着数字经济时代的到来,蓬勃发展的数字技术为经济社会发展的方方面面带来了重大而深远的改变。数字技术不仅提高了数据搜集的速度、降低了数据搜集的成本,还有助于部门之间协调合作和决策水平的提高。而且,党的十九届四中全会还进一步将数据确认为第七种生产要素。作为一种生产要素,如何充分利用数字技术和数字资产进行商业决策并发挥经济价值显得尤为重要。因此,数字经济下企业价值和财务决策行为也受到了社会公众和学术界的
学位
掺杂可以调控和改善功能材料的性能。作为典型的钙钛矿氧化物功能材料,钛酸锶(SrTiO3)具有优异的电学和磁学性质,如高的静态介电常数、大的电子有效质量和较大的塞贝克系数,是较好的电子陶瓷材料之一;近年来因其在光催化领域的高效率、稳定性和强的还原能力,也广泛地用作光催化剂。而宽带隙半导体材料氧化镓(Ga2O3)因其高的光学带隙(4.2-4.9eV)、大的击穿电场、优异的物理化学性能、生产工艺简单、能
学位
组织要不断提升竞争力并实现可持续发展,最为根本的方略就是持续提升高层领导者的战略领导力。战略领导力赋予组织“战略逻辑”,从根本上关注组织的全局整体、把握组织的方向路径、对组织的持续发展负责。责任型领导是战略领导力的重要分支。它最核心的特征是高层管理者在与组织利益相关者对话的过程中,积极协调不同利益相关者的利益诉求,以期实现一个有价值的共同愿景。CEO责任型领导研究具有重要现实意义。首先,CEO责任
学位
股权结构是公司治理问题的逻辑起点(Becht et al.,2003)。在我国股权集中、投资者保护相对较弱的制度背景下(Allen et al.,2005),大股东在公司治理中发挥着举足轻重的作用。近年来,新一轮国有企业混合所有制改革逐步推进,主要的方式包括“推进国有企业混合所有制改革”、“引入非国有资本参与国有企业改革”、“鼓励国有资本以多种方式入股非国有企业”。这意味着在未来一段时间内,“民营
学位
在台湾地区所实行的政治制度中,“选举”已经成为了民众政治生活的主要内容,尤其是其“总统”选举更是成为台湾地区政治、经济、社会、两岸等各方面走向的风向标。从1996年开始的“总统”选举中,本来弱势的民进党赢得了七次选举中的四次,也借此成为了当前台湾地区的第一大党。在历次“总统”选举中,民进党的竞选策略成为其“险中求胜”、“逆风翻盘”的主要支撑,也是其二十多年来由弱变强,多次执政的关键因素。因此,抓住
学位
强化学习算法是一类让智能体在与环境的交互中进行学习的算法,即让智能体学会如何将环境状态映射成自身的动作的方法,并使得环境反馈的回报信号的数值最大化。在引入深度学习后,强化学习算法的应用范围得到拓展且性能得以提升,但同时也带来一些问题。本文的主要工作分为三大部分,分别面向强化学习的三个关键的问题:(1)值函数近似误差对算法造成的负面影响;(2)强化学习算法需要依赖大量的采样;(3)强化学习算法的稳定
学位
近年来,空间光场调控在基础物理,经典物理及量子物理领域逐渐展露出其重要的应用价值,已经成为当前光学研究的前沿。在量子领域,空间模式与二维偏振相比具有高维纠缠的优越性,可以实现大容量的光通信并增强保密性,在高维量子领域具有重要的应用前景。实现高容量通信的基础是高维的量子通信资源,即空间模式的高维纠缠态。系统是否具备高维纠缠资源是实现高维量子通信及其他量子应用的关键。这产生了一个重要的科学问题:如何对
学位
多线激光雷达可以快速地提供大范围内的高精度点云数据,它为自动驾驶汽车对环境的感知提供了可靠的数据保障。车辆对周围环境和自身运动状态的正确感知是自动驾驶汽车自主决策的前提,其中,对自身运动的感知主要是判断自动驾驶汽车自身在当前环境中的位置和姿态,它为车辆的路径规划和运动控制等提供了决策依据。基于多线激光扫描点云的运动估计可以使自动驾驶汽车不依赖于卫星导航系统和惯性导航系统,从而减少天气或环境的干扰,
学位
当前海域活动越来越频繁,诸如海域生物、船舶、通信设备、探测设备等不明目标声源的信息交互已是暗涛汹涌,致使国家海洋边界安全态势更扑朔迷离。因此,研发水声信号辨识方法和平台,及时检测出不明目标的水声信号,对保障海域安全和保护海洋生物具有重要意义。时频变换算法提取的时频特征能区分不同水下目标的声信号之间差异,因此成为水声信号识别的关键研究点。当强海洋背景噪声干扰和水声信号调频分量具有快时变和紧邻甚至频点
学位