基于不精确数据的疾病发展预测模型研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:kuwa_li
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
受益于数据的爆炸式增长和算力的飞速发展,以深度神经网络为代表的人工智能技术飞速发展。如今,深度学习技术已广泛应用在医疗诊断领域进行手术风险自动评估、药物研发、疾病预测、疾病早筛等。美国食品和药物管理局(FDA)在2018年已经批准了有史以来第一款自动人工智能(AI)诊断仪的上市。伴随着人工智能系统的日益推广,如何对其在医疗健康等安全关键型环境中的性能进行监管成为新的问题。数据是深度学习模型构建的核心,然而在实际应用环境中,在数据的采集获取过程中,误差不可避免。医疗领域,从疾病的早期发现到诊断到个性化治疗,实验室检测结果数据主导了70%以上的医疗决策和个性化用药。但受限于设备、仪器、材料、测试方法等,实验室检查结果不可避免会出现误差。虽然各检测实验室均有其相应的质量控制和临床检验操作规范,但很显然在现实世界中无法得到完全准确的测试结果,精度仍在一定范围之内。很小的精度范围有可能会导致错误的估计结果。本文旨在如何应对检测值不精确范围而引起预测偏差对疾病发展预测模型展开研究。本文的主要贡献如下:(1)提出了基于数据不精确范围的损失函数。由于检测值不精确范围空间中的任意值也是可接受的,而传统损失函数忽略了该空间内其他值的贡献。本文提出了基于数据不精确范围空间的损失函数(Imprecision Range Loss,IR Loss),将不精确空间内数据按概率放入损失函数的计算中,后续实验表明所提出的IR Loss相对传统损失函数,能够有效提高测试集无扰动时预测的准确性和测试集增加扰动时预测的稳定性。(2)提出了基于IR Loss的疾病预测模型。在IR Loss基础上,提出了训练数据不精确范围空间的离散化方法和预测模型参数近似最优化求解方法,按照不同扰动大小和细粒度生成对应的扰动数据集,将离散化后的扰动数据集和原始训练集按批次进行训练。进一步将IR Loss引入考虑时间戳的疾病预测模型,并将IR Loss与随机平滑方法进行结合,探讨了IR Loss的可扩展性,其可适用于拟合、分类等多种学习任务,在多个深度学习模型及机器学习方法上都有较好的表现。(3)开发了扰动传播分析系统。首先定义了衡量模型适应扰动稳定性的指标Sen,然后提出了评估模型稳定性的Cross Lip算法并改进了求解神经网络局部Lipschitz常数的表达式。并使用Flask和Vue.js框架开发了相应的扰动传播分析系统。该系统通过分析神经网络的扰动传播过程,给出扰动变化的结果展示,并根据所设置的不同参数模型计算得到的Lipschitz常数给出最优模型推荐。
其他文献
美国教育部拟定的面向21世纪的外语学习标准,又称“5C”标准,因其权威性和科学性得到了外语教学界的广泛认同。近年来,将“5C”标准应用于对外汉语教学也日渐成为了新的研究热点,并取得了一些实绩。就汉语综合课教学而言,“5C”标准不仅与汉语综合课教学目标相一致,而且可以有效应用于汉语综合课的教学实践。基于此,本文以“5C”标准为教学依据,选择《HSK汉语教程6(上)》中的第三课《一盒月饼》,开展详实的
学位
在新冠肺炎疫情背景下,线下课堂的汉语教学无法正常实施,基于互联网的线上教学成为国际中文教育的常态和主流。线上教学模式既为汉语学习者和教师提供了一定的便利,同时也带来了诸多困难和挑战。例如汉语学习者分布在全球各地,存在时差;语言教学需要人际言语交流,线上教学缺乏目的语环境;课堂练习方式受限等等。这些问题都亟需在汉语线上教学中得以妥善解决。在这样的情况下,针对特定教学对象和线上汉语教学中的实际问题,进
学位
疫情背景下,借助网络平台而进行的线上教学已经成为一种广泛推广的教学模式。同时,一对一线上教学对于教师和学生提出了更多的要求。如何针对线上教学的特点,采取有效方法和措施来提升学生在线课堂参与度、在对外汉语线上教学方面提高效率,培养学习者的交际能力,是对外汉语教学亟需解决的问题。对外汉语教学中,中级阶段的汉语教学在对外汉语教学中占据着极为重要的地位。汉语学习者在中级阶段的学习是对初级阶段所学知识的进一
学位
工业设备的正常运转是保障工业流程的关键,通过有效的异常检测技术对工业设备进行诊断可以提高员工的检测效率,更重要的是可以避免因设备意外损坏造成的安全事故。可见,异常检测在整个工业生产过程中发挥重要作用。因为工业流程复杂,涉及到的设备很多,并且具有大量传感器进行实时监测,仅仅通过工人按照经验规则进行全面检测显得十分困难。得益于计算机与异常检测技术的不断提升,逐渐由传统的人工现场监管变成大规模的线上运维
学位
本文通过比较企业财务会计与管理会计的功能,分析了两者之间的差异与联系,并探讨了企业财务会计向管理会计转型的必要性和动力。在此基础上,本文进一步探讨了企业财务会计向管理会计转型实践中的问题,并提出了相应的解决策略。最后,本文以某企业为例,深入分析了该企业财务会计向管理会计转型的实践过程,总结了转型成功的经验与教训。
期刊
随着以现代计算机技术为基础的网络经济崛起,虚拟试衣、时装展示等人工智能技术在服装业中得到了广泛的应用,人们越来越习惯于在线上购买服装。随着经济发展,人们越来越不满足于千篇一律的成品西装而转向寻求对西装进行个性化定制。西装由于其正装的属性,款式较为固定,所以在线上个性化定制西装时,用户更在意对西装面料的选择定制。为满足用户需求,可以利用图像合成技术实时生成不同面料西装的效果图,这样不仅可以提升用户的
学位
近年来,由于移动设备的普及以及社交媒体网站的发展,互联网上产生了规模前所未有的多媒体数据量。多媒体数据核心的表现为一个实例可以通过不同的媒体类型呈现,不同媒体类型的数据存在一定程度上的语义关联。因此,人们对于大规模跨媒体数据检索的需求与日俱增。与此同时,跨媒体检索也已经成为了一类重要的应用,由于其更加符合现实的应用场景,从而往往能够显著提升用户体验。在这类应用中,人们使用一个模态的查询实例(例如图
学位
进入二十一世纪以来,移动通信技术飞速发展,各种计算密集型应用不断涌现,如AR/VR、视频流处理等,传统的云计算模式在处理此类应用时,造成了较大的时延和能量消耗。为了降低计算任务处理时延和能量消耗,业界提出了移动边缘计算(Mobile Edge Computing,MEC)来解决上述问题。MEC模式把CPU资源、磁盘资源和互联网资源等分配到处于互联网边缘的MEC服务器中,为移动终端提供服务。由于ME
学位
为实现“三位一体”智慧医院的建设目标,提升医院综合效益,推进落实医院后勤科学化、标准化、精细化管理水平,成都中医药大学附属医院以“完善标准、强化监督、多方协同、数字基底”为思路,以建筑信息模型(Build-ing Information Modeling,BIM)为内核,运用大数据、人工智能、云计算等数字技术进行管理实践,实现了后勤运维可视化把控,大幅降低人工成本,提升了医院保障服务安全及效率。
期刊
联邦学习作为一种分布式深度学习框架,能够解决由于数据隐私无法集中数据进行训练的问题。传统联邦学习采用中心化参数服务器对模型进行聚合、更新和分发,容易引起单点故障和数据泄漏问题。通过结合去中心化、不可篡改的区块链,能够解决联邦学习中的信任问题。然而,区块链无法避免恶意者通过修改训练样本而引起的中毒攻击。现有研究结合聚合规则或异常检测来防御中毒攻击,但仍存在防御效果差、难以准确识别恶意节点和中毒率超半
学位