深度学习模型中的公平性研究

来源 :软件学报 | 被引量 : 0次 | 上传用户:lingyuehqu2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年深度神经网络正被广泛应用于现实决策系统,决策系统中的不公平现象会加剧社会不平等,造成社会危害.因此研究者们开始对深度学习系统的公平性展开大量研究,但大部分研究都从群体公平的角度切入,且这些缓解群体偏见的方法无法保证群体内部的公平.针对以上问题,定义两种个体公平率计算方法,分别为基于输出标签的个体公平率(IFRb),即相似样本对在模型预测中标签相同的概率和基于输出分布的个体公平率(IFRp),即相似样本对的预测分布差异在阈值范围内的概率,后者是更严格的个体公平.更进一步,提出一种提高模型个体公平性的算法IIFR,该算法通过余弦相似度计算样本之间的差异程度,利用相似临界值筛选出满足条件的相似训练样本对,最后在训练过程中将相似训练样本对的输出差异作为个体公平损失项添加到目标函数中,惩罚模型输出差异过大的相似训练样本对,以达到提高模型个体公平性的目的.实验结果表明,IIFR算法在个体公平的提升上优于最先进的个体公平提升方法.此外IIFR算法能够在提高模型个体公平性的同时,较好地维持模型的群体公平性.
其他文献
代码搜索是当下自然语言处理和软件工程交叉领域的一个重要分支.开发高效的代码搜索算法能够显著提高代码重用的能力,从而有效提高软件开发人员的工作效率.代码搜索任务是以描述代码片段功能的自然语言作为输入,在海量代码库中搜索得到相关代码片段的过程.基于序列模型的代码搜索方法 DeepCS虽然取得了很好的效果,但这种方法不能捕捉代码的深层语义.基于图嵌入的代码搜索方法 GraphSearchNet能缓解这个
期刊
如何从海量数据中快速有效地挖掘出有价值的信息以更好地指导决策,是大数据分析的重要目标.可视分析是一种重要的大数据分析方法,它利用人类视觉感知特性,使用可视化图表直观呈现复杂数据中蕴含的规律,并支持以人为本的交互式数据分析.然而,可视分析仍然面临着许多挑战,例如数据准备代价高、交互响应高延迟、可视分析高门槛和交互模式效率低.为应对这些挑战,研究者从数据管理、人工智能等视角出发,提出一系列方法以优化可
期刊
目的:血清糖类抗原125(CA125)和人附睾蛋白4(HE4)在子宫内膜癌(EC)淋巴结转移的预测价值分析。方法:全面检索中英文数据库:中国知网、万方、维普、CBM、Pub Med、The Cochrane Library和EMBASE,收集自建库以来至2021年12月发表的相关所有中英文文献。中文检索词:糖类抗原125;人附睾蛋白4;子宫内膜癌;淋巴结转移。英文检索词:Carbohydrate
学位
如何提高异构的自然语言查询输入和高度结构化程序语言源代码的匹配准确度,是代码搜索的一个基本问题.代码特征的准确提取是提高匹配准确度的关键之一.代码语句表达的语义不仅与其本身有关,还与其所处的上下文相关.代码的结构模型为理解代码功能提供了丰富的上下文信息.提出一个基于函数功能多重图嵌入的代码搜索方法.在所提方法中,使用早期融合的策略,将代码语句的数据依赖关系融合到控制流图中,构建函数功能多重图来表示
期刊
基于宽度学习的动态模糊推理系统(broad-learning-based dynamic fuzzy inference system, BL-DFIS)能自动构建出精简的模糊规则并获得良好的分类性能.然而,当遇到大型复杂的数据集时, BL-DFIS因会使用较多模糊规则来试图达到令人满意的识别精度,从而对其可解释性造成了不利影响.对此,提出一种兼顾分类性能和可解释性的模糊神经网络,将其称为特征扩展
期刊
目的:探讨宫颈小细胞神经内分泌癌(Small cell neuroendocrine carcinoma of the cervix,SCNCC)的临床病理特征及不同治疗方式对预后的影响,为临床诊治提供参考。方法:回顾性分析2010年1月1日至2021年10月31日我院收治的宫颈小细胞神经内分泌癌患者的临床病理资料,纳入符合条件的99例病例。根据国际妇产科联盟(FIGO)2009版的临床分期标准,
学位
司法人工智能中主要挑战性问题之一是案情关键要素识别,现有方法仅将案情要素作为一个命名实体识别任务,导致识别出的多数信息是无关的.另外,也缺乏对文本的全局信息和词汇局部信息的有效利用,导致要素边界识别的效果不佳.针对这些问题,提出一种融合全局和局部信息的关键案情要素识别方法.所提方法首先利用BERT模型作为司法文本的输入共享层以提取文本特征.然后,在共享层之上建立司法案情要素识别、司法文本分类(全局
期刊
目的回顾性分析达芬奇机器人辅助下大子宫切除术的临床疗效,探讨机器人手术的优势及手术的可行性、安全性。方法收集南昌大学第一附属医院妇产科2017年6月-2021年6月因子宫肌瘤或子宫腺肌病导致子宫体积增大至孕12周及以上需行全子宫切除患者的临床资料,313例患者被列入本研究,并根据子宫大小分组,将子宫大小达12-16孕周者列入大子宫组(n=137),其中机器人手术47例,传统腹腔镜手术58例,开腹手
学位
目的:通过比较卵巢子宫内膜异位囊肿患者手术后应用地屈孕酮联合醋酸亮丙瑞林与单纯应用醋酸亮丙瑞林治疗的效果,探讨其临床疗效及安全性评价,为临床医生提供一种参考性治疗策略。方法:采用前瞻性临床研究,将2021年06月至2021年09月在江西省妇幼保健医院行腹腔镜卵巢囊肿剔除术且术后病理证实为卵巢子宫内膜异位囊肿的42例住院患者,根据随机列表法原则分成两个组,其中22例对照组的患者术后单独应用醋酸亮丙瑞
学位
量子计算理论上有望解决诸多经典难解问题,近年来量子计算机的快速发展正推动这一理论进入实践.然而,当前硬件中繁多的错误会造成计算结果出错,严重限制了量子计算机解决实际问题的能力.量子计算系统软件位于应用与硬件之间,充分挖掘系统软件在硬件错误减缓方面的潜力,对于近期实现有实用价值的量子计算而言至关重要.由此,近期涌现了一批量子计算系统软件研究工作.将这些工作归纳入编译器、运行时系统和调试器3个范畴,通
期刊