论文部分内容阅读
前有百度进军人工智能,宣布“智能医疗,奇点临近”;后有百洋医药引进沃森肿瘤智能助手。火爆全球的人工智能正在更快、更深地进入医疗领域。到底什么是人工智能?人工智能是制造以人类智能的方式学习并解决问题的智能机器和计算机程序的科学工程。该领域包括自然语言处理与翻译、视觉感知与模式识别,以及决策制定等。
推动人工智能进展的三大基石是更多的数据、更快的硬件、更好的算法。近年来,机器学习和深度学习的应用领域极速扩张也是巨大的推动力。
机器学习在医疗领域中有廣泛的应用前景,而它可为其中不少的子行业提供获得高额回报的潜力。随着人工智能和机器学习的不断整合,人们将有望在新药研发过程中实现“去风险”,不但将节约每年约260亿美元的研发成本,同时还将提高全球医疗信息领域的效率。
痛点
药物发现与开发的时间和成本一直是医疗领域的重要痛点之一。塔夫特药物发展研究中心数据显示,一款上市的新药从药物发现到FDA批准平均时间约为97个月。再算上前期研究和测试的时间,整个过程可达10年以上。
虽然专业技术进步帮助改善了时间问题,但新药研发成本却仍在持续增加。德勤的数据显示,自2010年以来,12家主要制药公司的获批药物开发成本已经增加了33%,约每年16亿美元。
而新药研发之所以越来越难,不仅是因为时间漫长,还由于整个开发过程中各个阶段的成功概率都很低。
药物发现始于最初的目标确定。一旦确定目标后,人们通常利用高通量筛选在同一时间进行数以百万计的试验,找出最有潜力达到目标的化合物,提高药物发现的“命中”几率。“命中”的结果经过优化成为导引化合物,然后再进一步优化,为进入临床前药物开发做好准备。这个过程通常就需要1年~3年。
此外,在药物发现的早期阶段,“高通量筛选”这种虚拟筛选方法非常容易受到错误发现率的影响。有专家认为,错误发现率是一个统计学现象,而避免错误发现率则有可能将后期试验阶段的风险减半。
影响研发回报最重要的不利因素之一在于那些失败的研发产品,特别是那些已经达到后期试验阶段的药物;这些药物的成本估计每年达到400亿美元以上。如果可以将Ⅲ期临床试验阶段的风险减半,大型制药公司就可以节约数十亿美元成本,进而影响其超过900亿美元的研发经费并带来有意义的回报,使它们能够腾出资源集中用于寻找更有潜力的机会。
开发一款成功药物的成本持续增加,但由于报销制度中的不利因素、患者量的降低和企业间的竞争等,新药研发的收入回报环境不容乐观,这也让制药企业比以前更需要考虑这一问题。
方法
在药物开发过程中结合机器学习,可以提升开发效率的潜力。机器学习不但可以加速时间进程,还可以提高到达后期试验阶段药物的成功概率。
学者们已经纷纷倡导利用人工智能开发有效和准确的虚拟筛选方法,以取代昂贵且耗时的高通量筛选过程。而且已经有巨头公司和初创公司采取行动。
比如谷歌和斯坦福的研究人员就正在攻关利用机器学习开发虚拟筛选的技术。目的就是取代或增强传统的高通量筛选过程,提高筛选速度和成功率。通过应用机器学习,研究人员能够实现跨越多个靶点的众多实验的信息共享。正如一篇机器学习相关的论文中所称:“我们的实验表明,深层神经网络优于所有其他方法,尤其在于深层神经网络大大超越了所有现有的商业解决方案。在许多靶点上,它都实现了接近完美的预测质量,使其尤其适合被用作虚拟筛选装置。总之,深度学习提供了建立虚拟筛选并将其作为药物设计管道中标准步骤的机会。”
在2012年,默沙东主持了一项由数据科学公司Kaggle发起的旨在确定虚拟筛选统计技术的研究项目。而现在,Kaggle已经开始测试机器学习和人工智能的应用,并与人工智能药物发现初创公司Atomwise开展合作。
Atomwise利用人工智能技术,在不到一天的时间内对现有的7000多种药物进行了分析测试,为寻找埃博拉病毒治疗方案做出了贡献。根据该公司的统计,如果利用传统方法,这项分析需要花费数月甚至数年才能完成。
虽然与后期试验相关的巨额费用往往侧重于临床试验的设计元素,但高盛报告指出,将人工智能应用于优化后期阶段在选择标准、规模和研究长度等方面的决策,可以实现有意义的效率提高。
另外,医生的医疗实践明显滞后于新药和新治疗方法的获批也是医疗领域的又一大挑战。机器学习和人工智能可有望降低药物发现和医疗实践之间的时间差;与此同时,它们还能对治疗进行优化。例如,从北美放射学会2009年对肝胆放射的研究可见,23%的第二意见会改变诊断结论,而这也是专注于医学影像的机器学习公司有望能解决的领域。那些致力于利用机器学习在基因组层面进行疾病判断的公司也正帮助供应商实现精准定位,以提供更有效和更有针对性的治疗。
因此,许多医疗领域的机器学习和人工智能专家正不断鼓励主要的医疗服务供应商,让在其工作流程中融入现代的机器学习工具,以使其充分利用收集到的和已发表的海量医疗数据存储。
不过,虽然人工智能在医疗领域的许多子领域均存在明显机遇,但技术采用的障碍仍然存在。
实施人工智能需要配备必要工具和能力,但它们的成本十分昂贵。在医疗行业中,医疗成本仍然是大众关注的焦点。为了确保机器学习算法能很好地利用数据,光是确保拥有足够的计算能力就将花费不菲。还有来自相关领域人才的聚合也费用高昂。2013年,Google为收购一家人工智能公司共支付了4亿多美元,彼时该团队的成员只有十几人。聚合这样一群高级人才的难度以及由此产生的高昂成本也可能会令企业望而却步。
实施人工智能还需要梳理多个数据集,而这往往会生成一些所谓的“黑箱子”,以前一直受到严格监管的医疗行业有可能会因此推迟人工智能应用的发展。而且,虽然美国政府已经下令要求实现电子健康记录的数字化,但将普遍使用纸张的系统转变为完全电子化的过程仍然存在挑战。虽然许多机构已经迈过了人工智能“有意义使用”的门槛,但是重要患者数据的碎片化和难以获得仍然阻碍着改革的进一步发展。
推动人工智能进展的三大基石是更多的数据、更快的硬件、更好的算法。近年来,机器学习和深度学习的应用领域极速扩张也是巨大的推动力。
机器学习在医疗领域中有廣泛的应用前景,而它可为其中不少的子行业提供获得高额回报的潜力。随着人工智能和机器学习的不断整合,人们将有望在新药研发过程中实现“去风险”,不但将节约每年约260亿美元的研发成本,同时还将提高全球医疗信息领域的效率。
痛点
药物发现与开发的时间和成本一直是医疗领域的重要痛点之一。塔夫特药物发展研究中心数据显示,一款上市的新药从药物发现到FDA批准平均时间约为97个月。再算上前期研究和测试的时间,整个过程可达10年以上。
虽然专业技术进步帮助改善了时间问题,但新药研发成本却仍在持续增加。德勤的数据显示,自2010年以来,12家主要制药公司的获批药物开发成本已经增加了33%,约每年16亿美元。
而新药研发之所以越来越难,不仅是因为时间漫长,还由于整个开发过程中各个阶段的成功概率都很低。
药物发现始于最初的目标确定。一旦确定目标后,人们通常利用高通量筛选在同一时间进行数以百万计的试验,找出最有潜力达到目标的化合物,提高药物发现的“命中”几率。“命中”的结果经过优化成为导引化合物,然后再进一步优化,为进入临床前药物开发做好准备。这个过程通常就需要1年~3年。
此外,在药物发现的早期阶段,“高通量筛选”这种虚拟筛选方法非常容易受到错误发现率的影响。有专家认为,错误发现率是一个统计学现象,而避免错误发现率则有可能将后期试验阶段的风险减半。
影响研发回报最重要的不利因素之一在于那些失败的研发产品,特别是那些已经达到后期试验阶段的药物;这些药物的成本估计每年达到400亿美元以上。如果可以将Ⅲ期临床试验阶段的风险减半,大型制药公司就可以节约数十亿美元成本,进而影响其超过900亿美元的研发经费并带来有意义的回报,使它们能够腾出资源集中用于寻找更有潜力的机会。
开发一款成功药物的成本持续增加,但由于报销制度中的不利因素、患者量的降低和企业间的竞争等,新药研发的收入回报环境不容乐观,这也让制药企业比以前更需要考虑这一问题。
方法
在药物开发过程中结合机器学习,可以提升开发效率的潜力。机器学习不但可以加速时间进程,还可以提高到达后期试验阶段药物的成功概率。
学者们已经纷纷倡导利用人工智能开发有效和准确的虚拟筛选方法,以取代昂贵且耗时的高通量筛选过程。而且已经有巨头公司和初创公司采取行动。
比如谷歌和斯坦福的研究人员就正在攻关利用机器学习开发虚拟筛选的技术。目的就是取代或增强传统的高通量筛选过程,提高筛选速度和成功率。通过应用机器学习,研究人员能够实现跨越多个靶点的众多实验的信息共享。正如一篇机器学习相关的论文中所称:“我们的实验表明,深层神经网络优于所有其他方法,尤其在于深层神经网络大大超越了所有现有的商业解决方案。在许多靶点上,它都实现了接近完美的预测质量,使其尤其适合被用作虚拟筛选装置。总之,深度学习提供了建立虚拟筛选并将其作为药物设计管道中标准步骤的机会。”
在2012年,默沙东主持了一项由数据科学公司Kaggle发起的旨在确定虚拟筛选统计技术的研究项目。而现在,Kaggle已经开始测试机器学习和人工智能的应用,并与人工智能药物发现初创公司Atomwise开展合作。
Atomwise利用人工智能技术,在不到一天的时间内对现有的7000多种药物进行了分析测试,为寻找埃博拉病毒治疗方案做出了贡献。根据该公司的统计,如果利用传统方法,这项分析需要花费数月甚至数年才能完成。
虽然与后期试验相关的巨额费用往往侧重于临床试验的设计元素,但高盛报告指出,将人工智能应用于优化后期阶段在选择标准、规模和研究长度等方面的决策,可以实现有意义的效率提高。
另外,医生的医疗实践明显滞后于新药和新治疗方法的获批也是医疗领域的又一大挑战。机器学习和人工智能可有望降低药物发现和医疗实践之间的时间差;与此同时,它们还能对治疗进行优化。例如,从北美放射学会2009年对肝胆放射的研究可见,23%的第二意见会改变诊断结论,而这也是专注于医学影像的机器学习公司有望能解决的领域。那些致力于利用机器学习在基因组层面进行疾病判断的公司也正帮助供应商实现精准定位,以提供更有效和更有针对性的治疗。
因此,许多医疗领域的机器学习和人工智能专家正不断鼓励主要的医疗服务供应商,让在其工作流程中融入现代的机器学习工具,以使其充分利用收集到的和已发表的海量医疗数据存储。
不过,虽然人工智能在医疗领域的许多子领域均存在明显机遇,但技术采用的障碍仍然存在。
实施人工智能需要配备必要工具和能力,但它们的成本十分昂贵。在医疗行业中,医疗成本仍然是大众关注的焦点。为了确保机器学习算法能很好地利用数据,光是确保拥有足够的计算能力就将花费不菲。还有来自相关领域人才的聚合也费用高昂。2013年,Google为收购一家人工智能公司共支付了4亿多美元,彼时该团队的成员只有十几人。聚合这样一群高级人才的难度以及由此产生的高昂成本也可能会令企业望而却步。
实施人工智能还需要梳理多个数据集,而这往往会生成一些所谓的“黑箱子”,以前一直受到严格监管的医疗行业有可能会因此推迟人工智能应用的发展。而且,虽然美国政府已经下令要求实现电子健康记录的数字化,但将普遍使用纸张的系统转变为完全电子化的过程仍然存在挑战。虽然许多机构已经迈过了人工智能“有意义使用”的门槛,但是重要患者数据的碎片化和难以获得仍然阻碍着改革的进一步发展。