如何构建有效的人工智能生态系统

来源 :计算机世界 | 被引量 : 0次 | 上传用户:wuchianren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  随着人工智能越来越普及,组织机构必须要让开发人员更容易释放人工智能的潜能。
  在业务用例和垂直行业中,工程师和领导者正在持续讨论人工智能可以带来的价值——通常,这样的机遇似乎无穷无尽。它们可以预测你的兴趣、你认识的人或你的下一份工作。
  但是,我们时常会忽略执行大型人工智能驱动系统时所必须采取的步骤。人工智能的部署在人才、计算资源和时间方面成本高昂。然而要充分释放人工智能创新浪潮的潜力,开发人员必须得到适当的授权和工具。事实上,成功实施人工智能所需的许多关键要素与算法细节关系不大,更多的是与之相关的工具和流程。
  其中一些工具和流程是标准化中最常用的工作流程。它们可以像带有常见功能的电子表格那样简单,也可以像完整的人工智能开发人员平台那样复杂。当我们在LinkedIn上拓展我们的人工智能时,我们逐渐选择了后者,创建了我们自己的“生产机器學习”(简称“Pro-ML”)计划,以提高开发人员的工作效率。
  以下是我们在人工智能工作中积累一些要点和提示。这些要点和提示对任何组织机构都是有益的。
  清理数据,让洞察更加智能
  部署人工智能的先决条件是要彻底了解自己的数据。人工智能模型的性能与其训练数据有着紧密的内在联系,因此清楚自己需要使用干净的数据这一点非常重要。然后,在选择要用于培训的数据集时,与业务合作伙伴协作以了解最终业务目标是有帮助的。例如,如果你想通过新闻Feed“增加参与度”,那么你是否是通过文章和帖子的点击率,或者对帖子的“点赞”或评论来衡量的呢?通过共同确定能够支持明确业务目标的最佳数据,你可以设计出更有效的模型。
  选择训练数据时要考虑的另一个因素是如何标记。数据是否有足够的上下文直接输入模型,还是需要注释?就后者而言,创建“代码簿”或“运行手册”非常重要,因为它们会为数据的分类方式设定标准。我曾经与一组专家展开合作,尝试着寻求手工标记数据集,但是在我们评估成品时,我们意识到他们之间的一致率低于0.2。这意味着专家们对注释完全有着自己不同的意见,因此我们也没有理由期望使用这些数据进行训练的模型将会有令人满意的表现。如果专家无法就如何标记数据达成一致意见,那么指望CrowdFlower公司(现在更名为Figure Eight公司)这样的注释服务能够有效地进行标记也是不现实的。
  关键点:非常清晰地预先确定数据标签标准可以消除歧义和棘手问题。
  将功能标准化并让其具有可重复性
  在LinkedIn的不同产品线中,不同的团队正在使用人工智能来解决不同的问题(如优化信息、确定应聘人员的适合度,并为今后的职业选择提供建议课程等)。每个团队会使用不同的管道让机器学习模型生成自己需要的功能,因为每个用例都是不同的。然而,在这些团队中许多功能又是非常相似的,因此我决定必须简化流程。
  为此我们创建了功能市场Frame,通过让团队利用现有功能和知识的方式帮助解决此问题。Frame充当一个公共存储库,供团队共享、查找和管理各自机器学习模型的功能。其允许所有团队从同一标准化功能模板开始,然后根据特定管道或环境的需要进一步定制。当团队处理不同类型的项目时,Frame市场可以防止重复工作,节省时间和资源。
  积极进行模型维护
  模型会随着时间而退化,这是机器学习生命周期中不可避免的一部分。我们通过积极主动的模型维护方法在LinkedIn上克服了这个问题。从一开始,当我们建立模型时,我们就采用了能够让再训练更容易实现的方式来做这项工作。我们创建和测试的模型并不是一次性的,而是具有生产级品质且可进行代码审查的产品。当重新训练模型的时候,我们会继续贯彻让训练变得更容易这一理念。
  此外,我们还为重新训练模型时制定了一个固定的时间表,以进行“预定的再培训”。这样有助于消除建模团队的一些认知负担,同时确保能够在模型完全停止工作之前发现所有的模型缺陷。同时,我们还投资开发了性能监测工具以确保模型始终处于健康状态。任何程度的监控都比没有监控要强。能够在某些指标超过预设阈值时发送警报的自动监控无疑会推动整个系统向着我们期望的目标又迈进了一步。
  实施人工智能部署可能只需要某些组件,如GPU、模型、数据等,但是在一个大型组织机构中成功部署人工智能需要一个强大的支持工具包,以为开发人员提供支持。通过为开发人员配备人工智能最佳实践和工具,我们也在不断提升我们以最佳方式应用人工智能的能力。
  本文作者Joel Young为LinkedIn公司负责机器学习基础架构团队的主管。
  原文网址
  https://www.infoworld.com/article/3401080/tips-for-building-an-effective-ai-ecosystem.html
其他文献
挫败或者绕过端点保护措施的攻击所造成的泄露事件越来越多。本文介绍了攻击者是怎么干的。  据Ponemon的《2018年端点安全风险状况报告》,63%的IT安全专业人士承认,过去12个月内,攻击频率有所上升,52%的受访者认为,事实上不可能停止所有攻击。他们的防病毒解决方案仅阻止了43%的攻击。64%的受访者说,他们的企业经历过一次甚至多次导致数据泄露的端点攻击。  这份报告是根据对660名IT安全
技术是数字化转型战略主题不可或缺的组成部分,也代表着优秀企业的新能力。  近年来,有一批文章宣称数字化转型只涉及到人,而不是技术。这一论点通常是这样的,即,需要人去执行战略,如果没有合适的技能、文化和变革管理,任何数字化转型举措都可能会错失良机。这话没错,而且企业的大多数主要举措也是如此。  但数字化转型要想真正成功则同时涉及到人“与”技术。如果没有技术,数字化转型只是转型,也就丢掉了使数字化成为
“我们每年的平台运营分钟数是在7亿分钟,相当于减少碳排放80万吨,换做植树的话,相当于种了8000多万棵树。”这是写在会畅通讯官网上的一句话。 对整个运营平台上的数据进行碳排放模拟数据计算的方式,起始于2012年会畅通讯的一次服务。 2012年,当年一家美国制药公司要召开一场500多人的大会,会畅通讯给这家制药公司提供的解决方案是采用线下和线上方式同时举行。会后这家美国公司要求会畅通讯提供给他们一
大型机/Linux联盟9月份迎来第20个年头,证明了它比以往任何时候都来得重要,基于大型机的Red Hat OpenShift就是有力的佐证。  这些年来,大型机多次被宣布“已死”、“变形”和“转型”,因此有时很难相信“大铁块”(大型机的别称)在企业界仍有一席之地。  不过很显然,大型机仍有一席之地,而且举足轻重。  以近期的新闻为例:据IBM声称,20大跨国银行中75%在运行最新的z15大型机;
工业物联网(IIoT)将交通、电力和医疗等行业的机器和设备连接起来。潜力很大,但风险也高。  大家都听说过物联网——智能温控器、连接互联网的冰箱、联网灯泡,但还有一个被称为工业物联网的子集,它对企业、安全甚至生命的日常影响更为显著。  缩略词IIoT指的是工业物联网。广义上说,它是指在交通、能源和工业部门的机械和车辆上应用仪表、联网传感器和其他设备。  这意味着在实践中有很大的差别。一个工业物联网
人工智能有碳足迹并不奇怪,所谓碳足迹指的是开发和消费人工智能时释放到大气中的温室气体(主要是二氧化碳和甲烷)。事实上,训练人工智能模型需要如此之多的计算能力,以至于一些研究人员认为环境成本大于效益。然而,我认为他们不仅低估了人工智能的好处,而且还忽视了提高模型训练效率的很多好方法。  温室气体是经济学家们所说的“外部因素”,是整个社会无意中承担的成本,例如全球变暖的不利影响所带来的成本,但我们所有
新的一年已经到来,戴尔易安信希望为客户提供一些未来技术突破性发展的预测,帮助他们探索并把握新的业务机会。在过去的一年里,技术创新日新月异,人工智能和机器学习、5G、云计算、AR/VR以及区块链,是戴尔易安信团队内部讨论和与客户交流中最常提及的话题。对技术发烧友来说,这是一个激动人心的时代,这些技术对我们自身以及我们的客户来说意味着什么,是我们需要更加深入地进行探索的。我们如何充分利用这些机会帮助他
物联网需要边缘计算。据市场研究公司IDC的数据显示,到2025年,全球将有416亿台联网的物联网设备,这些设备将产生79.4 ZB的数据。为了充分利用这些数据,企业开始投资位于网络边缘上的计算、存储和网络设备,包括物联网网关和超融合基础设施。  将处理和分析移到网络边缘可为物联网带来新的优势。例如,减少关键应用程序的延迟,在降低网络负载的同时提高警报速度等。  我们与三名来自不同行业的物联网早期采
作为敏捷投资战略的一部分,为响应前所未有的客户需求,全球云服务提供商正在迅速改变其业务模式,以提供新的云基础架构、应用程序和托管服务。  据IDC的一项最新调查显示,数字化转型所带来的云服务需求正在改变以业务为导向的解决方案的交付模式,为此服务提供商正不断增加对新产品的投资力度,以满足客户对新基础设施和应用程序的双重需求,并通过云服务提供托管服务和专业服务。调查发现,除日本以外的亚太地区(APeJ
“数字驱动产业创新年会暨2019中国优秀CIO颁奖典礼”现场国家工业信息安全发展研究中心副主任何小龙致开幕词國家工业信息安全发展研究中心副主任何小龙致开幕词中国工程院院士沈昌祥发表主题演讲  数字驱动增长正成为企业的核心竞争力,数字化团队毫无疑问是企业的中坚力量,数字化项目更是为企业量身定制的转型催化剂,而CIO们正是数字化转型的关键力量。1月12日,由计世传媒集团、《计算机世界》报和《新金融世界