论文部分内容阅读
2018年,物流业、金融业、零售业等重资产传统行业;城市管理、交通运输、政务工业等国民生计各个方面;游戏、医疗、电商、视频、在线教育等新产业的各个领域,都充斥着“智能+”的身影。
近日,《陆家嘴》杂志接触到快商通COO刘晓葳,作为“智能+”市场领域的参与者,这家公司已将自主研发的声纹识别技术落地应用在金融、安防、社保、智能家居、物联网等领域,推出“金融信贷身份反欺诈”、“社保异地生存验证”等行业解决方案。
此前,智研咨询发布《2018-2024年中国声纹识别技术行业市场运营态势及发展前景预测报告》指出,2017年声纹识别技术的全球收入为1.32亿美元,而这一数值在几年后将增至1.59亿美元,增速达到20.5%,预计到2021年,声纹识别技术的全球收入将达到2.64亿美元。仅从这一数值来看,声纹识别的市场预期乐观。
《陆家嘴》:快商通是一家于2009年成立的AI公司,你觉得快商通在金融领域布局的核心竞争力是什么? 可以从技术和商业两个维度分别与大家分享一下吗?
刘晓葳:我们现在主要提供两方面的技术,一是自然语言处理,一是声纹识别,刚好这两方面是前后端关系。
声纹识别是通过收集不同人的声音特征,再根据声音特征去识别人的身份,这项技术可以广泛地应用于反欺诈、身份确认等方面。
对于自然语言处理,它是在人工智能领域里面最难的一个部分,面对前端一些语言的构成,先要由语音识别,再通过声纹识别确认身份以后,接着通过语音识别做一些文字的轉化,它最终服务的才是自然语言处理。
在银行的应用场景下,本身也有很多具有文本化的结构信息。小到一个合同,一些纸质文本的数据,所以整个技术方面是提供这两项技术。
这两项技术可以服务于怎样的商业场景呢?在风控方面,声纹识别帮助我们从源头识别人的身份,然后更多地应用到其他场景,例如电话场景,以前在电话场景下没有办法做风控,但由于目前声纹识别可做身份确认,所以已可以应用。
另外,在银行整体经营效率的改进和优化中,通过自然语言处理的方式,也可以让计算机更多理解和处理这些文本信息,从对应信息中提取出一些高度结构化的东西,或者发现一些敏感的内容。从而在降低风险、降低成本、提升效率等方面服务于银行。
《陆家嘴》:那你认为人类语言信息(和听觉信息)在金融各场景中产生的价值有多大?
刘晓葳:我认为价值有以下几点,首先人类跟其他动物的最大区别,我认为在于语言能力,而语言能力又转化为书面能力、口头表达能力,所以我们在整个金融场景中会留存很多结构。其实以前数据分析只是聚焦在可量化的数值化行为数据,一大部分数据实际都被放弃掉,我们没有办法从中挖掘出任何东西。
现在这部分数据无论对我们整体的风控还是提高银行的效率、完善经营控制等方面都是一个补全。
《陆家嘴》:快商通是如何用声纹识别作为切入的?
刘晓葳:所谓的切入点,是这个口可以切。例如以前没有做过的领域或者相对较少覆盖的领域。在我看来,金融科技领域是一个类似盲区的点。此外,想要切入,说明业务对应的需求开始迫切。
我们可以立足这两点逐步分析一下,业务切口对于声纹需求的迫切性表现在哪里?
我们第一步声纹识别选择的切入点是电话贷款业务,电话贷款业务虽然在很多金融机构已有较大企业规模量,但是,这些企业在此业务上主要流通的是语音数据,没有任何所谓的行为数据,也没有数字化数据,仅仅有的就是语音。
我们以前通过电话通信角度想要知道一个人的真实身份,没有办法对身份做一些较为精准的确认。但目前在使用电话通道的时候,对于一些具体的场景,比如银行中个人在申请贷款,我们可以通过声纹识别更为准确地判断对方身份。
目前已有的一些大公司,在电话场景下已有很多像信用卡、贷款等方面的应用,还有大量小型的机构、地方银行,都在逐步拓展这个业务线,因为它们的零售业务量一定是越来越大,所以从现在开始搭建声纹识别的声纹库和声纹识别引擎是一个好的时机,以免未来金融机构自身业务量非常大的时候,他们要重新收集这些东西将会是很困难的。所以这是一个切入点。
除了“盲区”和需求迫切之外,切入点还有第三个特性,即它是一个入口,或者叫做一个起点。
我们现在的布局就是以声纹识别为辐射中心,在完成对应身份确认的过程,后续会展开对应人的一系列行为数据,在判断属于同一个人的行为数据后,后续其他连带领域还有很多东西可以进一步发展。
《陆家嘴》:金融“科技化”中用户体验与安全风控如何平衡?
刘晓葳:其实根本上还是要符合业务的需要。业务需要是什么?举两个具体的场景。
第一个场景就是支付。以华为为例,华为新发布的手机Mate 20系列,搭载了声纹识别,但是解锁手机的安全隐私性就类似于支付的场景。
所以在对应支付场景下的体验对安全性的要求非常高,会降低用户体验。例如要利用声纹识别进行支付,那么声纹的技术则要求错误率极低,几乎为零,才能通过,否则我必须加一个验证的标准,所以对于类似场景使用,体验便相对不流畅。
除此之外,银行中的远程柜员机,用人脸活体检测的方式通过验证,其实只是80%以下的通过率,通过率相对较低。用户体验可能就没那么好,因为它是支付场景,要相对提高警惕。
第二个场景如线上贷款,当然要进行风控,但是前提首先需要将业务做起来。所以从这个角度来讲,声纹识别的应用中,我宁可说有几个真正的我要抓的黑中介被漏过去了,我也不要将本来是我的目标客户,但是被我认定成黑中介。因此,总体来看主要还是在于业务的设计。
近日,《陆家嘴》杂志接触到快商通COO刘晓葳,作为“智能+”市场领域的参与者,这家公司已将自主研发的声纹识别技术落地应用在金融、安防、社保、智能家居、物联网等领域,推出“金融信贷身份反欺诈”、“社保异地生存验证”等行业解决方案。
此前,智研咨询发布《2018-2024年中国声纹识别技术行业市场运营态势及发展前景预测报告》指出,2017年声纹识别技术的全球收入为1.32亿美元,而这一数值在几年后将增至1.59亿美元,增速达到20.5%,预计到2021年,声纹识别技术的全球收入将达到2.64亿美元。仅从这一数值来看,声纹识别的市场预期乐观。
《陆家嘴》:快商通是一家于2009年成立的AI公司,你觉得快商通在金融领域布局的核心竞争力是什么? 可以从技术和商业两个维度分别与大家分享一下吗?
刘晓葳:我们现在主要提供两方面的技术,一是自然语言处理,一是声纹识别,刚好这两方面是前后端关系。
声纹识别是通过收集不同人的声音特征,再根据声音特征去识别人的身份,这项技术可以广泛地应用于反欺诈、身份确认等方面。
对于自然语言处理,它是在人工智能领域里面最难的一个部分,面对前端一些语言的构成,先要由语音识别,再通过声纹识别确认身份以后,接着通过语音识别做一些文字的轉化,它最终服务的才是自然语言处理。
在银行的应用场景下,本身也有很多具有文本化的结构信息。小到一个合同,一些纸质文本的数据,所以整个技术方面是提供这两项技术。
这两项技术可以服务于怎样的商业场景呢?在风控方面,声纹识别帮助我们从源头识别人的身份,然后更多地应用到其他场景,例如电话场景,以前在电话场景下没有办法做风控,但由于目前声纹识别可做身份确认,所以已可以应用。
另外,在银行整体经营效率的改进和优化中,通过自然语言处理的方式,也可以让计算机更多理解和处理这些文本信息,从对应信息中提取出一些高度结构化的东西,或者发现一些敏感的内容。从而在降低风险、降低成本、提升效率等方面服务于银行。
《陆家嘴》:那你认为人类语言信息(和听觉信息)在金融各场景中产生的价值有多大?
刘晓葳:我认为价值有以下几点,首先人类跟其他动物的最大区别,我认为在于语言能力,而语言能力又转化为书面能力、口头表达能力,所以我们在整个金融场景中会留存很多结构。其实以前数据分析只是聚焦在可量化的数值化行为数据,一大部分数据实际都被放弃掉,我们没有办法从中挖掘出任何东西。
现在这部分数据无论对我们整体的风控还是提高银行的效率、完善经营控制等方面都是一个补全。
《陆家嘴》:快商通是如何用声纹识别作为切入的?
刘晓葳:所谓的切入点,是这个口可以切。例如以前没有做过的领域或者相对较少覆盖的领域。在我看来,金融科技领域是一个类似盲区的点。此外,想要切入,说明业务对应的需求开始迫切。
我们可以立足这两点逐步分析一下,业务切口对于声纹需求的迫切性表现在哪里?
我们第一步声纹识别选择的切入点是电话贷款业务,电话贷款业务虽然在很多金融机构已有较大企业规模量,但是,这些企业在此业务上主要流通的是语音数据,没有任何所谓的行为数据,也没有数字化数据,仅仅有的就是语音。
我们以前通过电话通信角度想要知道一个人的真实身份,没有办法对身份做一些较为精准的确认。但目前在使用电话通道的时候,对于一些具体的场景,比如银行中个人在申请贷款,我们可以通过声纹识别更为准确地判断对方身份。
目前已有的一些大公司,在电话场景下已有很多像信用卡、贷款等方面的应用,还有大量小型的机构、地方银行,都在逐步拓展这个业务线,因为它们的零售业务量一定是越来越大,所以从现在开始搭建声纹识别的声纹库和声纹识别引擎是一个好的时机,以免未来金融机构自身业务量非常大的时候,他们要重新收集这些东西将会是很困难的。所以这是一个切入点。
除了“盲区”和需求迫切之外,切入点还有第三个特性,即它是一个入口,或者叫做一个起点。
我们现在的布局就是以声纹识别为辐射中心,在完成对应身份确认的过程,后续会展开对应人的一系列行为数据,在判断属于同一个人的行为数据后,后续其他连带领域还有很多东西可以进一步发展。
《陆家嘴》:金融“科技化”中用户体验与安全风控如何平衡?
刘晓葳:其实根本上还是要符合业务的需要。业务需要是什么?举两个具体的场景。
第一个场景就是支付。以华为为例,华为新发布的手机Mate 20系列,搭载了声纹识别,但是解锁手机的安全隐私性就类似于支付的场景。
所以在对应支付场景下的体验对安全性的要求非常高,会降低用户体验。例如要利用声纹识别进行支付,那么声纹的技术则要求错误率极低,几乎为零,才能通过,否则我必须加一个验证的标准,所以对于类似场景使用,体验便相对不流畅。
除此之外,银行中的远程柜员机,用人脸活体检测的方式通过验证,其实只是80%以下的通过率,通过率相对较低。用户体验可能就没那么好,因为它是支付场景,要相对提高警惕。
第二个场景如线上贷款,当然要进行风控,但是前提首先需要将业务做起来。所以从这个角度来讲,声纹识别的应用中,我宁可说有几个真正的我要抓的黑中介被漏过去了,我也不要将本来是我的目标客户,但是被我认定成黑中介。因此,总体来看主要还是在于业务的设计。