深耕人机交互“入口”

来源 :创业邦 | 被引量 : 0次 | 上传用户：xbjxbj008

【摘要】

：

【作者】

：

岳丽丽

【出处】

：

创业邦

【发表日期】

：

2020年4期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　吴晓波说过，2014年到2016年是中国最好的创业时代。声智科技（SoundAI）联合创始人常乐算是抓住了这一“时代”尾巴的一拨人之一。2016年创办声智科技，专注于声学与人工智能融合方向的技术研发，包括她在内的4名创始成员都来自中国科学院声学所。
　　常乐告诉创业邦，人和机器的交互方式在不断演变，从旋钮和键盘、鼠标、触摸屏演变到第4代以语音为代表的远场语音交互手段。语音已经成为最重要的人机交互入口，这是一个国内外同步创新、争夺科技制高点与未来产业重构的新机遇。
　　而远场语音交互市场的兴起还要归功于美国电商巨头亚马逊推出的智能音箱Echo，其带来的显著变化就是把语音交互方式从近场升级为远场。以北美市场为首，围绕人工智能远场语音交互技术的产品已经开始落地，但彼时，国内大多数产品还停留在近场语音交互阶段。常乐预判“未来国内的发展模式一定会往远场语音交互方式过渡”，因此，创业初期声智科技决定由该市场切入。

将技术做商业化落地

　　此前，常乐的师兄，现在的声智科技创始成员，与常乐一起同在中科院声学所从事相关技术的研发，创立声智科技则意味着把技术做商业化落地。由此组成的创始团队构成了声智科技的竞争力之一。常乐解释，声学是物理学科的二级学科，很多高校本科并不开设这个专业，到了研究生阶段才有一些高校、研究所开设，相关人才稀缺。同时国内专注在声学领域研究的人才很少。

　　人和机器的交互方式在不断演变，语音已经成为最重要的人机交互入口，这是一个国内外同步创新、争夺科技制高点与未来产业重构的新机遇。

　　在目前200人的团队中，除创始团队外，声智科技還引进了包括中国科学院、清华大学、北京大学、中国科技大学、北京航空航天大学、中国传媒大学、MIT等名校毕业生以及Google、Broadcom、Dolby、腾讯、百度等精英。
　　常乐提到，2010年由于深度学习技术的出现和应用，人工智能开始在商业领域展现其价值。智能语音在国内是从1956年中科院声学所的第一套电子管语音识别系统开始，直到2011年语音技术才真正获得市场认同，这个时候语音识别技术开始快速迭代，2016年机器语音识别率终于在2016年达到了一般人类的水平。但是这个结果还存在非常大的边界约束，因为没有考虑到真实环境的物理因素干扰，其真实效果还是不能满足实际应用的要求。商业化落地需要构建真实的场景下的远场语音交互，比如在嘈杂的餐馆、迎风行驶的车上等。首先声智科技要解决的是空间物理环境声场的影响，也就是构建一个灵敏的“耳朵”，提升体验感。“有了灵敏的耳朵，就能采集到更好的数据集，训练出更好的机器学习的模型，反哺整个交互过程。”
　　其次，声智科技基于底层声学技术生成完整的软硬件方案，构建基于声智科技人工智能操作系统搭建的人工智能交互平台。完整的语音交互过程包括从听到声音到大脑解析成文字再到最终说出来，其中包括了多项技术，声学处理主要是仿真人类的耳朵，保证机器能够听得准真实环境下的人的声音;语音识别则是要把听到的人声翻译成文字;语义理解则分析这些文字的意义;语音合成就把机器要表达的文字翻译成语音。再融合知识图谱、人工智能大数据分析和解析、智能搜索推荐、智能决策等技术，形成完整的人工交互链条，声智科技再开始在此基础之上迭代产品和服务。

声智科技（SoundAI）联合创始人常乐这是一个国内外同步创新、争夺科技制高点与未来产业重构的新机遇

　　常乐介绍，声智科技推出人工智能操作系统的目标用户群体主要分为两大方向。第一为内容和服务提供方，声智科技可以满足他们在不同设备、载体嵌入服务和内容的需求。“未来用户可能会在智能音箱、智能屏、智能汽车等新一代智能终端设备上使用传统服务，通过我们的人工智能操作系统构建服务平台，帮助这类目标客户将服务、内容提供给第三方，类似于在手机上安装他们的App。”第二是传统硬件厂商，通过安装声智科技的人工智能操作系统，为硬件升级进行智能化赋能，打造具有人工智能交互能力的新型设备产品。

从感知智能进入认知智能

　　现在声智科技已研发出人工智能操作系统Azero、人工智能开放平台Babel和融合感知算法引擎Cimon，以及深度结合应用场景的AI硬件设备、AI营销客服、AI语音助手、AI虚拟数字人、AI音视频会议等产品和行业综合解决方案。
　　初期，声智科技率先落地在消费电子品这类用户使用量较大的场景，声智科技占据中国70%的远场语音交互市场。现逐步向传统金融、安防以及医疗、交通等领域开始新的探索。在此次疫情期间，声智科技也有所行动，推出了AI数字人红外测温设备、可视化AI语音电梯等非接触式抗疫解决方案。常乐介绍，AI数字人红外测温仪可实现1～6米范围内、0.2秒内完成多个目标的高精度测温，支持实时AI语音合成播报，自动上传预警信息。
　　目前声智科技已在安徽、广州、青岛、成都、北京等全国18个省市的学校、办公大厅、写字楼落地。AI语音电梯整体解决方案无须下载任何App或小程序，只需要一句话“小易小易，上楼/下楼”就可以实现电梯呼叫。现在已在北京市海淀医院正式投入使用，北医三院也即将落地使用。
　　回顾人机交互技术的发展史，相较于近场语音交互，远场语音交互技术的出现成功解决了真实场景下的复杂声学问题。但当前还只是人机自然交互的发展初期，即便智能语音交互也还任重而道远。在声智科技看来，所有的AI产品仍没有达到理想的状态，在不断优化过程中，声智科技始终注重的是用户体验，“语音识别率超过99%这个数字对于用户来说，意义不大，相反，交互体验对他来说更为重要，也就是推荐的产品是不是他想要的，听到的是不是够准确。”
　　为了更好地实现AI从感知智能进入认知智能的阶段，需要针对不同场景，在语义理解方面建立不同知识图谱库，不断进行学习和迭代。常乐表示，现阶段，智能家居等领域的语音识别率已经相对较高，而在一些智能交通、智能医疗领域、安防司法等专业性较强领域，还需要针对自然语义理解方面收集更多的语料库和数据集进一步的迭代，这是声智科技今年重点的发力方向。
　　同时常乐预判，未来的人机交互，也将实现更加多传感融合的多模态人机交互手段，使可交互信息的理解度和可靠性更高，会是融合交互将成为人类和机器相互学习的关键手段。这也是声智科技下一步优化迭代的方向。
　　从长远来看，能快速把技术落地应用到相应业务领域，得益于声智科技团队的落地能力和营销能力。在常乐看来，初期已有声学技术储备到逐步建立了多模态交互技术，能达到这一技术壁垒的企业在国内寥寥可数。
　　声智科技现有客户数约500家，包括华为、小米、百度、腾讯、阿里巴巴、中国移动、中国联通、中央人民广播电台、联想、创维、宝洁、万科、奇虎360、金蝶、浪潮、国美、坚果等企业。常乐提到，成立初期国内市场的相关需求特别强烈，声智科技占据了先发优势，前期的种子客户也都是互联网巨头公司，像小米的首台智能音箱、奇虎360打造的第一款具有语音交互功能的安防摄像头、阿里天猫精灵魔盒都应用了声智科技的技术。
　　据悉，声智科技现有商业模式主要围绕软件授权，芯片、模组和整体产品方案，以及服务费。去年销售额达3亿元，已在上海、苏州、青岛等地落地分公司。

声智科技融资信息

　　2016年获得由洪泰基金领投，峰瑞资本跟投的1600万人元民币Pre-A轮融资;
　　2017年获得由洪泰基金、百度、蓝港互动等投资的近亿元A轮融资;
　　2018年12月，声智科技已完成2亿元人民币B轮融资，由毅达资本领投，峰瑞资本、正居资本跟投，中关村银行、InnoVen Capital联合参与。

其他文献

慧穗科技

慧穗科技创始人兼CEO 黄国华通过慧穗智能财税管理服务，帮助企业客户降低成本、提高管理效率　　从SAP研发成员，用友、宝信（国内第一批金税试点）的代理商，到创办喆企信息（年营收三千万元，已退出），再到慧穗科技的标准化数据接口建成，一步一个脚印，印下的是黄国华对于智能财税的执着。　　2018年6月的一天，慧穗科技成立，创始成员全部来自喆企信息EPR项目部、菱瑞信息智能税务事业部以及原阿里系企业“商

期刊

全景声科技

全景声科技创始人兼CEO 潘兴德视听产业包括内容端和播放终端，这都是全景声科技可应用的场景　　音频行业过去受制于国外技术标准，但随着国内自主知识产权AVS2标准的颁布，加之5G网络商用的启动，未来编解码技术、AI算法、高速网络将会为音视频产业带来新的机会。北航投资投资部负责人王维这样表示，前不久他参与投资的全景声科技正是把握新机会的入局者。　　国内音频技术在不断发展，数十年来，音效技术已经从一维

期刊

发力模数混合AI加速芯片

九天睿芯创始人刘洪杰九天睿芯做的是介于标准化和定制化之间的“半定制”芯片　　5G时代，我们聊移动通信，聊人工智能，聊虚拟现实，聊万物互联……科技飞速发展的背后，芯片技术的核心地位也逐渐凸显。　　刘洪杰与芯片的缘分始于2013年，当时她正在爱因斯坦母校苏黎世联邦理工学院（ETH Zurich）就读博士。2013年至2017年的四年在校期间，刘洪杰带领团队着手研发模数混合加速芯片，参与了多项欧盟及

期刊

割据高端曲奇市场的降维打法

Coookie 9 创始人Sam Coookie 9 的消费者85% 为女性，这部分消费者看重的是产品口味、功能性和颜值　　伴随着消费水平的日益提升，互联网带动全球优质品牌流入中国，国内中高端市场也加速崛起。饼干作为休闲食品烘焙甜点类的代表，因其便捷、营养、精致等特点吸引着众多消费者，是大多上班白领下午茶的首选点心之一。　　2018年饼干市场规模已达700多亿元。虽然市场持续向好发展，但单从整个市

期刊

省心办

省心办创始人于景晨 “坚持自营，不做加盟”是省心办的战略思想　　对于企业而言，想融资、IPO？必须先做好财税筹划。因此，帮助企业在合理缴纳税款和在法律法规允许的前提下减少支出并提高营运利润，成了财税领域创业公司的首要任务。　　以往，传统财税工作重度依赖于人，会计的专业水平直接决定服务水平，一个会计最多可同时兼顾30?40家企业。为此，省心办打造了智能企业工商财税SaaS服务体系，通过技术赋能，让

期刊

App也可以看病

Am Mindfulness 创始人兼CEO 贝沙拉·萨（Bechara Saa）我们希望有一个互动式的方式，通过手机App 这样一种数字化的疗法，帮助患者解决问题　　我们都习惯了在手机上下载App，也习惯了传统的药物形式，未来App将与传统药物相结合，形成一种新的药物形式。这种软件和药物结合形成的新型治疗方式，被称为“数字疗法”。　　一直以来，药物治疗都在医疗领域占据主导地位，这种情况已持续了近

期刊

岚时科技

嵐时科技联合创始人吴祖鹏 “嗨医”将基于熟人社交解决消费医疗机构外部流量获取难的痛点　　流量红利殆尽的当下，最大程度上挖掘老用户价值的方式成为主流，私域流量正被热议，其载体包括微信公众号、QQ群（微信群）、个人微信等。　　在KOL之外，KOC（Key Opinion Consumer）的价值正在受到品牌方的关注。KOC可能并非专精某一领域的人士，但与普通消费者的关系更紧密，因而可能更大地影响潜在

期刊

直播休一日，工厂停产数十天

据说，薇娅曾一场直播所获佣金金额等同于“一夜赚了杭州一套房”。薇娅是谁？不妨看下薇娅直播创造的带货奇迹：　　单场（约2小时）最高销售额：2.67亿元;　　单件商品最高销量：65万件;　　单件商品最高销售额：2700万元;　　2018年售卖商品总额：27亿元。　　2018年淘宝曾发布达人收入排行榜“淘布斯”，32岁的女主播薇娅以年收入3000万元、带货销售额7亿元居榜首。　　毫不夸张地说，薇娅停播一

期刊

2020年最值得关注的商业女性领导者

在中國，女性创业者正在成为创新创业的重要力量，在互联网领域，女性创业者的比例已经达到55%，而在全球，有超过1亿的商业女性领导者。无论是女性创业者、高管，亦或是女性投资人，她们正在用自己独特的商业思维，思考、影响并改变着这个急剧变化着的移动互联网时代。　　过去的几年中，创业、创新、投资浪潮滚滚，将无数怀揣激情和梦想的人们挟裹其中，也为女性展示自己的创新、创业以及商业天分提供了更广阔的空间。　　我们

期刊

新药界独角兽养成记

诺诚健华创始人董事长兼CEO崔霁松中国本土创新药在未来5～10年，一定能研发出几款国际领先的首创新药摄影张勇　　北京时间3月23日，诺诚健华医药在港交所挂牌上市，由摩根士丹利和高盛担任联席保荐人，是首家在港股市场“云敲锣”上市的公司。诺诚健华上市首日逆市高开9.4港元，较发行价上涨5.03%。截至当天发稿，其股价涨幅为8.94%，最新市值121.91亿港元。　　研发一款新药需要多久？　　根据塔

期刊