论文部分内容阅读
在网上搜索“学霸”们分享的学习经验、去QQ群里查看老师当天留的作业、在微信群里和同学讨论一下难题……在移动互联网时代,不只是公司人,学生们的学习方式也正在发生一些改变。
而当碰到做错的或不会做的题目,学生们的第一反应很可能也不再是“问老师”,而是去相关的社区或社交网站上发布“求助贴”,或者是打开诸如作业帮这类的App,给题目拍下照。“如果再不懂才会去问老师。”作业帮的用户、北京某中学初一学生林溪对《第一财经周刊》说。
作业帮是百度内部孵化出的一个创业项目,目前,它有超过8000万用户,每周活跃用户达1500万。将题目拍照上传到这个App上,几秒后,作业帮就会给出相应的解题过程和答案。
最初,作业帮就像是一个“百度知道”式的细分社区。时任百度知识部总负责人的侯建彬一直在寻找一些垂直领域,能将UGC(用户原创内容)的问答模式复制到移动互联网上。他发现,学生用户在社区内非常活跃,有的学生甚至在凌晨一两点的时候还会上传不会做的题目,在社区里“求助”。这最终促成了作业帮的诞生,2014年1月,其首个版本上线。
用户在作业帮上提出问题后,系统会把题目自动推荐给合适的人。为了保证这些问题能够被快速解答,作业帮还设置了一系列的激励措施:答题者可以得到不同数量的财富值,积累到一定数量后,答题的用户就可以在财富商城里面换取iPhone、电商网站的代金券以及笔记本等礼品,问题回答得又多又好的用户还可以得到“学霸”的称号。“答题特别容易上瘾,特别是看到你名字旁边有了‘学霸’两个字的时候。”林溪说。
作业帮成立初期仅凭UGC驱动,平台上70%的问题都能得到解答,但问题是,尽管它背后设置了一些鼓励机制,但是问题最快还是要等5到10分钟才能得到响应。这对可能正在做作业的提问者来说并不方便。
当时,已有一些创业公司采用拍照搜题的方式解决实时性的问题,不过,用户对于那时基于图片识别技术的拍照搜题,评价普遍不高,100道题中,只有十几道能搜出答案。
拍照搜题准确率提升的关键在于题库的积累以及成熟的OCR(光学字符识别)技术。在这两方面,百度都有一定优势。百度的相关社区已经为作业帮的题库积累了不少题目,同时百度深度学习研究院也可以提供相关的技术支持。侯建彬和团队认为,作业帮能够做到让后台系统去自动响应学生们的需求。
“OCR是一个不太成熟的技术,虽然这个技术已经应用很久了,但是真正用到教育领域,还是需要调整和优化。”作业帮CEO侯建彬对《第一财经周刊》说。
OCR技术最早用于自动识别邮编的信函分拣系统,现在也多用于名片和车牌的识别上。然而在应用到拍题上时,还是会遇到各种问题。由于拍摄环境的不同,作业帮收到了很多质量不高的图片—图片中文字模糊、扭曲,图片颜色过暗,题面上有过多字迹等等。这导致题面上的“相向而行”很可能最终被识别成“相向面很”。
另外,用户们最经常提问的是数理化习题,这些题目通常会包含很多复杂公式,对数理化特殊符号的识别也是OCR工程师们面临的一大挑战。
光是给各种文字和特殊符号做样本库,技术人员就用了大约3个月的时间。而针对字迹模糊的问题,作业帮也在OCR技术的基础上加入了自然语言还原和搜索技术,从而保证语句更准确、通顺。
2015年1月19日,在作业帮一周年之际,带有拍照搜题功能的4.0版本正式上线。当天,它的活跃用户数就超过了100万。在此之前,作业帮的日活跃用户从未达到过这个数字。但在功能上,如果只是拍照搜题,还是显得有些单薄。
其实,随着数据库中的题目数量的增加—这正反映了学生们的需求,作业帮可以利用这些数据做更多事情。
一次假期,侯建彬回家,发现读高中的妹妹作业写到一点多了还在纠结于试卷上的最后两道大题,他催妹妹去睡觉,得到的回答是:“不行,老师让做完。”
侯建彬后来针对这件事和许多老师交流过,他赞同其中一些人的看法:对于大部分学生来说,最重要的并不是试卷上难度最高的那几道大题,这种题目即使花上很长时间也未必做得出来。大多数学生短时间内应该练习的是因为粗心等原因没有做对的题目,或者是大题中的某一小问。这些题目做好以后,他们才应该再去选择那些难题。
于是,作业帮开始根据知识点、难度等给题目做标签,并且请来了许多老师做题目间的知识结构梳理。2015年8月,它又加入了同步练习功能。
现在,当用户累计上传超过30个题目时,作业帮就会为ta形成一个“错题画像”。根据数据库的数据,作业帮能够分析出学生错题的规律,并可以根据错题的标签,为用户推送同类型的、难度相近的习题。针对用户掌握不太好的知识点,作业帮会重点推荐5道相关的练习题,题目难度逐渐增加。每做完一道题,题目前面的小灯泡就会亮起来。“这是件dirty work(苦活儿),短时间内可能没办法爆发出很大的价值。”侯建彬说。
不过用户的反馈已经给了作业帮一些回报。现在,每天做完学校的作业后,林溪还会把作业帮上相应的习题做完。“我有点强迫症,也有点征服感,就是想都做对,把所有的灯泡点亮。”
截至2015年8月,作业帮的题库数据已超过9500万,累计解决的问题超过40亿次,它还与113家教育机构开展了业务合作,覆盖了全国37万所中小学。接下来,除了数理化的题目外,作业帮则打算将此种方法扩展到文科上,比如提高英语题的搜索准确度,以及给具体的知识点配上讲解视频,以此来进一步增加用户黏性。
而除了业务上的变化外,2015年,作业帮在公司层面也发生了一次巨大变化。6月,它从百度正式分拆出来,新公司取名为“小船出海”。“(分拆出来后)做得好的话,我们会有更好的回报;当然,如果做不好,我们也没有后盾,没人能接着我们。”侯建彬说。
目前,小船出海已经拿到了来自红杉资本和君联资本的A轮投资,但这一垂直领域仍有不少竞争者:小猿搜题宣布已有5000万用户,阿凡题最近获得了6000万美元的B轮投资。
搜题应用的发展会像搜索引擎等行业一样,最终发生行业整合、优胜劣汰,市场排名达不到前两位的产品或许都将失去竞争的机会。
但这个领域的所有参与者现在还都面临着同样问题,即如何把家长们引入到平台上,完成商业化—毕竟,最终能够付费的还是家长。
而即使是它们的直接用户—那些需求更加个性多样的00后们,也是个难以讨好的群体。比如林溪就表示,“(作业帮上的)皮肤太少了,能不能弄几套女孩子喜欢的样式?”
而当碰到做错的或不会做的题目,学生们的第一反应很可能也不再是“问老师”,而是去相关的社区或社交网站上发布“求助贴”,或者是打开诸如作业帮这类的App,给题目拍下照。“如果再不懂才会去问老师。”作业帮的用户、北京某中学初一学生林溪对《第一财经周刊》说。
作业帮是百度内部孵化出的一个创业项目,目前,它有超过8000万用户,每周活跃用户达1500万。将题目拍照上传到这个App上,几秒后,作业帮就会给出相应的解题过程和答案。
最初,作业帮就像是一个“百度知道”式的细分社区。时任百度知识部总负责人的侯建彬一直在寻找一些垂直领域,能将UGC(用户原创内容)的问答模式复制到移动互联网上。他发现,学生用户在社区内非常活跃,有的学生甚至在凌晨一两点的时候还会上传不会做的题目,在社区里“求助”。这最终促成了作业帮的诞生,2014年1月,其首个版本上线。
用户在作业帮上提出问题后,系统会把题目自动推荐给合适的人。为了保证这些问题能够被快速解答,作业帮还设置了一系列的激励措施:答题者可以得到不同数量的财富值,积累到一定数量后,答题的用户就可以在财富商城里面换取iPhone、电商网站的代金券以及笔记本等礼品,问题回答得又多又好的用户还可以得到“学霸”的称号。“答题特别容易上瘾,特别是看到你名字旁边有了‘学霸’两个字的时候。”林溪说。
作业帮成立初期仅凭UGC驱动,平台上70%的问题都能得到解答,但问题是,尽管它背后设置了一些鼓励机制,但是问题最快还是要等5到10分钟才能得到响应。这对可能正在做作业的提问者来说并不方便。
当时,已有一些创业公司采用拍照搜题的方式解决实时性的问题,不过,用户对于那时基于图片识别技术的拍照搜题,评价普遍不高,100道题中,只有十几道能搜出答案。
拍照搜题准确率提升的关键在于题库的积累以及成熟的OCR(光学字符识别)技术。在这两方面,百度都有一定优势。百度的相关社区已经为作业帮的题库积累了不少题目,同时百度深度学习研究院也可以提供相关的技术支持。侯建彬和团队认为,作业帮能够做到让后台系统去自动响应学生们的需求。
“OCR是一个不太成熟的技术,虽然这个技术已经应用很久了,但是真正用到教育领域,还是需要调整和优化。”作业帮CEO侯建彬对《第一财经周刊》说。
OCR技术最早用于自动识别邮编的信函分拣系统,现在也多用于名片和车牌的识别上。然而在应用到拍题上时,还是会遇到各种问题。由于拍摄环境的不同,作业帮收到了很多质量不高的图片—图片中文字模糊、扭曲,图片颜色过暗,题面上有过多字迹等等。这导致题面上的“相向而行”很可能最终被识别成“相向面很”。
另外,用户们最经常提问的是数理化习题,这些题目通常会包含很多复杂公式,对数理化特殊符号的识别也是OCR工程师们面临的一大挑战。
光是给各种文字和特殊符号做样本库,技术人员就用了大约3个月的时间。而针对字迹模糊的问题,作业帮也在OCR技术的基础上加入了自然语言还原和搜索技术,从而保证语句更准确、通顺。
2015年1月19日,在作业帮一周年之际,带有拍照搜题功能的4.0版本正式上线。当天,它的活跃用户数就超过了100万。在此之前,作业帮的日活跃用户从未达到过这个数字。但在功能上,如果只是拍照搜题,还是显得有些单薄。
其实,随着数据库中的题目数量的增加—这正反映了学生们的需求,作业帮可以利用这些数据做更多事情。
一次假期,侯建彬回家,发现读高中的妹妹作业写到一点多了还在纠结于试卷上的最后两道大题,他催妹妹去睡觉,得到的回答是:“不行,老师让做完。”
侯建彬后来针对这件事和许多老师交流过,他赞同其中一些人的看法:对于大部分学生来说,最重要的并不是试卷上难度最高的那几道大题,这种题目即使花上很长时间也未必做得出来。大多数学生短时间内应该练习的是因为粗心等原因没有做对的题目,或者是大题中的某一小问。这些题目做好以后,他们才应该再去选择那些难题。
于是,作业帮开始根据知识点、难度等给题目做标签,并且请来了许多老师做题目间的知识结构梳理。2015年8月,它又加入了同步练习功能。
现在,当用户累计上传超过30个题目时,作业帮就会为ta形成一个“错题画像”。根据数据库的数据,作业帮能够分析出学生错题的规律,并可以根据错题的标签,为用户推送同类型的、难度相近的习题。针对用户掌握不太好的知识点,作业帮会重点推荐5道相关的练习题,题目难度逐渐增加。每做完一道题,题目前面的小灯泡就会亮起来。“这是件dirty work(苦活儿),短时间内可能没办法爆发出很大的价值。”侯建彬说。
不过用户的反馈已经给了作业帮一些回报。现在,每天做完学校的作业后,林溪还会把作业帮上相应的习题做完。“我有点强迫症,也有点征服感,就是想都做对,把所有的灯泡点亮。”
截至2015年8月,作业帮的题库数据已超过9500万,累计解决的问题超过40亿次,它还与113家教育机构开展了业务合作,覆盖了全国37万所中小学。接下来,除了数理化的题目外,作业帮则打算将此种方法扩展到文科上,比如提高英语题的搜索准确度,以及给具体的知识点配上讲解视频,以此来进一步增加用户黏性。
而除了业务上的变化外,2015年,作业帮在公司层面也发生了一次巨大变化。6月,它从百度正式分拆出来,新公司取名为“小船出海”。“(分拆出来后)做得好的话,我们会有更好的回报;当然,如果做不好,我们也没有后盾,没人能接着我们。”侯建彬说。
目前,小船出海已经拿到了来自红杉资本和君联资本的A轮投资,但这一垂直领域仍有不少竞争者:小猿搜题宣布已有5000万用户,阿凡题最近获得了6000万美元的B轮投资。
搜题应用的发展会像搜索引擎等行业一样,最终发生行业整合、优胜劣汰,市场排名达不到前两位的产品或许都将失去竞争的机会。
但这个领域的所有参与者现在还都面临着同样问题,即如何把家长们引入到平台上,完成商业化—毕竟,最终能够付费的还是家长。
而即使是它们的直接用户—那些需求更加个性多样的00后们,也是个难以讨好的群体。比如林溪就表示,“(作业帮上的)皮肤太少了,能不能弄几套女孩子喜欢的样式?”