讯飞输入法创始人:从一个Demo到4亿用户,我的一些思考和努力
去年锤子手机发布会上,科大讯飞语音输入法强势被关注。从2010年直到2016年被追捧前,它是如何“默默无闻”从一个idea做到4亿用户?这款产品是如何从0到1,再从1到10? 和馒头妹妹一起看看这篇文章,9分钟后,你就能了解这背后。 来源:馒头商学院 导师 / 翟吉博,讯飞输入法创始人,科大讯飞产品总监 我先说一下整个产品的由来过程。任何一个产品从0到1,从0到0.1的阶段都是一个非常重要的过程。这个过程中每个产品都有它自己的故事。讯飞输入法的故事,要从2010年说起了。 2010年6月份,苹果iPhone4发布了。苹果前几代的智能手机其实已经有了很好的市场反响,但是真正到iPhone4才引起了空前的轰动和关注。 我也是从那时开始关注这个产品,而且由此引发了我跟leader的一个讨论。 对于iPhone4,我们当时试着从产品和用户的角度去做了一些探讨。iPhone4本身是非常震撼的一个产品。作为一个智能手机,不论是外观还是用户体验,都非常优秀。当时我最关注的一个问题就是输入交互问题。 在iPhone4这种纯粹的触屏产品上,它的输入是虚拟的纯键盘输入。以前的手机输入,大多数是用实体的硬键盘,或者是用电阻屏的带手写笔的这种方式。一下子过渡到电容屏、小键盘的这种输入方式后,会产生一些问题。 一方面是使用上不习惯,另一方面,效率也会有所折扣。主要是因为它的屏幕实在是太小,整个触屏的手感也很难和实体的键盘相比。 关于输入的问题,我们做了一个发散的讨论。除了电脑上的实体键盘,或者手机上的实体或者虚拟键盘,有没有新的、更好的输入方式?接下来我们认为比较可实现的一个方式是语音输入。其实语音输入早在PC时代IBM的产品上就出现过,但是在手机端还没有这样的产品,而且在电脑端语音输入也并没有真正地流行起来。 我们觉得语音输入在手机端应该比电脑端有更好的实现条件。主要的理由就是,键盘和鼠标是电脑端交互最主体的部分,而手机端不但没有键盘也没有鼠标。它的传感器主要是屏幕,不论是触摸屏还是麦克风或者陀螺仪,传感器相教电脑端更加的丰富。 所以,从技术思维思考过手机的输入问题后,我就开始去想怎么实现。我用了3天时间做了一个比较简单的Demo,这个Demo里面其实已经包含了传统的拼音输入,还有手写输入。但最重要的是,这个Demo是基于讯飞语音识别技术的语音输入在手机上的首次实现。 我当时把这个Demo拿给我的上级去看时,可能仅仅出于技术思维的考量,并没有想要把它做成一个具体的产品。而我的上级说,这个事情需要好好分析一下市场,看看是不是需要继续把它做下去。 所以,到了后面确实就有了一个认真地、深入地去分析这个市场的机会。再之后准备的一个关于语音输入法的立项,在公司很快获得通过。我们组织了一个四五个人的团队,大家封闭开发了3个月左右的时间,在2010年10月底的时候,第一版面世了。 以上这些就是讯飞输入法的诞生过程。纵观整个产品的发展,其实我们更多的是从一个工具型产品的角度来衡量的,希望市场上有更多的用户去使用它。 2010年的讯飞输入法其实是一个新的产品。 1.选择合适的、有发展潜力的市场 当时,我们选择的切入点是智能手机这个大市场。说得更具体一点,整个行业的趋势是,像安卓、iPhone这样的智能设备和平台,会有一个很明显的爆发趋势。我们最早的版本也是设定在安卓的平台去做的。 2.与公司的技术背景息息相关 我们选择这个输入的方向,也是跟我们公司的技术背景密切相关的。包括对于手机这种智能设备出现变化后我们关注的角度都可以看出来,我们是本质上事一家做人工智能、人机交互技术的公司。我们原来做过的语音合成,就是让机器能够像人一样发出声音。 所以,从智能设备衍变的过程来看,是从大型机到小型机再到PC机,从传统手机到智能手机。如果放在人机交互的角度去看的话,不同的设备形态在交互上其实是变革的。 3.手机更适合语音交互和触摸交互 比如,原来是以键盘和鼠标这样的交互为主。而在手机上,特别是iPhone、安卓这种智能手机,是以触摸交互为主。 在手机上,语音交互的比重是比电脑上要多的。因为我们在手机上,天然是有通讯的需求的,所以对于语音的这个部分,特别是录音比起电脑来,比重就大了很多。而且从整个趋势可以看到,原来是人去学习、适应机器的交互方式,将来是机器越来越去学习人的交互方式。 我们知道,人跟人的交流,最自然的是像手势、声音这样的方式,而像键盘、鼠标是需要人去适应、学习机器的。所以,我们坚信将来的趋势是往越来越自然的交互方式去走发展,特别像语音的交互,可能还包括图象、手势。 所以,我们在手机上首先看到的是交互方式的转变。这种交互方式的转变其实还蕴含着另外一个问题。我们在手机上的交互可以分成两大部分,一部分是,我们怎么样去控制它,另一部分就是输入的部分,输入部分是我们把信息以文字或图象的形式输入到设备里。 而在手机上的输入会与在电脑上有很大变化。因为,我们的输入本质上追求的首先是一个效率问题,第二是简单、方便的问题。 我们认为,在电脑上键盘和拼音很好地解决了这两方面的问题。首先,它足够的高效;其次,拼音相对汉语实际上已经是一种实际、简单、便捷的方式了。但是在手机上就会发生变化,因为手机屏幕上的这种输入很难做到像电脑上两只手同时去打字这样高效。 另外,手机屏幕,它本身的面积是受限的,所以,它在操作的便捷程度上,对设计也是有很大的一个挑战。 所以,我们当时就判断,除了传统的以虚拟键盘的形式把键盘搬到手机上用,其实还可以有新的形态。比如手写输入,手写输入在手机上我们认为它已经足够简单了。但是,它的问题在于,效率存在问题。 有没有一种既高效又简单的呢?我们认为,语音输入是符合这个条件的。所以,我们认为语音输入将来在手机端一定是会占有一定比重的,这是第一个看到的点。 第二个问题,语音输入在技术上是不是已经达到可以实用的水平? 在2010年的时候,我们认为语音输入还没有达到可以实用的水平。 (编辑:ASP站长网) |