亚马逊的Alexa到底神奇在哪里(3)
语音助手包括了两个大的技术环节:语音识别(前端声学+后端识别)和语义理解(+内容聚合)。语音识别其实不涉及太多智能问题,仅仅只是AI的一个管道,智能的核心还是在于语义这个环节。语音识别和场景也密切相关,不同的场景需要不同的模型适配,这才能保证其识别率。语义更是需要场景的辅助,毕竟圈子的语言还是有很大差异性的。如果不能迈过这个门槛,语音交互的效能就会极具降低,对用户来说呈现不出来足够的吸引力。 另外一个问题就是语音助手本身也要定义一个性格,即便是冷冰冰的问答控制,也要让语音助手体现出个性来,这也包括语音合成的语调问题。比如苹果Siri很调皮,微软小冰很小色,亚马逊Echo很热心等等。当然,这更多是AI产品经理的任务,现在这个领域AI产品人才也是奇缺。 4 好的产品并不要100分的技术 Amazon的Echo显然不是百分的产品,其技术也远未成熟,但是这不妨碍Echo的热销,只要达到80分过了用户心理预期的门槛,这就是一款好产品。苹果的历代产品也都是这个路径走过来的。所以这就不要让AI技术人员过多定义产品,机器人就是个不好的例子,总是不断拔高用户预期这非常不妙。产品满足的是用户需求,而不是研发人员自我炫酷的心态。更好的产品设计应该是充分发挥技术的优势,而巧妙避过技术的缺陷。 比如麦克风阵列,Amazon采用这项技术核心就是要解决远场语音识别问题,而且这也是当前阶段唯一有效的技术方法。AI产品经理更需要了解麦克风阵列技术的优势和缺陷,将其融合到产品之中,而不是浪费很大精力钻研麦克风阵列与深度学习之间的关系,甚至总是在琢磨如何才能替代麦克风阵列,这就本末倒置,应该让专业的公司做更专业的事情。 5 没有历史包袱的产品更易成功 单从Amazon在AI领域崛起来看,国内的消费级AI战场鹿死谁手还真不一定。领先布局的BAT不一定能突围,紧跟其后的小米、华为、联想、金山也不是没有机会。从PC互联网和移动互联网的发展来看,没有历史包袱的产品更容易获得成功。说到这点总是难免会提到诺基亚、摩托罗拉、爱立信等最近十年的变化,当然PC时代会有更多的例子,只是年代比较遥远了。 事实上也简单,成熟的公司总会有成熟的架构,百度总裁张亚勤最近强调公司的中层力量可能会比较阻碍创新,这是一个事实,谁也不愿放弃舒适安逸的环境去适应新鲜的事情。毕竟,这意味着可能要放弃陪伴家庭,放弃自我休闲,所以我很敬佩创业群体,这是一群有理想还能做事情可爱的人,而事实也证明,大都是创业公司创造出了奇迹。无论百度、阿里、腾讯、小米、京东还是华为,他们曾经都是很小的创业公司,也曾经卖也卖不掉。 6 感知和认知是两个层面的问题 毋庸置疑,这也是人工智能的两个层面,感知更多关注的是数据,认知更多关注的是推理。显而易见,现在我们还在感知的阶段,这个阶段所强调的智能其实不重要,控制才重要。可以把智能看作噱头,而控制才是根本。特别是真实场景下的感知问题,这是一切AI的基础。 那么感知就牵涉到多学科融合的问题,比如真实场景下的语音识别问题,首先就是真实场景下获取数据的声学问题,这更多是一个物理学科的问题,而数据处理后又要涉及深度学习的问题,这又是一个计算机学科的问题,如何平衡这两类技术并且融合成一种新的技术体系显然也是一个难点。何况感知还包括了器件、芯片等硬件技术,比如语音识别常用的麦克风,消费级产品都是标量麦克风,矢量麦克风在数据感知上更具优势,但是怎用应用以及如何降低成本都是一个技术和产业的问题。 7核心竞争不是技术,而是产品 我们知道,技术特别是算法本身不容易形成壁垒,例如深度学习也只是一个工具。算法只是一些体现技术思路的代码,这些代码不可能形成壁垒,但是有相当高的技术门槛,这也是人工智能公司基本都以博士为主的原因。由于算法很难直接形成有商业价值的专利和标准,所以发展一定阶段就会开源,开源的结果就是训练一段时间,大家都可以训练一个还可以用的模型出来,核心问题只是怎么把这个模型优化得更好,更能落地到实际产业之中。 所以人工智能的核心竞争力不在于技术本身,而是公司的格局,格局不清晰很可能竞争不过从事AI的产品公司。比如,产品公司如果把算法做到场景里面,场景是可以形成壁垒的。比如医疗领域做到No.1,肯定就比通用的有优势,这里面不管你是通过资源支持,还是BD,都是产品公司的优势。另外场景和数据密切相关,因为收集数据是需要周期的,处理数据是需要投入巨资的,所以在特定场景下积累到一定规模的数据也是可以形成壁垒的。 因此,巨头把大量精力花在技术方面显然得不偿失,单点技术更适合创业公司来搞,因为技术从来都是苦行僧的活,创业公司的人才显然没有宽敞明亮的环境可以聊天做PR。Amazon等国外巨头的做法非常值得借鉴,投资和收购都是非常快捷的一种方式,事实上,时间才是最大的一种壁垒。 8理性看待人工智能的技术红利 很多大佬都在强调,当前AI相关的人才成本太高,这不是一个产业的好现象。简单类比来说,因为深圳的产业工人成本增高,导致很多制造产业向东南亚方向转移。其实很多人也不明白为何AI相关的技术人才会如此自信,如果从PC到移动到AI的产业变化来看,事实上漫天要价的做法并不理智,如何最快落地到某个具体场景之中,充分挖掘技术红利跟随公司成长才是明智的选择。 而且从2017年的投资案例来看,人工智能的天使融资几乎很少了,也就是说人工智能技术创业这一波基本上各就其位,各家创业公司早就不再关注PPT和DEMO了,所有的客户都会强调指标和细节,无数的细节就会折腾死一波创业公司。现在,成败的关键在于各家对于细节的把握。事实上,笔者一直在估算这波人工智能创业的低谷期,这是必将到来的,从来没有哪个行业是一帆风顺的,波浪起伏才是恒久远。这个时候,再大谈所谓的技术红利,显然也是不合时宜了。 9不要忽视人工智能的商务拓展 大型公司有没有人工智能研究院倒不是关键问题,研究院的目的也是要让技术为产品服务。关键问题是,如何解决人工智能的商务拓展问题,特别是在人工智能极其早期的情况下,还需要教育和培训市场。Amazon Echo的成功,千万不要忽视了Amazon在渠道上的优势以及市场投入方面的大手笔。 (编辑:ASP站长网) |