腾讯投资航空科技公司飞翔互联
06-17
雷锋网注:本文讲的是作者、李智勇、程序员走上栈道十年。
他们有一个有趣的绰号:zuomoshi(思考事情)。
从CES的进展来看,谷歌确实在搞乱语音交互,而且越来越成为一家很有能力修补但不太成功的公司。
谷歌不太可能在公共云上超越亚马逊。
它多年来一直在自动驾驶领域苦苦挣扎,但看起来很可能会失败。
谷歌在语音交互方面很可能再次输给亚马逊。
语音助手大PK 今年CES上最引人关注的就是语音交互产品的泛滥。
从英伟到联想,各大企业对此达成共识,纷纷入局。
这里的两个核心产品是亚马逊和谷歌。
前者的代表产品是Echo和内置语音助手Alexa,后者是Google Home和内置语音助手Google Assistant。
一般来说,无论从哪个维度,谷歌都有足够的优势,有技术、有资源、有积累。
但从具体情况来看,谷歌其实还远远落后,甚至可能难以挽回。
想要了解语音交互方向的根本趋势,就需要深入了解相关产品和技术的本质特征。
Echo产品的核心特点是多层技术(声学、语音识别、语义、搜索、内容)的高度融合。
其中,声学是软件和硬件的分离点。
向下与产品ID、内部结构相关,向上影响语音识别。
语义之后的部分是纯软件和内容。
对于亚马逊、谷歌这样的公司来说,他们本质上将自己定义为生态系统和平台公司,所以他们的核心一定不是Echo的硬件产品本身,而是其背后的Alexa这样的语音助手,因为只有Alexa代表了一个新的生态。
很多人认为Alexa这个语音助手是一个和Android一样的操作系统,但其实把它看成一个操作系统+超级App更合适。
将Alexa等语音助手安装到各种硬件中实际上有两种方法:一种是纯软件方式。
我就做个语音助手,谁想用就安装吧。
在这种模式下,技术层面最多需要深入到语音识别,核心是语义和对话。
该模型最明显的参考是搜索引擎。
一是软硬件一体化。
我会做一个基准硬件产品,然后在硬件产品中打开助手。
此模型最明显的参考是 Android 等操作系统。
纯互联网公司会更喜欢第一种方式,因为这种模式是最轻的,而后一种模式需要组织生产和销售,而且还深入到音响层面,无疑要重很多。
但模式一有两个核心问题:1、语音交互在现有平台(手机、平板、电脑)上启动困难,直接将语音交互从近场迁移到远场效果不佳。
谁来解决着陆过程中的各种坑洼问题? 2、如果不了解硬件需求,如何设计适配各种硬件的API,如何知道如何为硬件厂商提供最便捷的解决方案?这个辛苦的工作是否应该完全委托给各个硬件厂商自己探索呢?谷歌针对ASR和NLP的开放API其实已经开放很长时间了,但从CES的结果来看,显然Alexa的系统集成方案更受欢迎。
不仅解决了与底层硬件的适配问题,还解决了后端内容的适配问题。
整合问题。
从更高的层面来看,我们可以说,做语音助手其实有几个关键控制点: 1、做一个标杆的硬件产品,但不要与现有的用户习惯冲突。
说白了,新品类一定要避开手机和PAD,否则肯定会被覆盖。
2.丰富后端内容。
对于语音助手来说,硬件、音乐甚至打电话都是内容。
内容需要从头部开始逐渐填充长尾内容。
推而广之,我们需要将 Alexa 和Echo产品分开,以便它们背后有尽可能多的东西。
3.建立技术优势,技术既包括深度学习等纯算法,也包括声学等与物理密切相关的领域。
当内容不够大时,前端技术(声学和语音识别)比语义更重要。
因为它们更影响速度和准确性。
亚马逊做对了什么?亚马逊几乎正确地理解了上一节中提到的所有要点。
首先,亚马逊没有回避硬件的麻烦,花了四五年时间打造Echo。
这样一来,亚马逊就拥有了难以超越的制高点。
这看起来很奇怪,但事实就是如此。
否则,谷歌就只开放Google Assistant,就没有必要打造Google Home了。
但事实上,硬件与其背后的助手之间的耦合程度远高于搜索与浏览器之间的耦合程度。
搜索和浏览器的耦合度其实是方便和不方便的,但是Alexa和前端硬件的耦合度就涉及到易用性的问题。
谷歌在Echo的压力下才开始生产 Google Home。
其次,在Echo取得初步成功后,亚马逊迅速开始将Echo和Alexa分开。
具体行动包括完善SDK(ASK&AVS)的文档和案例、建立Alexa基金、积极寻找战略合作伙伴等。
最终结果之一就是所谓的技能。
这个技能是一个非常可怕的东西。
足以弥补技术和一些内容上的缺陷。
这就像淘宝上的商家数量一旦超过一定阈值,QQ流量再大也应付不了。
Google 现在有多少个第三方合作伙伴?它只有一个。
而谷歌似乎还在徘徊。
作为后来者,它一上来就应该把这些事情都做好,这样才能体现出后来者的优势,但它没有。
第三,用扎实的解决方案创造更好的体验。
稳妥的解决办法是,前端至少要和亚马逊看齐,后端要体现语义和内容连接上的优势,这样才能全面超越。
但谷歌有趣的是选择了两麦克风的方案,这直接导致了交互效果不佳。
这实在是一个愚蠢的举动。
从便宜的角度来解释是合理的,但你做的是标杆产品。
便宜不便宜真的那么重要吗?推而广之,这意味着什么?这意味着谷歌可能很难赶上亚马逊。
谷歌和亚马逊在技术层面无疑会占据优势,但如果我们分解技术,我们会发现谷歌实际上可能只在NLP和搜索部分有优势。
这很可怕,因为NLP部分没有质的区别。
此时仅依靠算法无法显着改善体验。
而当内容不够大时,搜索的优势根本无法体现。
一旦技术突破,亚马逊将在这方面积累足够的数据。
请注意,这里的数据是与场景完全匹配的数据,而不是匹配度较低的网页公开数据,其中还包括各种用户偏好。
这个时候,没有人会扮演与谷歌陪练的角色,重来一遍。
谷歌似乎又搞砸了。
在过去很长一段时间里,谷歌这个公司一直有点神话,让人们潜意识里认为它是无所不能的。
然而,谷歌并不是一家制造产品的公司。
我们可以将其定义为做算法的公司或者痴迷于算法的公司。
如果谷歌真的在语音交互上大举发力,核心原因可能就在这里。
做算法的时候,技术是第一维度,但做产品的时候,体验是第一维度。
你不能转身玩:我的技术很酷,所以我想把它放到产品里,所以用户必须付费。
。
相反,我们必须换个角度来思考。
比如延迟、响应率、回答准确率都会影响用户在这类产品上的体验,所以我想在现有技术的基础上,把这种体验最大化。
从显示的行为来看,Google 属于前一类。
从这个角度来看,选择上述的双麦克风方案来实现Google Home也是合理的。
例如,如果你想在云端使用深度学习来处理前端信号问题,并且你坚信它能做好,那么选择前端解决方案就没有问题——只要继续改进即可后端的算法。
但这样一来,产品体验就会大打折扣。
如果谷歌是第一个发布这种产品并且时间窗口很大的话,那问题不大。
关键不是它需要这样的产品来与亚马逊的Echo竞争,这很可怕。
如果你是后来者,即使达到同等水平,也没有任何优势,更何况还落后一点。
挑战新技术在工程师的思维下是合理的,但在产品思维下却是大错特错。
类似的问题还有很多,例如除了“OK Google”之外,该如何称呼你的唤醒词。
作为智能助手,Alexa显然更适合这种拟人化的场景。
Google Home问世后,应该向各大厂商大力推广Google Assistant,而不是睡在现有的优势上(Google在技术、不同设备关联、内容等方面都有优势,毕竟有Youtube等)。
但从CES来看,谷歌并没有忙着做这件事。
至少到现在为止,我们还看不到Google版的Alexa Service Kit和Alexa Voice Service。
看来谷歌和亚马逊之间至少有一年的差距。
对于构建产品的用户来说,选择依赖哪家公司甚至不是考虑的问题。
一方面有很多开放API的第三方客户,另一方面没有开放API,只有一个第三方客户。
如果是你,你也会做出同样的选择! (软硬件打通、API封装到这个程度还是非常困难的,不信的话看看这个文档:alexa-avs-sample-app 总结 Google的业务最依赖云,但是事实上,相比亚马逊,谷歌是最先推出自动驾驶的,但看起来谷歌在人工智能方面投入最多。
目前的进展,如果前两次都失败了,它很可能会再次输给亚马逊,这一次是非常不同的,因为这里的交互是搜索,如果输了,它就变得输不起。
另微软禁止未经授权转载。

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-17
06-18
06-17
06-18
06-17
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态