语音识别进化简史,从造技术到建系统

美国知名投资机构Mangrove Capital Partners在《2019年语音技术报告》中,给语音下了一个宏大的定义—欢迎下一代的颠覆者。可如果把时间倒退10年,大部分人还是会把“语音交互”定义为一场豪赌,都知道赢面比较大,却迟迟不敢下注,因为概念的落地还没有一个明确的期限,当正确的路径被走通之前,永远都存在不确定性。不过在此前的80年里,人类对语音技术的希望从未破灭,就像是在迷宫中找寻出口一般,一遍又一遍地试错,最终找到了正确的路径。

语音识别进化简史,从造技术到建系统

漫长的孩提时代

语音识别进化简史,从造技术到建系统

跃进的少年时代

语音交互的“诱惑”

可以借鉴脑学界“感官侏儒”的说法,手和舌头是人类最灵活的两个部分,从DOS系统到施乐的图形化界面再到移动设备的触控交互,无不依赖于手的交互。而当语音技术和人工智能同时走向成熟,或许就像 《2019语音技术报告》中所描述的:“语音交互扭转了以往人机交互的存在形态,用户与设备间基于语音交互的全新关系开始搭建,与之前互联网向移动互联网过渡一样,其对底层平台的全新需求也在酝酿当中。”甚至不排除语音优先的可能,亚马逊Alexa首席科学家Rohit Prasad曾直言:“我们希望消除与客户的摩擦,最自然的方式就是通过声音。它不仅仅是一个能提供一堆结果的搜索引擎,它还会告诉你答案。”言外之意,语音技术可以帮助人们摆脱文字和屏幕的束缚,提供一种升维的用户体验。

巨头们的新战场

接过前辈们的衣钵,Google、百度等巨头并非没有“私心”。因为在语音交互成为人机交互主流方式的同时,也在重构现有的商业规则。比如在触控交互的世界里,人们与服务的连接通过这样或那样的App,生活中也出现了社交、搜索、电商、资讯等领域的诸多超级App,但语音交互是典型的服务找人,诸如搜索、电商、社交、广告等主流的盈利路径都将被重构,乃至颠覆现有的市场格局。

一个典型的例子,不管是国内百度的小度、天猫精灵、小爱同学,还是Google Assistant、亚马逊Alexa,早已不再满足于“语音助手”的身份,在功能上开始向语音对话、内容服务、IoT设备管理等方向演进,在场景上覆盖了家庭、汽车、酒店等等,以语音交互为切入的生态系统早已有了雏形,成为触控之外的又一个杀手级应用。白山科技

语音识别进化简史,从造技术到建系统

▲典型的场景就是智能音箱,亚马逊、谷歌、百度、小米、阿里等无不开始在智能音箱领域发力。

同时语音的颠覆性也逐渐浮出水面,原先想要听一首歌、看一部电影的时候,需要在手机上打开特定的App,手动输入歌曲或电影的名字,在一连串的搜索结果中找到自己需要的。语音交互的场景下,只需要发出相应的语音指令,设备就可以自动播放你想要的歌曲或视频,不仅在效率上指数级提升,也在改变音乐或视频服务方的地位,从前端走向后台的内容供应商。

截止到目前,几乎所有的互联网巨头都对语音势在必得,尤其是在炙手可热的智能音箱赛道上,国外出现了谷歌、亚马逊、苹果等巨头林立的局面,国内的百度、阿里、小米直接拿到了90%的市场份额,并且有着一家独大的趋势。

原创文章,作者:dongshuai,如若转载,请注明出处:http://boke.6ke.com.cn/?p=32082

发表评论

登录后才能评论

联系我们

400-800-8888

在线咨询:点击这里给我发消息

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息