智能语音助手为何离我们越来越远了?

你或许曾幻想过,拥有一个像电影《钢铁侠》贾维斯一样的AI管家,它可以进行独立思考,还能帮你处理各种生活事务。

随着时间的推移,人工智能已化身为手机语言助手出现在我们的生活中。

我们熟悉的苹果siri、华为小艺、三星Bixby、小米小爱同学、OPPO小布、vivo Jovi等都是语音助手的典型代表,很多交互功能通过语音助手基本可以实现,比如我们可以很轻松的借助语音助手实现一系列诸如开关空调、开启电视、打开窗帘等操作。

当然,这一切的前提是要有一套智能家居。

一段时间,语音助手成为手机厂商新品发布会上的必讲环节,总是会重点展示。

然而,回顾今年的新品发布会,语音助手已经很少再被提及,这样恰恰反映出语音助手的尴尬处境。虽然语音助手的覆盖面在一步步提升,但是其使用率却始终没有太大的突破。

以苹果的Siri为例,据Verto Analytics调研机构统计,其使用率为19.6 %,依赖度仅为11%,每位用户每月平均使用时间大致只有14分钟。

👇

是什么原因,让我们远离了语音助手呢?

01

场景受限

没有想象的那么善解人意

作为一项全新的交互方式,语音助手相比以往的触控逻辑,可以解放我们的双手,通过口令来帮用户实现很多功能操作,比如播放歌曲、查天气日期、打开APP、发短信、打电话、叫外卖、设闹钟、寻找手机等等。

而借助人工智能技术,语音助手还会不断学习用户的使用习惯,提升交互体验。

一些手机厂商还为用户提供了自定义指令,通过设置的关键词触发指令,可以实现多项功能的同时调用。例如,当我们发出“我要运动”的语音指令,智能语音助手就会帮我开启蓝牙、打开音乐软件、将音量调节至50%等一些列操作。

但,尽管手机上语音助手的功能越来越丰富,体验在不断提升,但用户的使用率却不高。

究其原因,一是使用场景有限,二是效率不高。

在场景使用方面,手机作为移动设备,人们使用的场景更加多样,可能是通勤上下班的路上、公司、商场或者一家咖啡馆……

这些公共场合并不适合使用语音助手,因为我们很难在地铁或是公司里喊一声“Hi XX”唤醒语音助手,然后让它来帮你打个电话或者给某人发个消息,这难免会有些尴尬。

即便你愿意通过语音去操控,还需要考虑隐私的问题,绝大多数人不会选择在公共场合让语音助手帮忙发个信息,或者让语音助手说出你刚才搜索的信息。那看起来有点儿傻……

当然,家里或是开车时是语音助手适合的使用场景,利用语音助手发消息或是设置导航等,在一些相对私密的场景中语音助手便可以帮助用户解决一些问题。

那语音助手“效率不高”又该如何理解?

我们可以用闹钟来举一个例子,如果你对语音助手说“定一个8点的闹钟”,语音助手下一句可能会问你是“明天8点的闹钟”,还是“晚上8点的”?而如果要关某一个闹钟的话,那可能更麻烦,你还得告诉语音助手你要删第几个……

而在这样的反复确认中,语音助手可能真不比你用手操控的效率更高。

另外,很多时候语音助手是与智能家居相连接的,而用语音助手操控智能家居需要精准的识别率,就像上面的视频所展现的一样,一旦语音助手理解有偏差,不但没有提升体验,反而会引来很多麻烦。

这些体验上的不友好,最终导致语音助手在日常中的使用效率并不高,甚至很多时候用户需要去迎合它,才能最终实现想要的操作。

说到底,目前的语音助手还处在一个比较初级的阶段,只能去完成特点的指令操作,而无法真正的像人类一样和用户进行对话和服务。

02

语音助手有待完善

人工智能还有更多选择

语音助手在手机上出现已有近十年时间,但实际体验与用户期望还存在着差异,这就需要手机厂商和科技企业在功能和体验上持续更新和升级。

相信随着技术的发展,语音助手在未来能够像人一样与用户进行交流,理解并实现需求。

人工智能技术在语音助手上的实现虽然有些坎坷,但在其他应用上却已经驾轻就熟。

我们体会最多的应该是AI拍照了,智能手机基本上都具备AI拍照功能。在AI技术的加持下,在我们拍照的时候,会根据拍照时的天气、光线、饱和度等等因素,通过计算然后由系统给出最优的方案,大幅提升了我们的拍照体验。

另外,通过AI技术还能够实现实时拍照翻译,整个应用使用流程与正常拍照类似,简单易用,而且有很多手机厂家还做到了离线翻译的,这也是非常高频的AI应用。

FaceID 是苹果首推创新应用,面部识别,不需要密码,AI手机通过机器学习,可以随着用户日常使用,逐步适应用户脸部变化,精准完成认证解锁功能。

截止目前,华为、荣耀、OPPO、vivo、小米等品牌的诸多手机型号均已搭载面部识别功能,而这项功能也成为了当下主流智能手机的标配。

随着人工智能应用的加速落地,对于底层AI芯片也提出了更高的需求。AI芯片可以提升手机的运行性能,使得智能手机能够获得更为强大的运算能力,以提升手机的使用体验。

以今年旗舰芯片高通骁龙888为例,AI 算力达到了26TOPS(1TOPS代表处理器每秒钟可进行一万亿次(10^12)操作),这是上一代骁龙 865的近2倍。

综合来看,人工智能在智能手机领域的落地,不仅为智能手机提供了新方向,也为自身的市场扩展赢得了新机遇。但对于语言交互,还远未达到我们期望的那个“助手”。

当然,“不积跬步无以至千里”,我们更加期待未来语音助手质变的精彩。

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注