出道即巅峰的苹果Siri,十年之后已泯然众人,智能语音产业进入规模化深耕期

人工智源库 2022-02-16

siri人工智能语音助手

4441 字丨阅读本文需 10 分钟

2011 年 10 月,苹果首度曝光其数字助手 Siri,其肩上承担的勃勃野心可见一斑。

苹果公司高管 Phil Schiller 曾在 iPhone 4s 发布会上强调,“几十年来,技术专家们一直在嘲笑我们的这个梦想。‘类似的噱头玩了一遍又一遍,但从来没能成真。’ ”

随着新鲜感褪去,很多问题开始接连浮出水面:开放对话环境中答非所问,对使用者的口音语调设置门槛,仅能完成iOS生态内app的唤醒,十几年来功能迭代缓慢,智能、语音、助手,定位打出的三个层次,无论是拆开还是组合,Siri都没有达成使命。

作为苹果的产品序列,它就像个异类,如同私生子一般,只有创新的色彩,却失去了品牌下其他产品共有的实用基因。也正因如此,在苹果连年增长的同时,人们对Siri的热情渐渐黯淡,以至于悄悄关掉了“Hey Siri”的选项,不再唤醒。难道说,Siri的命运,仅仅是一个满足猎奇的新欢?

问题的答案,可以用数学中的三个点来寻找。

01、出道即巅峰

2011 年,刚刚诞生的 Siri 确实赢得了市场的热烈回应,评论者对其迅捷的响应速度和良好的准确性印象深刻。

媒体 The Verge 曾经断言,“Siri 最牛的地方就是它的工作原理——至少在大多数情况下,它的水平都能超出用户的预期。”;CNN 的观点则是,“它有点像我们梦想中的免费助理,随叫随到。”《纽约时报》也感慨,“Siri 帮我们节约了时间、消除了不必要的操作,并深刻改变了手机的定义。”

多么美好,苹果似乎已经兑现了自己的承诺。

但现在回看这些评论,对于 Siri 的赞誉的确有些言过其实。

Siri 当初是靠着新颖性和勃勃雄心冲昏了评论家们的头脑,但在后续使用中逐渐发现问题后,人们开始承认这款软件还仅仅处于测试阶段。那时候大家还很乐观,觉得不断推出的补丁肯定能让 Siri 逐渐成长为真正称职的个人助手。

02、奇点

奇点,在数学中指那些无法定义的点。如Siri一样的智能语音助手们,正是一个个奇点。

作为后起之秀,它们并不是老牌科技公司的主营业务,得不到百分百的关注;在技术领域仍存在的诸多未知,也让发展有了阶段性的天花板,怎样安排智能语音助手在业务板块中的位次,答案有些模棱两可。

从苹果目前的表现来看,很显然,Siri只被当作一个微不足道的功能模块。耗尽了发布之初新鲜感带来的红利,如今沦为标配,仿佛约定俗成,每一款新产品都会搭载Siri,却不见多少提升;难以成为拉高硬件销量的卖点,甚至于在HomePod中“倒戈一击”,间接导致了产品的下线。

实际上,模块化并不是唯一的选择,在奇点中,趋向无穷的点被定义为极点。与之相似,语音助手也可以成长为庞大的“极”。

发布于2014年的Amazon Alexa就是很好的例子。

在发布时间上未能抢得先机,不代表产品本身技不如人。迟到的三年,反而让Alexa得以充分进化算法。与智能音箱Echo一同问世,也表明了对产品的设想绝不仅仅是辅助性的功能模块,而是一个具备巨大增长空间的业务版块,围绕着Alexa,又会衍生出诸多触手,覆盖更广的应用场景。在产品功能上,与苹果生态的封闭性截然相反,开放的环境让Alexa拥有上万功能,包括但不限于外卖订餐、每日一问、关注球队赛况更新等。

独立的产品形态提供了“沉浸式”语音交互体验,但这并不是成功的关键。Alexa能够达到Siri难以企及的高度,更主要的原因是技术在场景中的下沉。智能音箱的形态,对应着家庭日常生活的应用场景;反过来,家庭场景就要求产品具备特定的属性,比如对不同年龄的匹配性、娱乐性、陪伴性等等,上升至功能,又对应着强语言理解能力、丰富的指令选项、自然语义联想。通过场景完善产品,再由产品锁定更加精确的市场,进一步打磨技术,这样就形成了闭环,智能语音交互才得以顺利落地。

Siri与Alexa的区别,也映射了目前涉足AI产业的企业表现的模式。如苹果一样,只把AI当作已有产品系列的附加功能,就会局限在产品本身的应用场景,结果“文不对题”,闭环无法形成;只有把场景和AI当成两个独立端点,拿产品当作衔接的纽带,才能得到螺旋上升的良性循环。

03、高处不胜寒

那么,到底是哪里出了问题?苹果(Siri)为什么就从学霸变成学渣了呢?答案其实相当复杂。

不少人认为苹果对隐私保护的过度关注,注定他们没法像谷歌那样大量收集用户数据、再利用这些资源改进自己的 AI 系统。我个人觉得这应该不是 Siri 失败的主要原因,毕竟苹果对用户隐私的“尊重”也是有条件的。

2019 年,英国《卫报》就透露苹果曾把“一小部分 Siri 录音转交给承包商进行分析,一名举报人声称其中涉及医患间的讨论、商业交易、疑似非法交易、性接触等内容。

其次,苹果是一家价值 2 万亿美元的公司,如果真的想规避由收集用户数据引发的麻烦,他们完全可以花钱来合成数据。没错,随机分析 Siri 交互当然不错,但也有其他办法可以达到相同的改进效果。

“Steve Jobs 在 Siri 推出后的第二天去世了,苹果也由此失掉了前进的方向。”另一个更有说服力的理由,是苹果内部出现了管理职能障碍。

2018 年,The Information 发布了一份关于 Siri 团队成员变动的报告。可以看到,苹果内部对于 Siri 的基本定位出现了难以调和的分歧 —— 到底该专注于搜索/检索功能,还是成长为能执行复杂任务的助手?

这些分歧源自 Steve Jobs 本人最初给 Siri 定下的框架,但随后演变成不同派系之间“争抢地盘与话语权的对抗”。于是,Siri 项目不断经历着走马换将,策略连续性的缺失让情况不断恶化。

正如一位前苹果员工在接受 The Information 采访时所言,“Jobs 在 Siri 推出后的第二天去世了,苹果也由此失掉了前进的方向。”这样的论断,确实符合 Siri 在之后多年里停滞不前的客观现实。

苹果的技术发展理念也给 Siri 压上了一块沉重的大石。

The Information 报道称,苹果公司高管 Richard Williamson 拍板决定每年只对 Siri 进行一次更新,用以匹配公司其他新款硬件和 iOS 系统的更新节奏。这显然会拖慢 Siri 的前进脚步。

但 Williamson 本人随后驳斥了这种说法,还带头在 2012 年灾难性的 Apple Maps 功能推出时提出离职。另一位同样先后参与过 Siri 与 Apple Maps 项目的高管 Scott Forstall 也在同年离职。

还有传言说苹果的“围墙花园”理念阻碍了 Siri 的进步,导致其在调用 iOS 功能时表现不错,但却很难与第三方服务顺畅对接。

确实,在筹备本篇文章时,我惊讶地发现 Siri 居然无法在几乎人人在用的 iOS 应用上实现最简单的功能。Siri 无法通过 WhatsApp 发送语音消息,无法将内容发布至 Instagram,无法在 RunKeeper 上记录跑步数据,也没法启动《纽约时报》应用的填字游戏。

当然,这种互操作性缺失也跟外部开发者的消极态度有关,但苹果不是更应该发布友好易用的工具包、鼓励其他开发商接入 iOS 生态吗?

最后再说个没得洗的问题,我让 Siri 帮我查询存储在 iOS 本机中的信息,例如“让我看看去年八月的照片”,结果它打开了浏览器、在里头搜索名为“去年八月”的图像……

相反,苹果想借 Siri 这个跳板把人们引导回他们自己那套劣质应用库里,这真的让人很不爽。

如果我向 Siri 询问路线,它就会提示我安装 Apple Maps——但你 Apple Maps 凭什么跟 Google Maps 和 Citymapper 争?如果我想给老板发封邮件,Siri 会先回答“对不起,我不能这样做”,然后引导我去 App Store 里下载苹果的默认邮件应用……拜托,我用 Outlook 的好吗?

而且这里很明显能看出苹果对于 Siri 的发展规划有多么草率,因为它在 App Store 里搜索的词条就是“手机邮箱”。这根本不是苹果官方邮件应用的名称哎,而是 iOS“邮件”应用的内部开发代号,所以这样根本啥也搜不到。这还是我认识的那个苹果吗?产品测试都没做完就把功能上线啦?

而且这最后一点,也凸显出包括 Siri 在内的、当前各类语音界面方案的最大通病。

在 Schiller 于 2011 年首次推出 Siri 时,曾一再强调 Siri 可以理解用户的意图——或者说,它能明白用户在说什么,就跟真人一样。

正是这样的心理预期,让我们对后来的 Siri 感到失望。其实如果我们认定语音界面就该像真人那样拥有一定的知识积累、生活常识和理解能力,那注定是要失望的。我们提问,它们答错;我们出题,它们懵圈 ——也许这才是正常状况。

使用中最让人难受的,往往是它们支持不了我们认为它们该支持的功能或者命令。所以每一次失败都相当于提醒了我们,别相信这个什么鬼助手。

相比之下,显示屏上的交互界面才是真正的可靠,能做什么、不能做什么都清晰可循。相较于朴实无华的菜单、导航和按钮,语音只是一种可有可无的娱乐手段。

所以我们本来对 Siri 可以没那么高期待的,都是苹果当初的爆 炸式宣传,让我们产生了不切实际的幻想。

4、智能语音产业进入规模化深耕期

随着智能化、大数据时代的到来,全球人工智能行业展现出蓬勃生机,智能语音产业也进入规模化深耕期,并保持快速增长态势。2020年,全球智能语音产业规模约为203亿美元,预计2021年,产业规模将超过250亿美元。

将视野放到中国,疫情影响及产业数字化的需求拉动,我国智能语音市场规模持续扩张,2020年市场规模达217亿元,较2019年同比增长31%,预计2021年可达到285亿元,同比增速达到44%。智能语音成为行业数字化不可或缺的「增长基石」。

目前,我国智能语音市场参与者众多,呈现出差异化竞争态势。作为大型智能语音科技企业的代表,科大讯飞凭借较强的研发优势,以60%的市场份额稳居第一,竞争优势明显。

以阿里、百度等为代表的互联网巨头,凭借其庞大的用户资源、各细分场景的数据积累,在语音交互技术领域持续发力,占据约20%的市场份额。

其他智能语音参与者,如捷通华声、智臻智能、思必驰、云知声等,总体份额小于 20%,但近年来凭借技术和产品创新快速成长,以垂直领域和细分场景为突破口,实现企业快速增长。

当前,我国智能语音企业持续推进「平台+赛道」发展模式,一方面通过开放平台为开发者提供场景创新的技术支持,一方面凭借自身优势持续拓展智慧教育、医疗、城市、车载、家居等赛道,构建产业生态圈。

在谋划产业布局的同时,我国智能语音企业不断加大技术创新,取得了突破性进展。在语音合成、语音识别、声音检测、语音交互等方面,以科大讯飞为代表的中国智能语音企业的在多项国际赛事中夺冠,推动关键技术快速进步,用户体验得到明显改变。

5、围绕企业级、消费级两大市场智能语音落地持续推进

智能语音技术像水和电一样,正逐渐融入人们生活的方方面面,围绕2B企业级市场和2C消费级市场,智能语音相关应用落地正渐次绽放。

聚焦企业级市场,智能语音在智慧教育、智慧医疗、智慧城市、智慧制造等领域大展身手。教育行业方面,智能语音可应用于客服咨询、课堂管理、线上教学、口语测评等,推动教育行业智慧化转型加速。在「双减」政策下,更是对师生的减负增效、因材施教意义重大。

在医疗领域,我国互联网医疗健康市场规模2020年已达到1961亿元,预测2021年将达到2831亿元。智能语音应用更加多元,从单一的语音识别病例及导诊技术,向语音+语义的智能化语音辅助系统转型。

智慧制造领域,在工业品声纹质检、智能语音调度与通信、工业设备运维检修等应用场景下,智能语音助力工业智能化转型,推动智慧制造产业化升级加速。

在消费级市场,智能语音在智能办公、智能车载、智能手机、可穿戴设备、智能家居等领域大有可为。

语音交互是智能车载的核心模块,智能车载正在从后装向前装市场渗透,语音识别及交互功能前装标配搭载率从2019年的49.82%提升至63.25%,预计2025年国内前装车载语音市场规模约为32亿元。

智能办公产品需求增加,翻译机、办公本、录音笔等智能语音产品应用加速,预计2030年仅我国翻译机市场规模将达到56.2亿元。

物联网带动智能家居产业发展,智能音箱不再是绝对主角。IDC数据显示,2020年全年中国智能家居设备市场出货量为2亿台,预计2021年接近2.6亿台。

此外,智能手机、可穿戴设备领域市场空间广阔,智能语音助手搭载率不断提升。Strategy Analytics预计,到2023年前,90%的智能手机都将会配置AI语音助手,推动中国语音助手市场规模进一步扩大。

产业「升维」共建人工智能繁荣生态

面向未来,我国智能语音产业的机遇与挑战并存。

当下智能语音产业也面临一些挑战:关键核心技术有待突破,解决社会重大命题的系统性创新需求增大,受美制裁升级影响行业整体发展,互联网巨头入局致使行业市场竞争激烈,相关专业人才缺口较大等。

比如在关键核心技术上,无监督学习、低资源模型算法等需要突破;作为算力基础的AI芯片领域,我国与国际先进水平仍存在差距;随着场景从单一场景向复杂场景转变,数据类型需从单模态向多模态发展。在人才方面,预计当前我国人工智能产业内有效人才缺口达30万,智能语音相关人才稀缺。

而智能语音下一步发展的关键创新点,是无监督学习、多模态融合、脑科学交叉融合创新和系统性创新等,并应聚焦开源算法平台构建和重点领域创新的科技攻关,同时应着力提升用户隐私的安全性。

万物互联时代,智能语音在2B和2C领域应用前景广阔。未来,智能语音企业的竞争将更多集中在应用场景拓展和服务能力提升方面。

来源:新眸,InfoQ,新智元

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:人工智源库
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...