请查收!2021中国(湘潭)工业软件产业创新创业大赛西南赛区决赛现场实录派送中
06-17
新一代个人AI助理之争终于打响。
9月,三大公司发布重要公告,标志着这一节点的到来。
这三家公司分别是亚马逊、微软和OpenAI。
亚马逊21日在秋季硬件大会上宣布,“老牌”语音助手Alexa终于升级,融入大语言模型。
新的 Alexa 延迟更低,可以理解上下文,记住之前的对话,不需要来回唤醒,而且越用越会变得更加个性化。
同样是在9月21日,微软在美国纽约召开秋季发布会,宣布将从26日开始逐步向Windows 11用户推送一系列更新。
其中重要的更新之一是人工智能助手副驾驶。
Copilot,顾名思义,将成为用户的数字管家。
它将出现在Windows 11的侧边栏中并启用语音对话,允许用户通过它控制PC上的设置、启动应用程序或回答问题。
驱动Copilot的是OpenAI目前最先进的大语言模型GPT-4。
几天后,25日,OpenAI突然出手,发布公告《ChatGPT现在能看、能听、能说》,宣布将在未来两周内向付费用户推送新的多模态功能。
多模态ChatGPT将能够进行基于图片的对话并进行实时语音对话。
例如,如果您打开冰箱并拍照,您可以与 ChatGPT 聊天晚餐吃什么。
结合ChatGPT已经以App的形式上线Android和iOS的事实,这一举措使得ChatGPT相比于无所不知的“大懂事”AI,更加具备个人助理的能力。
除了这三家公司官方宣布相关产品升级外,谷歌上个月还被科技媒体Axios透露。
内部电子邮件显示,谷歌将利用最新的大语言模型技术彻底改造Google Assistant。
据透露,苹果已经构建了一个大型语言模型框架,并正在改进包括地图和 Siri 在内的功能。
科技巨头们正在助理个人的战场上厮杀。
上一次出现这样的场景已经是8年前的事了:Alexa于2009年首次发布,并安装在亚马逊的智能音箱Echo产品中。
同样是在这一年,微软还随Windows系统推出了语音助手Cortana,在中国大陆地区称为“Cortana”;谷歌在Android 4.1上推出了语音助手Google Now,也就是后来的谷歌助手的Google Assistant。
那是在去年苹果随 iPhone 4S 推出 Siri 后,科技巨头相继推出了三款相互竞争的语音产品,拉开了上一代语音产品的混战序幕。
然而,最初引起公众极大兴趣的语音助理,却成为近年来智能终端必备却被大家鄙视的“人工智障”。
随着去年11月底OpenAI发布ChatGPT,流畅的对话让上一代助理相形见绌。
在 ChatGPT 发布前不久,据报道 Alexa 正遭受亏损和裁员。
ChatGPT 发布后,微软“杀死”了 Cortana,并于今年 8 月下线。
上一代助理个人之战已经结束,新一代助理个人战争已经开始。
在大语言模型技术的支持下,这一次的故事会有所不同吗? 01 我们先看一下亚马逊Alexa、微软Cortana以及Future的多模态ChatGPT官方给出的例子。
连接到大型语言模型的 Alexa 不再那么“机器人”。
用户可以通过说“Alexa,我冷”等非正式的话或“让这个房间看起来像 XX 团队的颜色”等抽象的话来要求 Alexa 打开空调。
用户还可以一次说出多个命令,例如“Alexa,打开洒水器,打开车库门,关闭外部灯”,Alexa 将识别并执行这些任务。
此外,用户现在可以对 Alexa 说“Alexa,让我们聊天吧”,而无需在剩下的对话中喊出 Alexa 的名字。
而且Alexa会记住用户的一些信息和偏好,所以不需要每次都向他们介绍自己。
在演示广告中,用户进入与 Alexa 的聊天模式。
用户想要举办派对,要求Alexa推荐派对主题,然后根据主题推荐合适的场地。
用户与 Alexa 讨论完所有内容后,用户询问“下周五晚上 8 点向我的朋友发送邀请电子邮件,神秘一点。
” Alexa 欣然同意并读出“你准备好度过一个难忘的夜晚了吗?”完成了吗?”发送给用户进行确认。
与助手以往每句话都要叫“Alexa”的语音体验相比,不能有连贯性,指令必须清晰明确。
Alexa确实“更人性化”,相信每个智能家居用户都已经受够了如何让“小X”和“精灵”听懂指令了。
正如我们所熟悉的,它基本上类似于 iPhone 的 Siri,为您打开应用程序、播放歌曲或回答您的问题(除了显示今天的日期和天气等基本问题外,还主要向您显示网络搜索结果)。
更像是一个实用的助手。
例如,您可以要求 Copilot 帮助您“整理您的桌面”,它会以图块形式排列窗口;当你浏览网页时,你可以呼出Copilot,让它帮你总结、解释、重写网页内容;写文案和总结图表更不用说了。
更有趣的是,Copilot还具有处理图像的能力。
截图后可以直接要求Copilot去除背景、剪出人像等。
与升级后的Alexa一样,Copilot的对话体验更加“人性化”。
你可以直接要求Copilot“播放让我集中注意力的歌曲”,它会在Spotify上找到相应的播放列表。
至于OpenAI的ChatGPT,在转向多模态后也变得更加贴近生活。
正如前面提到的,你可以打开冰箱,拍张照片,然后与 ChatGPT 讨论晚餐吃什么。
在另一个官方示例中,用户向 ChatGPT 发送了一张自行车的照片,并询问其如何降低座椅。
ChatGPT提醒用户检查汽车型号,确认是否有快拆杆或用螺栓固定,并给出详细步骤。
用户还是不明白,就拍了一张座椅连接的照片,圈出了某个部位,询问是不是快拆杆。
ChatGPT 识别出这是一个螺栓,并建议使用内六角扳手。
用户随后拍摄了工具箱的照片,并询问 ChatGPT 哪一个是内六角扳手,它成功识别了它。
除了解决日常生活中的问题之外,由于具有语音功能而可以“说话”的ChatGPT还可以给孩子们讲睡前故事。
更有趣的是,当你和别人发生争执时,你还可以架起能听能说的ChatGPT,帮你理清思路,解决争执。
02 不过,无论是新的Alexa、Copilot还是多模态的ChatGPT,都有一定的使用门槛。
目前还没有 Windows 11 操作系统内置的 Copilot 收费的消息。
它应该是免费并向用户开放的,但要等待更新才能逐步推出。
在 Microsoft Office 套件中,Copilot 是一项高级订阅功能,每月价格为 30 美元。
OpenAI的多模式 ChatGPT 仅向高级订阅者提供,称为 ChatGPT Plus,每月 20 美元。
新的 Alexa 未来可能会充电。
亚马逊秋季会议结束后,彭博社采访了即将卸任的亚马逊设备和服务部门副总裁戴维·林普(David Limp),他表示亚马逊正在“*”考虑 Alexa 订阅模式。
Limp 拒绝讨论 Alexa 如果收费的话会定价多少,他说“你今天所了解和喜爱的 Alexa 将仍然免费”,但为人工智能聊天机器人提供动力不会便宜,他承认“在云中进行模型推理的成本”。
它超大。
”一开始就想着如何冲锋陷阵,看似急功近利,其实是上一代人与助理个人战斗的血泪教训。
个人助理产品早已出现,其中的代表就是微软于2007年推出的Microsoft Bob。
当时比尔盖茨还是微软的CEO,首次出现在当年的《福布斯》上。
名列全球富豪榜榜首。
但现在回想起来,鲍勃显得有些臃肿:软件显示了一个虚拟房间,就像个人办公室一样,助手这只卡通狗蹲在角落里,亲切地询问是否需要帮助。

这条路没走好。
仅仅一年的时间,微软就用浓眉大眼的回形针 Clippy 取代了 Bob。
他热心地想帮你做这做那(但什么都做不好),但也没有成功。
他是批评和嘲笑的对象。
到了2018年,一切都变了。
苹果推出了iPhone 4S,它附带了Siri作为“额外福利”——一个没有实体图像的语音助手,可以通过长按Home键来呼出。
它可以帮助你打开申请、回答问题,甚至还可以开玩笑地给你讲笑话,这在当时是相当“未来主义”的。
科技巨头正在注意到这一点。
2017年,语音通信爆发。
主导Android的谷歌推出了Google Now(两年后升级为Google Assistant),主导PC操作系统的微软推出了Cortana,而亚马逊干脆开发了智能音箱设备并封杀了Alexa。
进去吧,电影《她》已经上映了。
电影中,男主角爱上了电脑操作系统的配音者助手。
后者的配音者是好莱坞著名演员“寡姐”斯嘉丽·约翰逊,与助手配音的界面十分相似。
科塔娜。
电影上映后,《连线》杂志甚至报道称,一些iPhone用户感觉Siri似乎开始有了“自我意识”。
新年之前,各家公司都在更多端口上线了语音助手。
谷歌、苹果和微软都推出了智能音箱设备。
Alexa 和 Cortana 也进行了合作,可以让你通过自己的声音来呼叫对方助手,从而实现更多的功能。
。
在国内,手机智能语音助手和智能音箱也开始出现,包括小度、小爱、天猫精灵等。
不过,也正是在这个阶段,助手语音越来越受欢迎,公众对他的评价逐渐从充满幻想变成了失望。
在中国,助手喜欢称这些声音为“人为弱智”。
人们在网上发帖询问“如何在 Cortana 弹出时将其关闭?”或者分享了智能音箱如何无法理解“关掉客厅的灯”这个简单的命令短视频。
以 Siri 为例。
Vetro Analytics 2017年的数据显示,Siri的使用率为19.6%,依赖度仅为11%,每个用户每月的平均使用时间仅为14分钟。
03 体验不佳直接影响语音助手产品的商业前景。
就在今年 11 月 ChatGPT 推出之前,媒体 Business Insider 报道称,根据其获得的内部数据,亚马逊全球数字部门第一季度运营亏损超过 30 亿美元。
该部门包括从 Echo 智能音箱、Alexa 语音技术到流媒体服务的一切。
知情人士表示,这一损失是亚马逊所有业务部门中最大的,而大部分损失可归因于Alexa。
报道估计,该部门每年的损失甚至可能达到1亿美元。
Alexa 开局良好,第一代 Echo 设备销量超过 10,000 台。
但其商业模式一直是个问题。
所有助手的声音其实都存在这样的问题:他们提供服务,然后呢?亚马逊预计您今年购买的每台设备将损失 5 美元。
上一代语音助手没有很好的变现措施,交互体验也不好。
Alexa希望整合亚马逊的电子商务服务,但糟糕的体验无法支撑这一愿景,并且频繁询问用户想要什么。
不要购买本身就会有损体验的东西。
最终,用户与 Voice 助手 进行的大部分对话都是琐碎且例行公事的,比如今天的天气、日期、打开应用程序等,而这并不能让亚马逊赚钱。
裁员、亏损的消息传出后,亚马逊表示仍将大力发展Alexa,但外界看不到任何新的可能性。
ChatGPT的出现让一切变得不同。
一方面,存在危机。
ChatGPT基于大语言模型的出色对话能力,让大众几乎立即将其与上一代语音助手进行了比较,结论是“太糟糕了”。
问题已经改变了。
上一代配音演员助手如果不进步,成为大模特,可能会落后,被打。
就连苹果和谷歌也不得不警惕这种可能性。
除了今年8月谷歌被传要用大语言模型升级谷歌助手之外,苹果也有类似的传言。
今年 7 月,著名记者 Mark Gurman 爆料称,苹果已经完成了其大型语言模型“Ajax”的基本框架,并将其定位为支持会话式 AI 系统,并已应用于改善人工智能等功能上地图和 Siri。
在科技巨头采取行动之前,各种集成大型模型的第三方个人应用程序已经出现。
例如,今年6月,有人“复活”了微软Bob,使用GPT-3.5模型,并将其上架微软商店。
另一面是机会。
以Amazon Alexa为代表的智能生态想象,在5G和大机型的支持下,现在比以往任何时候都更有可能。
在今年秋季的会议上,当亚马逊宣布Alexa将全面升级时,也勾画出了一个广阔的前景:亚马逊将把大语言模型注入到多个智能家居API中,为Alexa提供更主动、无缝管理智能家居所需的工具。
背景信息。
与此同时,亚马逊正在推出一些工具,允许Alexa控制第三方产品的某些功能,而这些功能不需要包含在智能家居生态系统的工具包中。
亚马逊表示,已与通用电气、飞利浦、小米、iRobot等合作开发这些功能。
但我们现在面临的新挑战是10年前所没有的。
人工智能对个人隐私和数据安全的威胁正在受到认真对待。
无论是新的Alexa、Copilot还是多模态的ChatGPT,在走向个性化助理的过程中,不可避免地会触及这个问题。
目前,随着新版Alexa的发布,亚马逊将利用用户与Alexa的语音交互来训练模型的消息已经被热议。
“无论谁赢得个人代理,这都是一件大事。
因为你永远不会去搜索网站或生产力网站,你永远不会再去亚马逊(购物)。
”在今年五月的一次活动中,比尔·盖茨如此预测。
问题是,谁会赢得这场战争?又或许就像上一代声优中的助手之战,热闹过后就没有赢家。
参考文献: 1.IT之家:《“大眼夹”重生,变身 ChatGPT 聊天机器人》 2.智能物联网:《昨夜微软与亚马逊“联姻” 还抛出5道AI杀手锏》 3.金融行业:《从“全村的希望”到“大裁员”,亚马逊是如何摧毁Alexa 的?》 4.钛媒体:《智能手机之争的下半场:语音助手之战》 【本文由投资界合作伙伴微信公众号赞助:Alphabet列表授权发布,本平台仅提供信息存储服务。
】如有任何疑问,请联系投资界()。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-18
06-18
06-08
06-18
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态