空气产品公司将为三星电子位于西安的第二个 3D V-NAND 芯片工厂供应空气
06-06
新一代个人AI助理之战终于打响了。
9月,三大公司发布重要公告,标志着这一节点的到来。
这三家公司分别是亚马逊、微软和OpenAI。
亚马逊在21日的秋季硬件发布会上宣布,其“老牌”语音助手Alexa终于升级,纳入大语言模型。
新的 Alexa 延迟更低,可以理解上下文,记住之前的对话,不需要来回唤醒,而且越用越会变得更加个性化。
同样是在9月21日,微软在美国纽约召开秋季发布会,宣布将从26日开始逐步向Windows 11用户推送一系列更新。
其中一项重要更新是人工智能助手Copilot。
Copilot,顾名思义,将成为用户的数字管家。
它将出现在Windows 11的侧边栏中并启用语音对话,允许用户通过它控制PC上的设置、启动应用程序或回答问题。
驱动Copilot的是OpenAI目前最先进的大语言模型GPT-4。
几天后,25日,OpenAI突然出手,发布公告《ChatGPT现在能看、能听、能说》,宣布将在未来两周内向付费用户推送新的多模态功能。
多模态ChatGPT将能够进行基于图片的对话并进行实时语音对话。
例如,如果您打开冰箱并拍照,您可以与 ChatGPT 聊天晚餐吃什么。
结合ChatGPT已经以App的形式在Android和iOS上上线,此举使得ChatGPT相比于无所不知的“大懂事”AI,更具备个人助理的能力。
除了这三家公司官方宣布相关产品升级外,谷歌上个月还被科技媒体Axios透露。
内部电子邮件显示,谷歌将利用最新的大语言模型技术彻底改造Google Assistant。
据透露,苹果已经构建了一个大型语言模型框架,并正在改进包括地图和 Siri 在内的功能。
科技巨头们正在私人助理的战场上厮杀。
上一次发生这种情况是在 8 年前:Alexa 于 2009 年首次发布,并安装在亚马逊的智能音箱 Echo 产品中。
同样是在这一年,微软还随Windows系统推出了语音助手Cortana,在中国大陆地区称为“Cortana”;谷歌在 Android 4.1 中推出了语音助手 Google Now,即后来的 Google Assistant。
那是在去年苹果随 iPhone 4S 推出 Siri 后,科技巨头随后推出了三款相互竞争的语音助手产品,拉开了上一代语音助手的混战。
然而,最初引起大众极大兴趣的语音助手,近年来却成为智能终端必备却被大家鄙视的“人工阻滞剂”。
随着去年 11 月底 OpenAI 发布 ChatGPT,流畅的对话让上一代私人助理相形见绌。
在 ChatGPT 发布前不久,据报道 Alexa 正遭受亏损和裁员。
ChatGPT 发布后,微软“杀死”了 Cortana,并于今年 8 月下线。
上一代私人助理的战争已经结束,新一代私人助理的战争已经开始。
在大语言模型技术的支持下,这一次的故事会有所不同吗? A 我们首先看一下亚马逊 Alexa、微软 Cortana 以及 OpenAI 的多模态 ChatGPT 官方给出的例子。
连接到大型语言模型的 Alexa 不再那么“机器人”。
用户可以通过说“Alexa,我冷”等非正式的话或“让这个房间看起来像 XX 团队的颜色”等抽象的话来要求 Alexa 打开空调。
用户还可以一次说出多个命令,例如“Alexa,打开洒水器,打开车库门,关闭外部灯”,Alexa 将识别并执行这些任务。
此外,用户现在可以对 Alexa 说“Alexa,让我们聊天吧”,而无需在剩下的对话中喊出 Alexa 的名字。
而且Alexa会记住用户的一些信息和偏好,所以不需要每次都向他们介绍自己。
在演示广告中,用户进入与 Alexa 的聊天模式。
用户想要举办派对,要求Alexa推荐派对主题,然后根据主题推荐合适的场地。
用户与 Alexa 讨论完所有内容后,用户询问“下周五晚上 8 点向我的朋友发送邀请电子邮件,神秘一点。
” Alexa 欣然同意并读出“你准备好度过一个难忘的夜晚了吗?”完成了吗?”发送给用户进行确认。
相比以往语音助手每一句话都得叫“Alexa”的体验,不能有连贯性,指令必须清晰明确,新的语音助手体验Alexa确实“更人性化”,相信每个智能家居用户都已经受够了如何让“小X”和“精灵”听懂指令了。
正如我们所熟悉的,它基本上类似于 iPhone 的 Siri,为您打开应用程序、播放歌曲或回答您的问题(除了显示今天的日期和天气等基本问题外,还主要向您显示网络搜索结果)。
更像是一个实用的助手。
例如,您可以要求 Copilot 帮助您“整理您的桌面”,它会以图块形式排列窗口;当你浏览网页时,你可以呼出Copilot,让它帮你总结、解释、重写网页内容;写文案和总结图表更不用说了。
更有趣的是,Copilot还具有处理图像的能力。
截图后可以直接要求Copilot去除背景、剪出人像等。
与升级后的Alexa一样,Copilot的对话体验更加“人性化”。
你可以直接要求Copilot“播放让我集中注意力的歌曲”,它会在Spotify上找到相应的播放列表。
至于OpenAI的ChatGPT,在转向多模态后也变得更加贴近生活。
正如前面提到的,你可以打开冰箱,拍张照片,然后与 ChatGPT 讨论晚餐吃什么。
在另一个官方示例中,用户向 ChatGPT 发送了一张自行车的照片,并询问其如何降低座椅。
ChatGPT提醒用户检查汽车型号,确认是否有快拆杆或用螺栓固定,并给出详细步骤。
用户还是不明白,就拍了一张座椅连接的照片,圈出了某个部位,询问是不是快拆杆。
ChatGPT 识别出这是一个螺栓,并建议使用内六角扳手。
用户随后拍摄了工具箱的照片,并询问 ChatGPT 哪一个是内六角扳手,它成功识别了它。
除了解决日常生活中的问题之外,由于具有语音功能而可以“说话”的ChatGPT还可以给孩子们讲睡前故事。
更有趣的是,当你和别人发生争执时,你还可以架起能听能说的ChatGPT,帮你理清思路,解决争执。
B 不过,无论是新推出的 Alexa、Copilot 还是多模态 ChatGPT,都有一定的使用门槛。
目前还没有 Windows 11 操作系统内置的 Copilot 收费的消息。
它应该是免费并向用户开放的,但要等待更新才能逐步推出。
在 Microsoft Office 套件中,Copilot 是一项高级订阅功能,每月价格为 30 美元。
OpenAI 的多模式 ChatGPT 仅向高级订阅者提供,称为 ChatGPT Plus,每月 20 美元。
新的 Alexa 未来可能会充电。
亚马逊秋季会议结束后,彭博社采访了即将卸任的亚马逊设备和服务部门副总裁戴维·林普(David Limp),他表示亚马逊正在“*”考虑 Alexa 订阅模式。
Limp 拒绝讨论 Alexa 如果收费的话会定价多少,他说“你今天所了解和喜爱的 Alexa 将仍然免费”,但为人工智能聊天机器人提供动力不会便宜,他承认“在云中进行模型推理的成本”。
它超大。
”战争一开始就想着如何收费,看似急功近利,其实是上一代私人助理之战的教训。
个人助理产品早已面世,其中的代表就是微软于2006年推出的Microsoft Bob。
当时,比尔·盖茨还是微软的CEO。
当年,首次登上《福布斯》全球富豪榜榜首。
但现在回想起来,鲍勃显得有些臃肿:软件显示了一个虚拟房间,就像一个私人办公室,一只卡通狗助理蹲在角落里,亲切地询问你是否需要任何帮助。
这条路没走好。
仅仅一年的时间,微软就用浓眉大眼的回形针 Clippy 取代了 Bob。
他热心地想帮你做这做那(但什么都做不好),但也没有成功。
他是批评和嘲笑的对象。
到了2018年,一切都变了。
苹果推出了 iPhone 4S,它附带了 Siri 作为“福利”——一个没有实体图像、可以通过长按 Home 键来调用的语音助手。
它可以帮助你打开申请、回答问题,甚至还可以开玩笑地给你讲笑话,这在当时是相当“未来主义”的。
科技巨头正在注意到这一点。
2018年,语音助手爆发。
主导Android的谷歌推出了Google Now(两年后升级为Google Assistant)。
主导PC操作系统的微软推出了Cortana。
亚马逊干脆开发了智能音箱设备并取代了 Alexa。
进去吧,电影《她》已经上映了。
电影中,男主角爱上了电脑操作系统的语音助手。
后者的配音者是好莱坞著名演员“寡姐”斯嘉丽·约翰逊,语音助手的界面也十分相似。
科塔娜。
电影上映后,《连线》杂志甚至报道称,一些iPhone用户感觉Siri似乎开始有了“自我意识”。
新年之前,各家公司都在更多端口推出了语音助手。
谷歌、苹果和微软都推出了智能音箱设备。
Alexa和Cortana也进行了合作,让他们可以通过自己的语音助手互相呼叫,从而实现更多的功能。
。
在国内,手机智能语音助手、智能音箱也开始涌现,包括小度、小爱同学、天猫精灵等。
不过,也正是在这个阶段,语音助手越来越受欢迎,大众对它们的评价也随之而来。
渐渐地从充满幻想变成了失望。
在中国,这些语音助手喜欢被称为“人工智障”。
人们在网上发帖询问“如何在 Cortana 弹出时将其关闭?”或者分享了智能音箱如何无法理解“关掉客厅的灯”这个简单的命令短视频。
以 Siri 为例。
Vetro Analytics 2017年的数据显示,Siri的使用率为19.6%,依赖度仅为11%,每个用户每月的平均使用时间仅为14分钟。
C 体验不佳直接影响语音助手产品的商业前景。
就在今年 11 月 ChatGPT 推出之前,媒体 Business Insider 报道称,根据其获得的内部数据,亚马逊全球数字部门第一季度运营亏损超过 30 亿美元。
该部门包括从 Echo 智能音箱、Alexa 语音技术到流媒体服务的一切。
知情人士表示,这一损失是亚马逊所有业务部门中最大的,而大部分损失可归因于Alexa。
报道估计,该部门每年的损失甚至可能达到1亿美元。
Alexa 开局良好,第一代 Echo 设备销量超过 10,000 台。
但其商业模式一直是个问题。
所有的语音助手其实都有这样的问题:提供服务,然后呢?亚马逊预计您今年购买的每台设备将损失 5 美元。
上一代语音助手没有很好的变现措施,交互体验也不好。
Alexa希望整合亚马逊的电子商务服务,但糟糕的体验无法支撑这一愿景,而且它频繁询问用户想要什么。
不要购买本身就会有损体验的东西。
用户最终与语音助手进行的大多数对话都是琐碎和例行公事的,比如今天的天气、日期、打开应用程序等,而这并不能让亚马逊赚钱。
裁员、亏损的消息传出后,亚马逊表示仍将大力发展Alexa,但外界看不到任何新的可能性。
ChatGPT的出现让一切变得不同。
一方面,存在危机。
ChatGPT 基于大语言模型的出色对话能力,让大众几乎立即将其与上一代语音助手进行比较,结论是“太糟糕了”。
问题已经改变了。
上一代语音助手如果不进步,成为大模子,可能会落后、被打。
就连苹果和谷歌也不得不警惕这种可能性。
除了谷歌今年8月被传要升级Google Assistant大语言模型外,苹果也有类似的传言。
今年 7 月,著名记者 Mark Gurman 爆料称,苹果已经完成了其大型语言模型“Ajax”的基本框架,并将其定位为支持会话式 AI 系统,并已应用于改善人工智能等功能上地图和 Siri。
在科技巨头采取行动之前,各种集成大型模型的第三方个人助理应用程序已经出现。
例如,今年6月,有人“复活”了微软Bob,使用GPT-3.5模型,并将其上架微软商店。
另一面是机会。
以Amazon Alexa为代表的智能生态想象,在5G和大机型的支持下,现在比以往任何时候都更有可能。

在今年秋季的会议上,当亚马逊宣布Alexa将全面升级时,也勾画出了一个广阔的前景:亚马逊将把大语言模型注入到多个智能家居API中,为Alexa提供更主动、无缝管理智能家居所需的工具。
背景信息。
与此同时,亚马逊正在推出一些工具,允许Alexa控制第三方产品的某些功能,而这些功能不需要包含在智能家居生态系统的工具包中。
亚马逊表示,已与通用电气、飞利浦、小米、iRobot等合作开发这些功能。
但我们现在面临的新挑战是10年前所没有的。
人工智能对个人隐私和数据安全的威胁正在受到认真对待。
无论是新的Alexa、Copilot还是多模态的ChatGPT,在走向个性化助理的过程中,都不可避免地会触及到这个问题。
目前,随着新版Alexa的发布,亚马逊将利用用户与Alexa的语音交互来训练模型的消息已经被热议。
“无论谁赢得个人代理,这都是一件大事。
因为你永远不会去搜索网站或生产力网站,你永远不会再去亚马逊(购物)。
”在今年五月的一次活动中,比尔·盖茨如此预测。
问题是,谁会赢得这场战争?或者,就像上一代语音助手之战一样,热闹过后没有赢家。
【本文由投资界合作伙伴微信公众号授权:字母榜。
本平台仅提供信息存储服务。
】如有任何疑问,请联系投资界()。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-17
06-18
06-18
06-17
06-18
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态