首页 > 科技未来 > 内容

新“Siri”之争已经打响,微软、亚马逊、OpenAI纷纷入局

发布于:2024-06-18 编辑:匿名 来源:网络

新一代个人AI助理之争终于打响。

9月,三大公司发布重要公告,标志着这一节点的到来。

这三家公司分别是亚马逊、微软和OpenAI。

亚马逊21日在秋季硬件大会上宣布,“老牌”语音助手Alexa终于升级,融入大语言模型。

新的 Alexa 延迟更低,可以理解上下文,记住之前的对话,不需要来回唤醒,而且越用越会变得更加个性化。

同样是在9月21日,微软在美国纽约召开秋季发布会,宣布将从26日开始逐步向Windows 11用户推送一系列更新。

其中重要的更新之一是人工智能助手副驾驶。

Copilot,顾名思义,将成为用户的数字管家。

它将出现在Windows 11的侧边栏中并启用语音对话,允许用户通过它控制PC上的设置、启动应用程序或回答问题。

驱动Copilot的是OpenAI目前最先进的大语言模型GPT-4。

几天后,25日,OpenAI突然出手,发布公告《ChatGPT现在能看、能听、能说》,宣布将在未来两周内向付费用户推送新的多模态功能。

多模态ChatGPT将能够进行基于图片的对话并进行实时语音对话。

例如,如果您打开冰箱并拍照,您可以与 ChatGPT 聊天晚餐吃什么。

结合ChatGPT已经以App的形式上线Android和iOS的事实,这一举措使得ChatGPT相比于无所不知的“大懂事”AI,更加具备个人助理的能力。

除了这三家公司官方宣布相关产品升级外,谷歌上个月还被科技媒体Axios透露。

内部电子邮件显示,谷歌将利用最新的大语言模型技术彻底改造Google Assistant。

据透露,苹果已经构建了一个大型语言模型框架,并正在改进包括地图和 Siri 在内的功能。

科技巨头们正在助理个人的战场上厮杀。

上一次出现这样的场景已经是8年前的事了:Alexa于2009年首次发布,并安装在亚马逊的智能音箱Echo产品中。

同样是在这一年,微软还随Windows系统推出了语音助手Cortana,在中国大陆地区称为“Cortana”;谷歌在Android 4.1上推出了语音助手Google Now,也就是后来的谷歌助手的Google Assistant。

那是在去年苹果随 iPhone 4S 推出 Siri 后,科技巨头相继推出了三款相互竞争的语音产品,拉开了上一代语音产品的混战序幕。

然而,最初引起公众极大兴趣的语音助理,却成为近年来智能终端必备却被大家鄙视的“人工智障”。

随着去年11月底OpenAI发布ChatGPT,流畅的对话让上一代助理相形见绌。

在 ChatGPT 发布前不久,据报道 Alexa 正遭受亏损和裁员。

ChatGPT 发布后,微软“杀死”了 Cortana,并于今年 8 月下线。

上一代助理个人之战已经结束,新一代助理个人战争已经开始。

在大语言模型技术的支持下,这一次的故事会有所不同吗? 01 我们先看一下亚马逊Alexa、微软Cortana以及Future的多模态ChatGPT官方给出的例子。

连接到大型语言模型的 Alexa 不再那么“机器人”。

用户可以通过说“Alexa,我冷”等非正式的话或“让这个房间看起来像 XX 团队的颜色”等抽象的话来要求 Alexa 打开空调。

用户还可以一次说出多个命令,例如“Alexa,打开洒水器,打开车库门,关闭外部灯”,Alexa 将识别并执行这些任务。

此外,用户现在可以对 Alexa 说“Alexa,让我们聊天吧”,而无需在剩下的对话中喊出 Alexa 的名字。

而且Alexa会记住用户的一些信息和偏好,所以不需要每次都向他们介绍自己。

在演示广告中,用户进入与 Alexa 的聊天模式。

用户想要举办派对,要求Alexa推荐派对主题,然后根据主题推荐合适的场地。

用户与 Alexa 讨论完所有内容后,用户询问“下周五晚上 8 点向我的朋友发送邀请电子邮件,神秘一点。

” Alexa 欣然同意并读出“你准备好度过一个难忘的夜晚了吗?”完成了吗?”发送给用户进行确认。

与助手以往每句话都要叫“Alexa”的语音体验相比,不能有连贯性,指令必须清晰明确。

Alexa确实“更人性化”,相信每个智能家居用户都已经受够了如何让“小X”和“精灵”听懂指令了。

正如我们所熟悉的,它基本上类似于 iPhone 的 Siri,为您打开应用程序、播放歌曲或回答您的问题(除了显示今天的日期和天气等基本问题外,还主要向您显示网络搜索结果)。

更像是一个实用的助手。

例如,您可以要求 Copilot 帮助您“整理您的桌面”,它会以图块形式排列窗口;当你浏览网页时,你可以呼出Copilot,让它帮你总结、解释、重写网页内容;写文案和总结图表更不用说了。

更有趣的是,Copilot还具有处理图像的能力。

截图后可以直接要求Copilot去除背景、剪出人像等。

与升级后的Alexa一样,Copilot的对话体验更加“人性化”。

你可以直接要求Copilot“播放让我集中注意力的歌曲”,它会在Spotify上找到相应的播放列表。

至于OpenAI的ChatGPT,在转向多模态后也变得更加贴近生活。

正如前面提到的,你可以打开冰箱,拍张照片,然后与 ChatGPT 讨论晚餐吃什么。

在另一个官方示例中,用户向 ChatGPT 发送了一张自行车的照片,并询问其如何降低座椅。

ChatGPT提醒用户检查汽车型号,确认是否有快拆杆或用螺栓固定,并给出详细步骤。

用户还是不明白,就拍了一张座椅连接的照片,圈出了某个部位,询问是不是快拆杆。

ChatGPT 识别出这是一个螺栓,并建议使用内六角扳手。

用户随后拍摄了工具箱的照片,并询问 ChatGPT 哪一个是内六角扳手,它成功识别了它。

除了解决日常生活中的问题之外,由于具有语音功能而可以“说话”的ChatGPT还可以给孩子们讲睡前故事。

更有趣的是,当你和别人发生争执时,你还可以架起能听能说的ChatGPT,帮你理清思路,解决争执。

02 不过,无论是新的Alexa、Copilot还是多模态的ChatGPT,都有一定的使用门槛。

目前还没有 Windows 11 操作系统内置的 Copilot 收费的消息。

它应该是免费并向用户开放的,但要等待更新才能逐步推出。

在 Microsoft Office 套件中,Copilot 是一项高级订阅功能,每月价格为 30 美元。

OpenAI的多模式 ChatGPT 仅向高级订阅者提供,称为 ChatGPT Plus,每月 20 美元。

新的 Alexa 未来可能会充电。

亚马逊秋季会议结束后,彭博社采访了即将卸任的亚马逊设备和服务部门副总裁戴维·林普(David Limp),他表示亚马逊正在“*”考虑 Alexa 订阅模式。

Limp 拒绝讨论 Alexa 如果收费的话会定价多少,他说“你今天所了解和喜爱的 Alexa 将仍然免费”,但为人工智能聊天机器人提供动力不会便宜,他承认“在云中进行模型推理的成本”。

它超大。

”一开始就想着如何冲锋陷阵,看似急功近利,其实是上一代人与助理个人战斗的血泪教训。

个人助理产品早已出现,其中的代表就是微软于2007年推出的Microsoft Bob。

当时比尔盖茨还是微软的CEO,首次出现在当年的《福布斯》上。

名列全球富豪榜榜首。

但现在回想起来,鲍勃显得有些臃肿:软件显示了一个虚拟房间,就像个人办公室一样,助手这只卡通狗蹲在角落里,亲切地询问是否需要帮助。

新“Siri”之争已经打响,微软、亚马逊、OpenAI纷纷入局

这条路没走好。

仅仅一年的时间,微软就用浓眉大眼的回形针 Clippy 取代了 Bob。

他热心地想帮你做这做那(但什么都做不好),但也没有成功。

他是批评和嘲笑的对象。

到了2018年,一切都变了。

苹果推出了iPhone 4S,它附带了Siri作为“额外福利”——一个没有实体图像的语音助手,可以通过长按Home键来呼出。

它可以帮助你打开申请、回答问题,甚至还可以开玩笑地给你讲笑话,这在当时是相当“未来主义”的。

科技巨头正在注意到这一点。

2017年,语音通信爆发。

主导Android的谷歌推出了Google Now(两年后升级为Google Assistant),主导PC操作系统的微软推出了Cortana,而亚马逊干脆开发了智能音箱设备并封杀了Alexa。

进去吧,电影《她》已经上映了。

电影中,男主角爱上了电脑操作系统的配音者助手。

后者的配音者是好莱坞著名演员“寡姐”斯嘉丽·约翰逊,与助手配音的界面十分相似。

科塔娜。

电影上映后,《连线》杂志甚至报道称,一些iPhone用户感觉Siri似乎开始有了“自我意识”。

新年之前,各家公司都在更多端口上线了语音助手。

谷歌、苹果和微软都推出了智能音箱设备。

Alexa 和 Cortana 也进行了合作,可以让你通过自己的声音来呼叫对方助手,从而实现更多的功能。

在国内,手机智能语音助手和智能音箱也开始出现,包括小度、小爱、天猫精灵等。

不过,也正是在这个阶段,助手语音越来越受欢迎,公众对他的评价逐渐从充满幻想变成了失望。

在中国,助手喜欢称这些声音为“人为弱智”。

人们在网上发帖询问“如何在 Cortana 弹出时将其关闭?”或者分享了智能音箱如何无法理解“关掉客厅的灯”这个简单的命令短视频。

以 Siri 为例。

Vetro Analytics 2017年的数据显示,Siri的使用率为19.6%,依赖度仅为11%,每个用户每月的平均使用时间仅为14分钟。

03 体验不佳直接影响语音助手产品的商业前景。

就在今年 11 月 ChatGPT 推出之前,媒体 Business Insider 报道称,根据其获得的内部数据,亚马逊全球数字部门第一季度运营亏损超过 30 亿美元。

该部门包括从 Echo 智能音箱、Alexa 语音技术到流媒体服务的一切。

知情人士表示,这一损失是亚马逊所有业务部门中最大的,而大部分损失可归因于Alexa。

报道估计,该部门每年的损失甚至可能达到1亿美元。

Alexa 开局良好,第一代 Echo 设备销量超过 10,000 台。

但其商业模式一直是个问题。

所有助手的声音其实都存在这样的问题:他们提供服务,然后呢?亚马逊预计您今年购买的每台设备将损失 5 美元。

上一代语音助手没有很好的变现措施,交互体验也不好。

Alexa希望整合亚马逊的电子商务服务,但糟糕的体验无法支撑这一愿景,并且频繁询问用户想要什么。

不要购买本身就会有损体验的东西。

最终,用户与 Voice 助手 进行的大部分对话都是琐碎且例行公事的,比如今天的天气、日期、打开应用程序等,而这并不能让亚马逊赚钱。

裁员、亏损的消息传出后,亚马逊表示仍将大力发展Alexa,但外界看不到任何新的可能性。

ChatGPT的出现让一切变得不同。

一方面,存在危机。

ChatGPT基于大语言模型的出色对话能力,让大众几乎立即将其与上一代语音助手进行了比较,结论是“太糟糕了”。

问题已经改变了。

上一代配音演员助手如果不进步,成为大模特,可能会落后,被打。

就连苹果和谷歌也不得不警惕这种可能性。

除了今年8月谷歌被传要用大语言模型升级谷歌助手之外,苹果也有类似的传言。

今年 7 月,著名记者 Mark Gurman 爆料称,苹果已经完成了其大型语言模型“Ajax”的基本框架,并将其定位为支持会话式 AI 系统,并已应用于改善人工智能等功能上地图和 Siri。

在科技巨头采取行动之前,各种集成大型模型的第三方个人应用程序已经出现。

例如,今年6月,有人“复活”了微软Bob,使用GPT-3.5模型,并将其上架微软商店。

另一面是机会。

以Amazon Alexa为代表的智能生态想象,在5G和大机型的支持下,现在比以往任何时候都更有可能。

在今年秋季的会议上,当亚马逊宣布Alexa将全面升级时,也勾画出了一个广阔的前景:亚马逊将把大语言模型注入到多个智能家居API中,为Alexa提供更主动、无缝管理智能家居所需的工具。

背景信息。

与此同时,亚马逊正在推出一些工具,允许Alexa控制第三方产品的某些功能,而这些功能不需要包含在智能家居生态系统的工具包中。

亚马逊表示,已与通用电气、飞利浦、小米、iRobot等合作开发这些功能。

但我们现在面临的新挑战是10年前所没有的。

人工智能对个人隐私和数据安全的威胁正在受到认真对待。

无论是新的Alexa、Copilot还是多模态的ChatGPT,在走向个性化助理的过程中,不可避免地会触及这个问题。

目前,随着新版Alexa的发布,亚马逊将利用用户与Alexa的语音交互来训练模型的消息已经被热议。

“无论谁赢得个人代理,这都是一件大事。

因为你永远不会去搜索网站或生产力网站,你永远不会再去亚马逊(购物)。

”在今年五月的一次活动中,比尔·盖茨如此预测。

问题是,谁会赢得这场战争?又或许就像上一代声优中的助手之战,热闹过后就没有赢家。

参考文献: 1.IT之家:《“大眼夹”重生,变身 ChatGPT 聊天机器人》 2.智能物联网:《昨夜微软与亚马逊“联姻” 还抛出5道AI杀手锏》 3.金融行业:《从“全村的希望”到“大裁员”,亚马逊是如何摧毁Alexa 的?》 4.钛媒体:《智能手机之争的下半场:语音助手之战》 【本文由投资界合作伙伴微信公众号赞助:Alphabet列表授权发布,本平台仅提供信息存储服务。

】如有任何疑问,请联系投资界()。

新“Siri”之争已经打响,微软、亚马逊、OpenAI纷纷入局

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 请查收!2021中国(湘潭)工业软件产业创新创业大赛西南赛区决赛现场实录派送中

    请查收!2021中国(湘潭)工业软件产业创新创业大赛西南赛区决赛现场实录派送中

    请检查! 2021中国(湘潭)工业软件产业创新创业大赛西南赛区决赛直播实录交付2021年8月24日,为配合疫情防控工作,中国(湘潭)工业软件产业创新创业大赛西南赛区总则 决赛将在钉钉平台举行。 本次大赛由湘潭市人民政府指导,湘潭高新技术产业开发区管委会、阿里云、阿里云创

    06-17

  • 中国证监会已批准诺禾致源、新丰光、莱尔科技等科创板IPO注册,

    中国证监会已批准诺禾致源、新丰光、莱尔科技等科创板IPO注册,

    近期,证监会批准以下公司首次公开发行股票注册依法程序登陆科创板的:深圳市亚汇龙生物科技股份有限公司、北京诺禾致科技股份有限公司、新丰光电科技股份有限公司、广东莱尔新材料股份有限公司上述企业及其承销商将与上交所协商确定发行时间表并陆续公布招股说明书文件。 听

    06-17

  • 餐饮解决方案管理平台宁波易食品有限公司获得数千万元A轮融资,米方资本领投,

    餐饮解决方案管理平台宁波易食品有限公司获得数千万元A轮融资,米方资本领投,

    据投资界1月23日消息,宁波博益食品有限公司(以下简称“宁波博益”)宣布获得米方资本。 方创资本领投数千万元。 宁波益是国内领先的专业从事特殊医学用途配方食品研发和生产的创新型高新技术企业。 以高品质特医产品为核心,针对特定人群提供个性化营养治疗指导方案,致力

    06-17

  • Tank 700 Hi4-T 已上市,国产硬派越野车为何能卖到70万?

    Tank 700 Hi4-T 已上市,国产硬派越野车为何能卖到70万?

    近日,著名车展The Grand Tour迎来更新。 杰里米克拉克森放下锄头,带领伙伴詹姆斯梅和理查德哈蒙德追随撒哈拉沙漠达喀尔拉力赛的脚步。 应制片人的要求,被称为“三贱客”的三位主持人改装了三辆老式跑车,完成了这一公里的旅程。 可想而知,原本应该在高速公路上飞驰的跑车

    06-21

  • 专注矿用车自动驾驶,一控智嘉完成6000万元天使轮融资

    专注矿用车自动驾驶,一控智嘉完成6000万元天使轮融资

    据投资界7月2日消息,矿用车无人驾驶公司一控智嘉宣布完成融资天使轮1万元。 本轮融资投资方为兴韬投资,融资资金将主要用于矿区的技术研发和实施测试。 北京易控智能驾驶技术有限公司成立于今年5月。 主要开发矿用车辆自动驾驶解决方案和作业调度平台。 其核心团队来自自动

    06-17

  • 【融资24小时】2022年12月6日投融资事件汇总及明细

    【融资24小时】2022年12月6日投融资事件汇总及明细

    今日国内市场共发生19起投资披露事件,其中先进制造9起(浙江广芯微电子、中芯能源光电、墨芯半导体) 、宏芯宇电子、瑞芯微电子、中科国盛、瑞芯微电子、汇芯半导体、理想万里汇),医疗健康案例5个(奥力生物科技、威斯进生物科技、海色斯诺维、奇辉生物科技、灵芯智能),

    06-18

  • 腾讯各业务群裁员比例不足30%

    腾讯各业务群裁员比例不足30%

    36氪从多位与腾讯关系密切的人士处获悉,从去年底至今,腾讯多个业务群一直在裁员。 主要裁员的是CSIG 和PCG。 ,而IEG等公司的削减幅度较小或尚未采取任何行动。 有传言称,腾讯本轮裁员幅度将高达30%至50%。 我从很多员工那里了解到,腾讯整体的裁员比例不会那么高,也没有

    06-18

  • 国家统计局:5月份二手房销售价格环比持平或下降

    国家统计局:5月份二手房销售价格环比持平或下降

    国家统计局数据显示,5月份,70个大中城市二手房销售价格环比持平或下降< titlesplit > 53个城市二手房价格环比下降,环比扩大3个。 。 分看各一线城市,5月份,一线城市二手房销售价格与上月持平,上涨0.4%;二线城市环比下降0.3%,降幅与上月持平;三线城市环比下降0.5%,

    06-18

  • 珠江投资激增,湾区创新引领, 2023粤港澳大湾区创业投资高峰论坛隆重举行

    珠江投资激增,湾区创新引领, 2023粤港澳大湾区创业投资高峰论坛隆重举行

    5月20日,广东粤科金融集团有限公司与广东省创业投资促进会在广州粤科金融大厦召开会议隆重举办“2019粤港澳大湾区创业投资高峰论坛”。 论坛以“珠江投资热潮与湾区创新先行”为主题,设置领导演讲、主题演讲、成果分享、百亿签约、高端对话等环节,邀请各国政府领导高层、著

    06-18

  • 跨境电商易仓科技获2500万美元B+轮融资,由中金资本

    跨境电商易仓科技获2500万美元B+轮融资,由中金资本

    投资圈旗下基金领投(ID:pedaily)据8月3日消息,易仓科技完成1万美元B+轮融资由中金资本资本领投的基金领投,现有股东EWTP、CCV、Paradox继续跟投。 本轮融资将用于迭代易仓ERP产品并持续打造跨境生态,在产品研发、流量系统、供应链系统、组织管理等方面赋能卖家,并持续引

    06-18

  • 日本福岛地震:或加剧全球半导体产业链的不确定性

    日本福岛地震:或加剧全球半导体产业链的不确定性

    当地时间3月16日23点34分(北京时间22点34分)和23点36分(北京时间22点36分),日本发生两次地震福岛县附近海域发生地震,震级分别达到6.1级和7.4级,引发大范围停电、停水,并对高铁、高速公路等基础设施造成不同程度的破坏。 地震暂时导致瑞萨、信越、村田、索尼、东芝等半

    06-08

  • 卓源资本领投,“博涵智能”获数千万A轮融资

    卓源资本领投,“博涵智能”获数千万A轮融资

    投资圈(ID:pedaily)据7月18日消息,工业互联网AI+大数据平台解决方案提供商“博涵智能”(易通科技(原“易通科技”)近日获得数千万A轮融资,本轮融资由清华投资机构卓源资本领投,公司创始团队跟投,云沐资本跟投。 本轮融资将主要用于研发团队扩充和销售团队建设 近年来

    06-18