首页 > 科技未来 > 内容

苹果今年最大更新来袭,AI Siri终极形态比GPT-4o更科幻 - WWDC24 预览

发布于:2024-06-21 编辑:匿名 来源:网络

Siri 落后了。

据《纽约报道》称,这是苹果软件负责人 Craig Federighi 和机器学习主管 John Kong 去年花了数周时间测试 ChatGPT 后的想法,因此他们决定对这个 13 岁的语音助手进行一次大改造。

距离WWDC开发者大会还有不到半个月的时间,科技记者MarkGurman带来了AI版Siri的最新进展。

看来,这个总被吐槽“人工智障”的语音助手确实会迎来大突破。

更新。

坏消息:它的一些最大的功能可能不会在今年推出。

尽管如此,Mark和Gurman表示,苹果仍然将iOS 18视为历史上最重要的升级。

苹果WWDC24将于北京时间6月11日凌晨1点举行。

APPSO 将为您带来 Apple Park 的最新报道,敬请关注。

据悉,期待已久但前景广阔的“控制应用”功能,让Siri在AI的支持下进一步“控制应用”,实现对应用功能的精准控制。

例如,要求 Siri 将文件从一个文件夹移动到另一个文件夹,或者要求 Siri 打开一篇特定的新闻文章,甚至要求 Siri 为您提供该文章的摘要。

虽然你已经可以使用 Siri 发送短信,甚至发送微信消息,但基于 AI 改造的 Siri 将会更进一步,能够分析人们如何使用他们的设备,并学习越来越多的自动化操作。

苹果计划在其开发的应用程序中支持“数百个”命令。

▲ iOS 10 中已经实现的 Siri 发送微信功能听起来确实不错,但Gurman表示,该功能一开始将仅限于苹果开发的应用程序,今年不会推出。

最快可能要等到明年 iOS 18 的后续更新了。

并且还有消息称,老款机型可能只搭载A17 Pro的iPhone 15 Pro,M1以上的Mac可以支持更多本地AI功能。

新的 Siri 可能一开始只能一次理解并执行一个命令,但未来预计将支持一系列命令,例如生成录制的会议录音的摘要(也是预计将推出的功能) iOS 18 中推出),然后使用电子邮件发送给同事时,还可以直接添加一些文字说明,一组操作可以通过 Siri 一句话完成。

新的 Siri 预计也将与 iOS 18 中的其他 AI 功能一样,会有一个判断系统,根据 AI 任务是否可以在设备本地完成,或者是否需要在云端运行来判断。

所需的计算能力。

如果要总结 Siri 这 13 年的发展,“不管理学生,不培养学生”或许是最恰当的。

2017年iPhone 4s发布会上,Siri隆重登场,震惊了观众和世界。

当时 Siri 的演示是这样的:你可以问它某个城市的天气怎么样,或者某只股票的表现如何,一句话就可以设置提醒,离开时自动弹出公司。

这在当时也是一个非常酷且充满未来感的功能。

结果,13年后,上述功能似乎仍然是Siri使用最多的场景。

就连后来支持的家庭控制和快捷命令,一般还是开关功能。

事实上,Siri 从未实现过质的飞跃。

即使面对其他后来者语音助手如Google Assistant、微软Cortana、三星Bixby等的挑战,甚至国产的小米“小爱同学”越来越好用,苹果依然不思进取直到ChatGPT的出现。

意识到 Siri 已经落后于时代了。

▲ 小爱同学去年就已经接入大模型了。

虽然苹果似乎时不时地在发布会上介绍一下,但 Siri 又变得更强了,能听懂更多命令,能做更多事情。

但很多时候,懂并不代表会做,也不代表能做好。

比如告诉Siri我想自拍,Siri二话不说就会帮你打开相机和前置摄像头,然后就什么也没有发生了。

用户仍然需要伸出手来点击快门。

甚至有时候,Siri只会自动跳转到相机应用程序,而不是跳转到前置模式。

如果是三星的Bixby助手,它会自动进入自拍倒计时,整个过程真正不需要用户干预。

苹果默认的相机应用本身就带有倒计时功能,所以这个过程不需要太多的AI因素来实现,但苹果只是没有把体验做得很好。

Siri的对手是快捷命令。

你用过“快捷命令”功能吗? Apple 收购 Workflow 后,其产品在 iOS 12 中作为“快捷命令”集成到 iPhone 中,也在 macOS 12 中在 Mac 平台上推出。

▲ 快捷命令已融入 Apple 生态链。

该功能可以实现很多高级的iOS玩法,比如钉钉一键打卡,Live照片、视频一键制作成GIF,甚至自动操作实现“放假”。

自动关闭闹钟。

”但这个功能对于新手用户来说并不友好。

创建新的快捷命令,用户需要在类似脚本编程的界面中选择各种操作模块,并用“如果……那么”、“只要”等各种逻辑连接起来,例如“节假日闹钟” “时钟”这种快捷命令包含了多种逻辑判断和自动化操作。

即使用户按照教程设置,也很容易出错。

虽然苹果提供了“快速命令中心”,可以直接获取现成的脚本,但那里提供的快捷命令比较简单,很少有解决用户痛点的功能。

该功能类似于三星Galaxy手机的“Good Lock”模块,提供非常强大的定制功能,但门槛并不低。

AI大模型最重要的能力之一就是理解自然语言和逻辑思维的能力。

也就是说,如果用户对大模AI说“我下班了,帮我签到”,AI就会知道你的意思是执行“打开钉钉”和“签到”操作,”而不是说你“没有听”。

Siri 也不是完全没有这个能力。

让 Siri 在你离开公司时提醒你给家人买生日蛋糕,这是 iPhone 4s 发布会上演示过的一个功能。

其背后也是理解用户的语言并将其转化为相关操作的过程 ▲Siri 发布会上介绍的许多功能现在仍然是 Siri 的主要功能,而在大型 AI 模型的支持下,Siri 应该能够做更多的事情。

用户用自然语言描述自己的复杂需求后,Siri 会将其转换为脚本的逻辑并自行执行相应的步骤,这才是真正的“快速”命令,而无需用户面对复杂的编程。

苹果今年最大更新来袭,AI Siri终极形态比GPT-4o更科幻 - WWDC24 预览

▲ChatGPT 教我如何使用 iOS 快捷键设置节日闹钟,虽然逻辑清晰,但似乎不太好用,除了可以让用户更自然地自定义操作外,还可以期待 Siri 变得更加“活跃”。

助手。

如果你使用iPhone足够长的时间,你会发现有时候,iPhone会自动弹出建议。

例如,当用户戴上蓝牙耳机时,建议您打开网易云音乐,因为这是您的使用模式;或者深夜充电时,手机会自动降低充电功率以维持电池电量,但在您醒来之前仍然可以使用。

也是因为我发现你有睡前长时间充电的习惯。

这些都是机器学习和苹果一直在努力的AI能力的成果。

现代人每天花费大量时间在手机上。

使用手机购物、吃饭和工作已经很常见。

自然,手机比你肚子里的蛔虫更了解你的存在。

想象一下苹果强大的态势感知能力,再加上手机更强大的自动操作能力,AI版的Siri可能真的会变身为真正的“个人助理”,在你把事情交给它之前就预测出来。

一切都是根据您的需要安排的。

例如,通过您预订的机票,到达目的地后它会自动帮您查看天气情况,还可以提前设置闹钟。

根据您的出行习惯和实时交通状况,在您到达机场时,根据预计的出行时间,帮助您提前叫出租车。

自动弹出您的机票并使用应用办理登机手续。

到达当地后,您可以打开大众点评网推荐的餐厅,就像私人助理+导游一样。

如果我们想要实现这套流畅的操作,我们当然会思考,这需要开发者和苹果双方都走。

然而,人工智能的发展速度已经超出了我们的想象。

或许未来,AI可以直接模仿人类的操作。

我们可以理解UI,AI也在学习。

虽然新Siri的智能操作初期只会支持苹果自家的应用程序,但我更愿意相信这只是苹果AI Siri路线的起点或中间,而不是终点。

我相信苹果AI的最终目标就是实现这样的场景:早上醒来,用“Siri”这个词叫醒Siri,然后让它打开微信公众号“爱范儿”,大声朗读最新文章,就像这样,根本不需要用手。

既然如此,就听听艾范儿的早间报告吧。

▲ 多年前的 iPhone 概念手机壳。

其想法是“Siri”拟人化和免提语音免提“快捷命令”可以支持第三方应用程序的操作。

这主要是因为苹果开放了API,第三方应用厂商也可以使用他们的应用程序。

里面的操作分为模块,可以通过快捷命令执行。

但这取决于应用厂商是否愿意提供相关模块和操作。

例如,如果菜鸟App没有开启显示取货码的操作,那么无论Siri多么智能,它都无法自行打开菜鸟应用显示取货码。

如果我们更进一步,让AI直接理解什么是提货码,以及提货码在app的什么位置,并在收到指令后自行打开呢?这听起来可能有点过于科幻,但业界已经在进行相关尝试。

在上周的 Microsoft Build 开发者大会上,微软宣布了一些新东西:GPT-4o 支持的 Copliot 可以实时查看屏幕上的内容,并引导玩家一起玩《我的世界》。

演示中,副驾驶用非常流畅自然的语言,甚至带着一丝情感,引导玩家在游戏中造剑。

在这个过程中,Copilot可以识别游戏背包中的物品,并告知玩家缺少的材料,就像一位“大师”引导你完成游戏。

这说明AI助手不再只是一个“一问一答”的文字机器人,或者只能在后台编程、处理数据,而是可以真正开始理解我们人类看到的UI界面,也可以知道我们如何操作它。

今年流行了一段时间的“AI硬件”兔子R1,基本放弃了操作界面,完全通过AI语音助手完成各项服务的使用。

Rabbit公司声称,他们采用了一种名为“大动作模型”(LAM)的AI模型技术,可以在理解用户指令后在服务器上模仿人类操作,直接完成用户在相关网页和应用程序中的指令。

▲兔子R1号称利用语音实现跨应用、跨平台操作。

虽然兔子R1的表现与他们描绘的场景相去甚远,但视觉本身却是非常美丽的。

GPT-4o等机器人在视觉理解方面的出色表现也让人们感到AI取代人类的未来确实已经不远了。

作为一家在开发者中具有巨大号召力的公司,苹果没有必要模仿初创公司 Rabbit 充分利用“LAM”。

可以开放相关接口并提供SDK,让各大第三方开发者在自己的应用中使用。

原生支持AI操作,带来更加成熟稳定的语音操作体验。

苹果相关研究表明他们确实有这个想法。

借助Apple的应用程序UI设计标准,Siri可以更轻松地理解iPhone屏幕上的一切。

▲ 苹果也在研究如何让大型模型理解 UI。

虽然技术不如人类,但苹果在用户数量和生态建设方面的领先优势可以成为非常强大的优势。

以下是 9to5Mac 对 Apple 即将推出的 Siri 和 AI 更新的预测和说法:在 WWDC 上。

我们可能看不到任何特别革命性的东西,但将人工智能融入数百万人每天使用的系统和应用程序本身就是一场革命。

与兔子R1这样的潮流硬件相比,人人拥有的智能手机或许才是AI最好的载体。

用户不需要知道自己正在使用AI功能,但当他要求Siri帮助规划旅行计划并预订机票时,AI已经开始深刻改变他的生活。

苹果今年最大更新来袭,AI Siri终极形态比GPT-4o更科幻 - WWDC24 预览

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 小米科技创始人雷军:创业者永不退休,创业是一种生活态度

    小米科技创始人雷军:创业者永不退休,创业是一种生活态度

    打造头条新闻近日,小米发布了视频专栏新年特别版《雷军请你超大杯》。 下一集《慢慢来》,小米科技创始人雷军对话苏炳添。 他表示,创业者不会退休,创业是一种人生态度。 在下一集的视频中,雷军问苏炳添为什么能在32岁的时候取得这样的成就。 苏炳添表示,说体育巅峰30岁就

    06-18

  • 电动汽车充电解决方案提供商智充科技获贝壳资本投资

    电动汽车充电解决方案提供商智充科技获贝壳资本投资

    据6月16日消息,电动汽车充电解决方案提供商北京智充科技股份有限公司(以下简称“智充科技”)今日宣布其B轮融资已获壳牌风险投资部门Shell Ventures(以下简称“壳牌资本”)注资。 智能充电技术旨在扩展以满足快速扩张的市场对充电服务不断增长的需求。 根据国际能源署(I

    06-17

  • 麦当劳的新广告全是马赛克,设计越不显眼,就越有吸引力?

    麦当劳的新广告全是马赛克,设计越不显眼,就越有吸引力?

    除了覆盖物体,马赛克还能怎么用?麦当劳最近提交了一个完美的创意答案——用马赛克做广告。 仔细看看下面的图片。 你能说出它是什么吗?答案是炸薯条。 你花了多长时间才认出它?如此有趣的想法也让不少人惊呼:一张马赛克图居然让我饿了。 看到这个马赛克让我饿了。 过去的

    06-21

  • 流行“阿童木鞋”:上天打不倒妖怪,但可以下地插秧

    流行“阿童木鞋”:上天打不倒妖怪,但可以下地插秧

    MSCHF,这个充满想象力的创意团队,又来搞事了!上次我们报道了出圈率爆款的“骨折鞋”,这简直就是创意鞋的流量磁石。 这一次,他们故技重施,从无数人童年记忆中的动画片《人物:铁臂阿童木》中汲取灵感。 铁臂阿童木的历史可以追溯到《铁臂阿童木》,是一部连载了16年的连

    06-21

  • 消息:丨美杰医疗获Mint天使基金1000万元独家投资

    消息:丨美杰医疗获Mint天使基金1000万元独家投资

    据投资界6月12日消息,据媒体报道,上海美杰医疗科技有限公司近日宣布完成天使轮融资1000万元,由薄荷天使基金独家投资。 本轮融资将主要用于加速创新多模式肿瘤治疗系统的研发。 美杰医疗是多模式肿瘤热物理治疗系统的开发商。 该系统是根据生物传热传质实验室的研究成果开发

    06-18

  • 投资世界24小时 -女性,世界上财富突破千亿美元的第一人;段永平向浙江大学捐赠超10亿;保险资金一举筹集100亿

    投资世界24小时 -女性,世界上财富突破千亿美元的第一人;段永平向浙江大学捐赠超10亿;保险资金一举筹集100亿

    时间:1月2日周二随着欧莱雅股价再创历史新高,彭博亿万富豪指数显示欧莱雅集团掌门人、弗朗索瓦丝贝当古迈耶斯的个人财富(弗朗索瓦丝贝当古迈耶斯 (Francoise Bettencourt Meyers) 于 12 月 28 日达到 1 亿美元,成为世界第一。 身家超过 1 亿美元的女性在该指数中排名第 12

    06-18

  • 纪源资本符绩勋:谨慎积极探索化妆品行业投资机会

    纪源资本符绩勋:谨慎积极探索化妆品行业投资机会

    近日,纪源资本经理合伙人符绩勋接受了清科专访。 在提及3月份完成的对“优视科技”的投资时,符绩勋表示,移动互联网有很大的发展空间,未来还会考虑一些并购计划。 ” ? ? ? ? ? ? ? ? 纪源资本2016年投资了旅游分销技术服务商“汇通天下”。 谈及世博会带来的巨大商机,符

    06-18

  • 天津设立千亿元规模新一代人工智能产业基金

    天津设立千亿元规模新一代人工智能产业基金

    据投资界5月16日消息,国家发改委、科技部、工信部信息化部、国家网信办、中国科学院、工程院、中国科协、天津市人民政府在天津市人民政府共同主办的第二届世界智能大会上宣布:规模1亿元的天津新一代人工智能技术产业基金即将设立。    据悉,新一代人工智能技术产业基金

    06-18

  • 基石资本公布2018年募资成绩单:5只新基金+双创债,总规模逾100亿元

    基石资本公布2018年募资成绩单:5只新基金+双创债,总规模逾100亿元

    基石资本公布2018年募资成绩单:5支新基金+双创债,总规模超100亿元。 年关即将过去,VC/PE机构迎来了一年的总结时刻。 12月14日,在新基金成立仪式上,基石资本正式宣布已完成每年总规模超1亿元的新基金募集,其中包括5支新基金:40亿元并购基金、 20亿元北城基石产业基金、

    06-18

  • 聚焦“北斗+”创新应用,北斗世界以高精度技术赋能传统产业

    聚焦“北斗+”创新应用,北斗世界以高精度技术赋能传统产业

    6月23日9时43分,我国利用长征三号乙运载火箭成功发射北斗系统首个北斗系统西昌卫星发射中心 55颗导航卫星,北斗三号最后一颗全球组网卫星。 至此,北斗三号全球卫星导航系统星座部署已提前半年完成。 随着北斗系统的逐步完善,千亿市场正等待爆发。 5月18日,中国卫星导航定

    06-18

  • 短视频生产服务商小影科技完成近4亿元C轮融资

    短视频生产服务商小影科技完成近4亿元C轮融资

    据投资界(微信ID:pedaily)12月1日消息,小影科技近期完成C轮融资,金额近41亿,由大辰财智、敦鸿资产、吾悦资本领投,耀明投资、杭州金投、永源投资、君润资本等跟投。 据悉,本轮募集资金将用于在技??术、产品矩阵孵化、本地化团队建设等方面持续投入。 小影科技成立于20

    06-18

  • Gartner发布2021年全球云计算市场份额,阿里云全球第三、亚太第一

    Gartner发布2021年全球云计算市场份额,阿里云全球第三、亚太第一

    4月15日消息:近日,权威行业研究机构Gartner发布2021年全球云计算IaaS市场份额数据显示,阿里云位居市场第一,份额为9.55%,位居全球第三,并连续六年实现份额增长。 Gartner数据显示,2018年全球云计算市场保持稳定增长,从2018年的9000万美元增长至9亿美元。 其中排名第一

    06-18