SK集团旗下3家公司将筹集1万亿韩元投资半导体、Yuanverse等,
06-08
Siri 落后了。
据《纽约报道》称,这是苹果软件负责人 Craig Federighi 和机器学习主管 John Kong 去年花了数周时间测试 ChatGPT 后的想法,因此他们决定对这个 13 岁的语音助手进行一次大改造。
距离WWDC开发者大会还有不到半个月的时间,科技记者MarkGurman带来了AI版Siri的最新进展。
看来,这个总被吐槽“人工智障”的语音助手确实会迎来大突破。
更新。
坏消息:它的一些最大的功能可能不会在今年推出。
尽管如此,Mark和Gurman表示,苹果仍然将iOS 18视为历史上最重要的升级。
苹果WWDC24将于北京时间6月11日凌晨1点举行。
APPSO 将为您带来 Apple Park 的最新报道,敬请关注。
据悉,期待已久但前景广阔的“控制应用”功能,让Siri在AI的支持下进一步“控制应用”,实现对应用功能的精准控制。
例如,要求 Siri 将文件从一个文件夹移动到另一个文件夹,或者要求 Siri 打开一篇特定的新闻文章,甚至要求 Siri 为您提供该文章的摘要。
虽然你已经可以使用 Siri 发送短信,甚至发送微信消息,但基于 AI 改造的 Siri 将会更进一步,能够分析人们如何使用他们的设备,并学习越来越多的自动化操作。
苹果计划在其开发的应用程序中支持“数百个”命令。
▲ iOS 10 中已经实现的 Siri 发送微信功能听起来确实不错,但Gurman表示,该功能一开始将仅限于苹果开发的应用程序,今年不会推出。
最快可能要等到明年 iOS 18 的后续更新了。
。
并且还有消息称,老款机型可能只搭载A17 Pro的iPhone 15 Pro,M1以上的Mac可以支持更多本地AI功能。
新的 Siri 可能一开始只能一次理解并执行一个命令,但未来预计将支持一系列命令,例如生成录制的会议录音的摘要(也是预计将推出的功能) iOS 18 中推出),然后使用电子邮件发送给同事时,还可以直接添加一些文字说明,一组操作可以通过 Siri 一句话完成。
新的 Siri 预计也将与 iOS 18 中的其他 AI 功能一样,会有一个判断系统,根据 AI 任务是否可以在设备本地完成,或者是否需要在云端运行来判断。
所需的计算能力。
如果要总结 Siri 这 13 年的发展,“不管理学生,不培养学生”或许是最恰当的。
2017年iPhone 4s发布会上,Siri隆重登场,震惊了观众和世界。
当时 Siri 的演示是这样的:你可以问它某个城市的天气怎么样,或者某只股票的表现如何,一句话就可以设置提醒,离开时自动弹出公司。
这在当时也是一个非常酷且充满未来感的功能。
结果,13年后,上述功能似乎仍然是Siri使用最多的场景。
就连后来支持的家庭控制和快捷命令,一般还是开关功能。
事实上,Siri 从未实现过质的飞跃。
即使面对其他后来者语音助手如Google Assistant、微软Cortana、三星Bixby等的挑战,甚至国产的小米“小爱同学”越来越好用,苹果依然不思进取直到ChatGPT的出现。
意识到 Siri 已经落后于时代了。
▲ 小爱同学去年就已经接入大模型了。
虽然苹果似乎时不时地在发布会上介绍一下,但 Siri 又变得更强了,能听懂更多命令,能做更多事情。
但很多时候,懂并不代表会做,也不代表能做好。
比如告诉Siri我想自拍,Siri二话不说就会帮你打开相机和前置摄像头,然后就什么也没有发生了。
用户仍然需要伸出手来点击快门。
甚至有时候,Siri只会自动跳转到相机应用程序,而不是跳转到前置模式。
如果是三星的Bixby助手,它会自动进入自拍倒计时,整个过程真正不需要用户干预。
苹果默认的相机应用本身就带有倒计时功能,所以这个过程不需要太多的AI因素来实现,但苹果只是没有把体验做得很好。
Siri的对手是快捷命令。
你用过“快捷命令”功能吗? Apple 收购 Workflow 后,其产品在 iOS 12 中作为“快捷命令”集成到 iPhone 中,也在 macOS 12 中在 Mac 平台上推出。
▲ 快捷命令已融入 Apple 生态链。
该功能可以实现很多高级的iOS玩法,比如钉钉一键打卡,Live照片、视频一键制作成GIF,甚至自动操作实现“放假”。
自动关闭闹钟。
”但这个功能对于新手用户来说并不友好。
创建新的快捷命令,用户需要在类似脚本编程的界面中选择各种操作模块,并用“如果……那么”、“只要”等各种逻辑连接起来,例如“节假日闹钟” “时钟”这种快捷命令包含了多种逻辑判断和自动化操作。
即使用户按照教程设置,也很容易出错。
虽然苹果提供了“快速命令中心”,可以直接获取现成的脚本,但那里提供的快捷命令比较简单,很少有解决用户痛点的功能。
该功能类似于三星Galaxy手机的“Good Lock”模块,提供非常强大的定制功能,但门槛并不低。
AI大模型最重要的能力之一就是理解自然语言和逻辑思维的能力。
也就是说,如果用户对大模AI说“我下班了,帮我签到”,AI就会知道你的意思是执行“打开钉钉”和“签到”操作,”而不是说你“没有听”。
Siri 也不是完全没有这个能力。
让 Siri 在你离开公司时提醒你给家人买生日蛋糕,这是 iPhone 4s 发布会上演示过的一个功能。
其背后也是理解用户的语言并将其转化为相关操作的过程 ▲Siri 发布会上介绍的许多功能现在仍然是 Siri 的主要功能,而在大型 AI 模型的支持下,Siri 应该能够做更多的事情。
用户用自然语言描述自己的复杂需求后,Siri 会将其转换为脚本的逻辑并自行执行相应的步骤,这才是真正的“快速”命令,而无需用户面对复杂的编程。

▲ChatGPT 教我如何使用 iOS 快捷键设置节日闹钟,虽然逻辑清晰,但似乎不太好用,除了可以让用户更自然地自定义操作外,还可以期待 Siri 变得更加“活跃”。
助手。
如果你使用iPhone足够长的时间,你会发现有时候,iPhone会自动弹出建议。
例如,当用户戴上蓝牙耳机时,建议您打开网易云音乐,因为这是您的使用模式;或者深夜充电时,手机会自动降低充电功率以维持电池电量,但在您醒来之前仍然可以使用。
也是因为我发现你有睡前长时间充电的习惯。
这些都是机器学习和苹果一直在努力的AI能力的成果。
现代人每天花费大量时间在手机上。
使用手机购物、吃饭和工作已经很常见。
自然,手机比你肚子里的蛔虫更了解你的存在。
想象一下苹果强大的态势感知能力,再加上手机更强大的自动操作能力,AI版的Siri可能真的会变身为真正的“个人助理”,在你把事情交给它之前就预测出来。
一切都是根据您的需要安排的。
例如,通过您预订的机票,到达目的地后它会自动帮您查看天气情况,还可以提前设置闹钟。
根据您的出行习惯和实时交通状况,在您到达机场时,根据预计的出行时间,帮助您提前叫出租车。
自动弹出您的机票并使用应用办理登机手续。
到达当地后,您可以打开大众点评网推荐的餐厅,就像私人助理+导游一样。
如果我们想要实现这套流畅的操作,我们当然会思考,这需要开发者和苹果双方都走。
然而,人工智能的发展速度已经超出了我们的想象。
或许未来,AI可以直接模仿人类的操作。
我们可以理解UI,AI也在学习。
虽然新Siri的智能操作初期只会支持苹果自家的应用程序,但我更愿意相信这只是苹果AI Siri路线的起点或中间,而不是终点。
我相信苹果AI的最终目标就是实现这样的场景:早上醒来,用“Siri”这个词叫醒Siri,然后让它打开微信公众号“爱范儿”,大声朗读最新文章,就像这样,根本不需要用手。
既然如此,就听听艾范儿的早间报告吧。
▲ 多年前的 iPhone 概念手机壳。
其想法是“Siri”拟人化和免提语音免提“快捷命令”可以支持第三方应用程序的操作。
这主要是因为苹果开放了API,第三方应用厂商也可以使用他们的应用程序。
里面的操作分为模块,可以通过快捷命令执行。
但这取决于应用厂商是否愿意提供相关模块和操作。
例如,如果菜鸟App没有开启显示取货码的操作,那么无论Siri多么智能,它都无法自行打开菜鸟应用显示取货码。
如果我们更进一步,让AI直接理解什么是提货码,以及提货码在app的什么位置,并在收到指令后自行打开呢?这听起来可能有点过于科幻,但业界已经在进行相关尝试。
在上周的 Microsoft Build 开发者大会上,微软宣布了一些新东西:GPT-4o 支持的 Copliot 可以实时查看屏幕上的内容,并引导玩家一起玩《我的世界》。
演示中,副驾驶用非常流畅自然的语言,甚至带着一丝情感,引导玩家在游戏中造剑。
在这个过程中,Copilot可以识别游戏背包中的物品,并告知玩家缺少的材料,就像一位“大师”引导你完成游戏。
这说明AI助手不再只是一个“一问一答”的文字机器人,或者只能在后台编程、处理数据,而是可以真正开始理解我们人类看到的UI界面,也可以知道我们如何操作它。
今年流行了一段时间的“AI硬件”兔子R1,基本放弃了操作界面,完全通过AI语音助手完成各项服务的使用。
Rabbit公司声称,他们采用了一种名为“大动作模型”(LAM)的AI模型技术,可以在理解用户指令后在服务器上模仿人类操作,直接完成用户在相关网页和应用程序中的指令。
▲兔子R1号称利用语音实现跨应用、跨平台操作。
虽然兔子R1的表现与他们描绘的场景相去甚远,但视觉本身却是非常美丽的。
GPT-4o等机器人在视觉理解方面的出色表现也让人们感到AI取代人类的未来确实已经不远了。
作为一家在开发者中具有巨大号召力的公司,苹果没有必要模仿初创公司 Rabbit 充分利用“LAM”。
可以开放相关接口并提供SDK,让各大第三方开发者在自己的应用中使用。
原生支持AI操作,带来更加成熟稳定的语音操作体验。
苹果相关研究表明他们确实有这个想法。
借助Apple的应用程序UI设计标准,Siri可以更轻松地理解iPhone屏幕上的一切。
▲ 苹果也在研究如何让大型模型理解 UI。
虽然技术不如人类,但苹果在用户数量和生态建设方面的领先优势可以成为非常强大的优势。
以下是 9to5Mac 对 Apple 即将推出的 Siri 和 AI 更新的预测和说法:在 WWDC 上。
我们可能看不到任何特别革命性的东西,但将人工智能融入数百万人每天使用的系统和应用程序本身就是一场革命。
与兔子R1这样的潮流硬件相比,人人拥有的智能手机或许才是AI最好的载体。
用户不需要知道自己正在使用AI功能,但当他要求Siri帮助规划旅行计划并预订机票时,AI已经开始深刻改变他的生活。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-18
06-18
06-17
06-18
06-06
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态