首页 > 网络技术迭代 > 内容

苹果AI手机发布后，大规模终端侧AI模型前景如何？

发布于：2024-10-24 编辑：匿名来源：网络

9月10日凌晨1点，被誉为“科技春晚”的苹果发布会拉开帷幕。其中，苹果推出了首款AI手机：iPhone 16。

这是第一款搭载大型AI模型的手机，可以根据用户输入执行但不限于AI图像消除、摘要文本、电子邮件回复等。这里的主要功能基本上都是围绕苹果智能展开的。

作为首款搭载AI大模型的手机，其部署的端侧大模型具有以下优势：隐私保护：设备处理数据不涉及云端，保证用户隐私安全。端云协同：智能分配设备和云计算任务，优化资源，提升速度和效率。

语言图像分析：新的语言处理技术支持写作工具辅助写作和文本处理。与苹果生态系统融合：AI模型深度融入苹果操作系统，实现流畅便捷的体验。

其发布会上最令人惊叹的特点就是“视觉智能”。例如，当你看到一家餐馆时，你可以用相机拍照，然后通过AI搜索它的具体评论、菜单等。

1、国内外纷纷推出自己的大规模设备端模型。我们先来看看苹果推出的组合设备端大模。

网上有消息称其与OpenAI合作，部署了GPT-4o模型。结合OpenAI之前发布的GPT-4o mini来看，很有可能就是部署了这个模型。

GPT-4o mini的特性非常适合部署在手机上。一是因为它足够小，这会加快它的推理速度；二是效果并不比GPT-4o模型差。

该模型更便宜，响应速度更快：上下文长度比 GPT-3.5 更长。原来的GPT3.5仅支持16k输入，但新的GPT-4o mini支持K上下文，并且比GPT-3.5 Turbo便宜60%以上。

，每 10,000 个输入代币的价格仅为 15 美分，每 10,000 个输出代币的价格仅为 60 美分（大致相当于一本标准书的页数）。从对应的速度来看，GPT-4o mini 明显比其他 OpenAI 模型推理速度快很多。

应该是因为参数数量不多，所以速度明显提升。更强的模型效果：GPT-4o mini 在文本智能方面表现优于 GPT-3.5 Turbo，在 MMLU 上得分为 82%，而 GPT-3.5 Turbo 得分为 69.8%，在多模态推理方面也表现更好。

因此，苹果选择与OpenAI合作也是可以理解的。发布会上最让人惊叹的就是它展示的可视化智能搜索。

苹果举了一个例子：当你看到一家餐厅时，只需拍一张照片，你就可以使用Apple Intelligence查看当前餐厅的所有信息，包括菜单或评级等。但问题是，苹果宣布AI访问中国要等到明年，国内用户可能还无法使用。

届时可能连接的是国内百度的文心一言，将无法体验到最强模型GPT-4的效果。反观国内手机厂商，不少手机厂商也开始发布自家搭载大端机型的AI手机。

比如最近，荣耀也推出了自己的大端侧机型手机。作为国内首款Android AI智能手机，荣耀Magic 7与苹果不同。

例如，可以利用AI来帮助你进行“AI人脸反欺诈”检测，可以有效应对AI欺诈。当然，还有最常用的搜索图片等功能（称为“一字查图”）。

用模糊的语言在海量的相册中搜索你想要的图片。比如你可以说“盛开的荷花”、“去年春节穿红衣服的照片”等，你就能立即从大量图片中找到你需要的照片。

除了这两款之外，各大厂商也陆续发布了自己的大型终端侧机型。每个厂家的最大参数量只有7B左右。

然而，小米和苹果发布的大型终端侧型号仅参数量不足3B。这说明7B以下的大模型实际上非常擅长衡量推理速度及其效果。

在保持效果的同时，推理速度也不会太慢。设备端大型号型号参数苹果MM1/OpenELMM/3B华为盘古|三星Gemini（非自研）1.8B/3.25B 荣耀Magic 7BOPPOAndesGPT7BvivoBlueLM7B 小米MiLM1.3B/6.4B 手机设备端型号最有实用价值的应该是10B型号放到手机里，用手机性能的溢出，这个未来应该不会遥远。

2.端侧AI模型现状端侧AI模型是指在用户的终端设备上运行大型AI模型，例如手机或电脑，而不是依赖于云服务器。该技术有几个关键特点和挑战：参数规模不能太大，效果必须保证。

推理速度要求用户达到难以察觉的效果。如何挖掘端侧大模型的具体应用场景 2.1 参数规模不能太大，且要保证效果。

目前，市场上已有多家厂商发布了自己的设备端模型。但设备端模型的一个突出点是参数数量不能太多，否则本地运行会比较困难。

在目前INT4/INT8的量化中，需要保证模型仍然能够具有一定的推理能力。从最近的一些文章来看，目前的端侧模型效果惊人，已经可以复制ChatGPT的效果。

例如Facewall Intelligence最近发布的客户端模型MiniCPM 3.0。它只是一个带有4B参数的语言模型。

与MiniCPM1.0/2.0相比，功能更加全面，综合能力大幅提升。其在大多数评估集上的表现可与许多7B-9B模型相媲美甚至超越。

它具有三大突出优势：超强推理能力：在数学能力方面，MathBench 上的表现超越了 GPT-3.5-Turbo 和多个 7B-9B 模型。在极具挑战性的LiveCodeBench上，性能超越了Llama3.1-8B-Instruct。

优秀的中英文指令跟随能力：英文指令遵循IFEval和中文指令遵循FollowBench-zh优于GLM-4-9B-Chat和Qwen2-7B-Instruct。长文本能力：原生支持32k上下文长度，32k长度以内的大海捞针都是绿色的。

提出LLM x MapReduce，理论上可处理的上下文长度达到+∞。因此，可以说目前的大规模端到端模型在本质上得到了很大的改进。

虽然这样的模型已经可以实现比较好的内存占用——MiniCPM 3.0模型量化后仅占用2GB内存，但仍然存在适配挑战：当App用户数量超过10000人时，手机配置将极其多样化。受限于不同手机的内存读写、能耗等方面的限制，现阶段部署设备端模型极具挑战性。

2.2 推理速度要求达到用户难以察觉的效果。为了在手机上达到用户难以察觉的推理速度，大端侧AI模型需要具备以下关键特性：低延迟：模型的响应时间必须非常短。

确保用户不会注意到延迟。 Face Wall Intelligence发布的MiniCPM 3.0模型在客户端量化部署可以达到18-20个token/s；商汤科技的SenseChat-Lite型号在中端平台上可以达到18.3字/秒，在旗舰平台上可以达到18.3字/秒。

每秒78.3字，响应时间低于0.4秒。这些模型证明了在保持高性能的同时显着减少模型参数数量和计算复杂性的可能性。

一般来说，每秒超过20个令牌应该有良好的用户体验。优化技术：采用量化、模型压缩、硬件加速等先进优化技术，减少模型参数量和计算复杂度。

这里最重要的优化技术是定量技术。上面的论文提出，生成式AI的Transformer大语言模型可以通过将其量化为8位（INT8）或4位（INT4）权重来极大地提高效率。

INT4权重量化也是可行的，并且在训练后量化（PTQ）中表现良好，其效率已经超过了浮点模型。使用量化感知训练 (QAT)，许多生成式 AI 模型可以量化为 INT4。

在不损失精度和性能的情况下，INT4模型功耗更低，性能提升90%，能效提升60%。硬件加速方面，可以采用异构计算架构，包括Hexagon NPU、Qualcomm Adreno GPU、Qualcomm Kryo CPU或Qualcomm Oryon CPU。

以第三代骁龙8移动平台为例，Hexagon NPU在性能方面较上一代提升98%，同时功耗降低40%。通过上述优化技术，大端侧AI模型可以在保持高性能的同时，显着减少模型参数量和计算复杂度，从而实现在手机等移动设备上的高效运行。

这不仅有助于改善用户体验，还可以保证设备的电池寿命。 3、大模型的下半场：AI Agent能力自2016年ChatGPT出现以来，大模型给人们带来了太多的震撼和惊喜。

但从目前来看，大部分大模型效果都难以区分，实际使用体验并没有明显差异。显然，如果我们继续增加模型参数和能力，就会出现很大的瓶颈。

那么大型模型的AI Agent能力可能就是下一个战场。这是因为目前大模型可以使用的最佳平台是手机，而手机需要依赖大模型的AI Agent能力来帮助用户与环境交互。

这种能力可以结合函数调用、工具使用和规划能力，更准确地理解需求并解决复杂的任务。大AI模型需要重新定义“智能手机”。

“智能手机”不仅是“我可以用手机做什么”，而且是“我的手机能为我做什么”。目前，大型模型的能力正在逐步提升AI Agent的能力。

例如，阿里巴巴此前发布的Qwen2-VL模型利用多模态能力来理解用户输入的多维度信息。首先我们看一个简单的Demo，其中Qwen2-VL模型调用插件根据输入图像返回对应的问题。

本次挑战主要是测试Qwen2-VL模型对图像中文本的理解能力，以及理解后根据指令查询信息的能力。用户上传航班信息的图片。

当用户询问准确的时间和目的地天气时，需要一个大模型来搜索天气信息。从视频来看，Qwen2-VL在调用简单工具方面还是做得不错的。

接下来是一个更复杂的场景。左侧为AI操作界面，右侧为AI各状态步骤。

这时候需要一个大模型来查询圣地亚哥的一家餐厅。可以看到人工智能运行谷歌搜索，然后寻找当前用户附近的餐馆。

这样您就可以找到您最喜欢的餐厅。上面的例子都是大模型AI Agent能力的体现。

可以想象，在大机型的帮助下，使用手机将不再是一个需要“学习”的过程。用户只需要用自然语言表达自己的需求即可。

此外，大模型AI Agent还可以帮助我们管理日程、提醒重要事项，甚至在忙碌时处理购物、点餐等简单任务。总之，在大模型AI Agent的帮助下，手机将变得更加人性化，成为我们生活中不可或缺的伙伴。

我们可以通过简单的语言与手机进行交互，让它为我们提供全方位的服务，让我们的生活更加便捷、高效。 4.总结从目前端侧AI模型的现状来看，国内外很多厂商都在关注如何将大型模型配置到手机上，让手机变得更加智能。

从苹果发布会来看，这只是AI在手机上的初步体现。当然，如果仅仅依靠客户端模型来了解用户意图，本质上就会存在一定的偏差。

需要与云端大模型结合进行联合处理和编写，以实现更强大的通用代理能力。

站长声明

标签：

上一篇：大观数据：5分钟带你了解机器学习和分类算法

下一篇：【云原生Docker实践】使用Docker部署mBlog微博系统

冬天里的第一把火，哈尔滨能红多久

冬天第一把火，哈尔滨还能火多久？今年元旦假期三天，哈尔滨共接待游客游客1万余人次，旅游总收入59.1亿元，达到历史峰值。对比一下，冬季热门旅游城市三亚，元旦假期三天共接待游客游客56万人次，总收入11.2亿元。哈尔滨的游客人次和收入相当于五个三亚市。这是一个谁都无

06-17
传三星获得1.2亿片iPad OLED面板订单

苹果下一代iPad可能会彻底放弃LCD屏幕。除了旗舰版iPad Pro系列将采用更新的MiniLED屏幕外，其他产品预计将采用新的OLED屏幕。。据外媒报道，一位知情人士透露，苹果已经向韩国三星子公司三星显示器采购了近 1.2 亿片 iPad OLED 面板订单，几乎相当于所有 iPad 机型。出货

06-08
大学、政府、基金携手打造高质量发展交流会在北京平谷成功召开

5月13日，大学、政府、基金携手打造高质量发展交流会——华德首届诚志科技基金首批项目签约仪式在北京平谷成功举行。本次交流会以国内首个“高校+政府+产业”科技成果产业化基金——华德诚智科技基金二期的落成为契机和起点，搭建政府、高校、产业、金融的平台。为创新型企

06-18
Alphabet高管解读第四季度财报：云业务仍处于发展早期阶段

在最新的财报电话会议上，谷歌CEO桑达尔皮查伊表示，公司云业务仍处于发展早期阶段，投资节奏和规模符合预期。该领域仍然依靠客户的不断积累来形成规模和单位经济效应。

06-17
耀明电子获数亿元A轮融资

据投资界4月2日消息，耀明电子科技有限公司（以下简称“耀明电子”）宣布，已完成数亿元A轮融资。本轮融资由兴诚资本、英特尔投资联合领投。本轮融资将助力耀明电子快速发展。在积极强化全球布局的同时，进一步开发面向中国半导体产业的EDA产品和解决方案，加速集成电路设

06-18
浙江新举措设立30亿规模海事创业投资基金

投资界（ID：pedaily）据9月29日消息，第六届海商大会在浙江海宁召开。本次大会共签约项目38个，总投资约1亿元。其中，外资项目11个，总投资10.84亿美元（约71亿元人民币）；内资项目27个，总投资约1亿元。海宁地处长三角地区腹地，GDP已进入“千亿俱乐部”。在最新的中国

06-17
首次发布 -人工联合公司安松科技完成过亿元B轮融资，汇美资本领投

3月10日消息，近日，北京安松科技有限公司（简称：安松科技）国内领先的人工关节公司）宣布完成超亿元B轮融资。本轮融资由汇美资本领投，同创伟业、赛盈资本、德财投资跟投，WinXCapital作为独家投资方。安松科技成立于2017年，专注于骨科人工关节的研发、生产和销售。拥有

06-17
文化和旅游部：端午节期间全国国内旅游人数8913.6万人次，同比增长94.1%

据文化和旅游部数据中心测算，每年端午节假期持续三天（6月12日-14日），同比增长94.1%。发送旅客6万人次，按可比口径同比增长94.1%，按可比口径恢复至疫情前同期的98.7%。实现国内旅游收入3000万元，同比增长0.7%，恢复到疫情前同期的74.8%。

06-17
神经外科诊断及微创手术治疗智能平台“华科精准”完成D+轮融资

投资界消息（ID：pedaily），6月，国内神经外科诊断及微创手术治疗智能平台华科精准（北京）医疗科技有限公司（简称：华科精准）宣布完成超亿元D+轮融资。本轮投资方包括信达鲲鹏、水木投资、君山资本、汇宇投资，老股东德诺资本持续加大投资。至此，华科精密D轮融资宣告完

06-18
外媒：三星已将两条LCD生产线转为OLED

11月29日消息。据外媒报道，明年将退出液晶面板市场的三星显示器已将多条生产线转向OLED面板。目前，只有一个。液晶面板生产线仍在运行。从外媒报道来看，三星显示器的LCD生产线中，L7-1于2016年停产，转为第6代OLED生产线，并更名为A4-1生产线； L7-2已于今年第一季度停

06-08
尤溪电影酒店战略投资艾特社区酒店

创头条获悉，12月1日，尤溪电影酒店宣布战略投资艾特社区酒店。据悉，双方未来将在用户及会员运营、IP酒店研发、酒店互联网等方面进行投入。深入开展转型合作。此次投资方尤溪电影酒店今年8月刚刚宣布获得沸点资本、多彩博彩资本投资的1.75亿A3轮融资。尤溪电影酒店董事长

06-18
Mindverse宇宙获近亿元天使及天使+轮融资

投资界（ID：pedaily）消息，AI角色一代引擎服务商杭州Mindverse宇宙科技有限公司（Mindverse AI，以下简称《Mindverse宇宙》）宣布完成天使及天使+轮近亿元融资。天使+轮融资由银杏谷资本领投，Plug and Play中国、天使轮投资方线性资本、红杉中国种子基金跟投。跟随投资。

06-18