首页 > 科技未来 > 内容

终端侧生成式AI时代已经到来，高通以领先的AI软硬件技术赋能AIGC应用创新

发布于：2024-06-18 编辑：匿名来源：网络

4月17日，中国AIGC产业峰会在北京举行。

本次峰会以“你好，新应用”为主题，邀请来自生成式人工智能应用、人工智能基础设施和模型层的代表企业分享生成式人工智能的最新现状和趋势。

在本次峰会上，高通AI产品技术中国区负责人万卫星发表了《推动终端侧生成式AI时代》的主题演讲。

他强调终端侧生成式AI时代的到来，并提到高通发布的第三代骁龙8和骁龙X精英平台已经或即将赋能众多AI手机和AI PC产品。

万卫星详细介绍了高通AI引擎及其组件，并演示了高通异构计算能力的端到端用例。

此外，万卫星还介绍了高通AI软件堆栈和AI Hub，将极大提高开发者在模型开发、优化和部署方面的效率，从而帮助创造更多创新的AI应用。

演讲全文如下：大家早上好，很高兴参加本次中国AIGC产业峰会，与各位嘉宾朋友一起迎接生成式AI时代的到来，并与大家分享所提供的产品和解决方案高通作为芯片制造商，如何推动AIGC相关产业的大规模扩张。

我们相信，终端侧生成式AI时代已经到来。

随着今年10月发布的第三代骁龙8和骁龙X Elite产品，高通已经将大语言模型彻底搬到了终端侧进行运行。

并且已经或即将赋能众多AI手机、AI PC。

手机方面，去年底、今年年初多家OEM厂商发布的Android旗舰产品，包括三星、小米、荣耀、OPPO和vivo等，都具备运行生成式AI的能力在设备端。

基于图像语义理解的多模态大模型的发展是当前的一个重要趋势。

在今年2月的巴塞罗那MWC期间，高通还展示了全球首款运行在Android手机上的多模态大型模型（LMM）。

具体来说，我们在搭载第三代骁龙8的参考设计上运行了基于图像和文本输入的大型语言和视觉助理大型模型（LLaVa），参数超过70亿个，可以根据图像生成多轮对话输入。

具有语言和视觉理解功能的大型多模态模型可实现识别和讨论复杂视觉模式、对象和场景等用例。

想象一下，有视觉障碍的用户可以在终端侧使用这项技术在城市内进行导航。

同时，高通还展示了全球首个在Snapdragon X Elite上运行在Windows PC上的大型多模态音频推理模型。

接下来我们看看高通作为芯片厂商是如何满足生成式AI的多样化需求的。

不同领域的生成式人工智能用例有不同的需求，包括按需、连续和普遍的用例。

它们背后所需要的AI模型也有很大不同。

很难有一种模型可以完美适合所有生成式人工智能用例或非生成式人工智能用例。

终端侧生成式AI时代已经到来，高通以领先的AI软硬件技术赋能AIGC应用创新

生成式人工智能用例。

例如，某些用例需要顺序控制并且对延迟敏感；一些用例是连续的，并且对计算能力和功耗敏感；一些用例需要始终在线，并且对功耗特别敏感。

高通推出的Qualcomm AI Engine是领先的异构计算系统。

它包含多个处理器组件，包括通用硬件加速单元CPU和GPU、专门针对高计算能力要求的NPU以及用于AI推理的高通传感器中枢。

在此过程中扮演不同的角色。

上面提到的顺序执行的按需任务可以运行在CPU上，也可以运行在GPU上；对AI算力要求较高的连续任务，如图像处理、生成式AI等，可以在NPU上运行；对于那些需要永远在线的人来说，特别是功耗敏感的任务可以在高通传感器集线器上运行。

下面我给大家简单介绍一下高通NPU的演进路线。

这是一个非常典型的案例，上层用例驱动底层硬件设计。

几年前或更早的时候，AI 主要用于一些相对简单的图像识别和图像分类用例，因此我们为 NPU 配置了标量和矢量加速器。

今年，计算摄影的概念开始流行。

我们把研究方向从图像分类转向AI计算、AI视频等，包括对自然语言理解和处理的支持，以及对Transformer模型的支持。

我们在 NPU 硬件标量矢量加速器的基础上，添加了张量加速器。

2017年，大车型非常流行。

我们在业界率先完成端侧大模型支持，并为NPU配置了专门的Transformer加速模块。

2019年，我们将重点支持多模态模型的客户端实现，支持参数量较高的大语言模型在客户端的部署。

接下来我将为大家更深入地介绍一下Qualcomm Hexagon NPU。

第三代骁龙8搭载的Hexagon NPU不仅进行了微架构升级，还专门配置了独立供电轨，以实现最佳能效。

我们还通过微切片推理技术支持深度网络集成，以实现更极致的性能。

此外，Hexagon NPU还集成了专为生成式AI打造的Transformer加速模块、更高的DDR传输带宽、更高的IP频率等先进技术。

所有这些技术的结合使 Hexagon NPU 成为行业领先的设备端生成 AI NPU。

接下来我们看一个具体的案例，虚拟化身AI助手——这是一个非常典型的端到端用例，充分利用了高通的异构计算能力。

它包括许多复杂的人工智能工作负载。

首先，自动语音识别（ASR）模型负责将语音信号转换为文本。

这部分工作负载可以在高通传感器集线器上运行。

接下来，大语言模型负责处理文本输入并生成Reply和对话，这部分工作量可以在NPU上运行；然后通过文本转语音（TTS）模型将文本输出转换为语音信号，这部分负载可以在CPU上运行；最后，GPU模块负责同步完成基于语音输出的虚拟化身渲染，这样就可以得到一个端到端的与语音交互的虚拟化身助手用例。

前面介绍了硬件技术，现在分享一下高通平台的AI性能。

在智能手机领域，第三代骁龙8不仅在鲁大师AIMark V4.3、安兔兔AITuTu等AI基准测试中取得了总体成绩，而且在MLCommon MLPerf Inference: Mobile V3的特定模型推理性能测试中也取得了总分。

.1.各方面性能均远超竞品。

在PC端，Snapdragon X Elite在Windows的UL Procyon AI推理基准测试中也优于基于X86架构的竞品。

除了提供领先的硬件平台设计外，高通还推出了跨平台、跨终端、跨操作系统的统一软件堆栈，称为Qualcomm AI Stack。

高通AI软件堆栈支持当前所有主流训练框架和执行环境。

我们还为开发者提供了不同层次、不同层次的优化接口，以及完整的编译工具链，让开发者可以在Snapdragon平台上更高效地完成任务。

模型开发、优化和部署。

值得强调的是，高通AI软件栈是跨平台、跨终端的统一解决方案，因此开发者只要在高通和骁龙平台上完成模型的优化和部署就可以轻松完成这部分工作。

从 Qualcomm 和 Snapdragon 迁移到其他所有产品。

在今年的MWC巴塞罗那期间，高通发布了一款非常重要的产品——高通AI Hub（Qualcomm AI Hub）。

该产品面向第三方开发者和合作伙伴，可以帮助开发者更充分地利用高通和Snapdragon底层芯片的硬件计算能力来开发自己的创新AI应用。

使用Qualcomm AI Hub进行应用开发的过程就像“把大象放进冰箱”一样简单。

第一步是根据用例选择所需的模型；第二步，选择需要部署的高通或者骁龙平台；第三步，只需要写几行脚本代码就可以完成整个模型部署并在终端端看到应用。

或算法的性能。

目前Qualcomm AI Hub已经支持了10多个模型，其中包括大家比较关心的生成式AI模型，包括语言、文本和图像生成，也包括传统的AI模型，如图像识别、图像分割、自然语言理解等，以及自然语言处理。

具体型号信息欢迎您访问高通AI Hub网站（AIHUB.QUALCOMM.COM）查询。

最后，我们来总结一下高通在AI领域的领先地位。

首先，高通拥有无与伦比的终端侧AI性能；第二，高通拥有顶尖的异构计算能力，使AI能力贯穿整个SoC，充分释放CPU、GPU、NPU和高通传感器中枢的能力进行应用开发。

第三，我们提供可扩展的AI软件工具，即高通AI前面提到的软件堆栈；最后，我们可以支持广泛的生态系统和人工智能模型。

雷锋网（公众号：雷锋网）雷锋网版权文章未经授权禁止转载。

详情请参见转载说明。

#阿里云#创新创业#创业支持#创业资讯我们关注国内外最热门的创新创业动态，提供一站式资讯服务，实时传递行业热点新闻、深度评论和前瞻观点帮助企业家掌握新兴技术。

趋势和行业变化，以及对未来技术趋势的洞察。

站长声明

标签：

上一篇：据悉，腾讯控股完成A轮融资

下一篇：【创业24小时】2023年8月4日

启函生物姊妹公司eGenesis获1.25亿美元融资，将用于跨物种器官移植技术

3月4日消息，致力于开发与人类相容的器官、组织和细胞的公司eGenesis宣布，已成功完成1.25亿美元C轮融资。获得的资金将用于推进公司在肾脏和胰岛细胞移植方面的研发项目进入临床研究。此外，这笔资金将用于继续开发公司专有的基因编辑平台和扩大 GMP 生产规模。 eGenesis由

06-18
只需15分钟，你的iPhone就可以“复制”你的声音

史蒂芬霍金的“机械电子音”可能是世界上最容易辨认的声音之一。但这并不是霍金自己的声音。当霍金因肌萎缩侧索硬化症而失去说话能力时，技术还不足以让他发出自己的声音。事实上，只有少数人能够使用语音合成器。如今，ALS患者虽然有了更多的语音合成选择，但整体成本和

06-21
蓝湖照明完成数千万元Pre-A轮融资

投资界（ID：pedaily）4月30日，白光激光照明核心零部件研发和制造商蓝湖照明获数千万元融资人民币Pre-A轮融资。融资方面，投资方为野草创投。本轮融资将主要用于为方向上多个项目开发新产品。蓝湖照明科技是一家专注于激光照明领域的研发企业。公司成立于2011年，通过自

06-17
悠然牧业香港IPO面向散户投资者超额认购约3.73倍，股票将于6月18日挂牌

公告显示，悠然牧业香港公开发售超额认购不足15次，所以重新认购分配程序没有被采用。国际发售部分也出现轻微超额认购，相当于国际发售初始可供认购股份总数约3.88倍。发售价为每股6.98港元。所得款项净额约为32.4亿港元。

06-17
古井贡酒：上半年净利润13.79亿元，同比增长34.53%

古井贡酒发布中期业绩公告。报告显示，上半年古井贡酒营收70.07亿元，同比增长26.96%；归属于母公司净利润13.79亿元，同比增长34.53%。

06-17
深亮6英寸VCSEL芯片生产线即将投产，解决3D传感光源燃眉之急

MEMS 中国首条6英寸VCSEL芯片生产线落户火炬区逸仙微电子产业园广东中山深亮智能科技（中山）有限公司拥有VCSEL核心技术和深厚的行业积累。即将量产紧缺的VCSEL芯片，满足手机3D传感、光通信、智能驾驶传感等领域的迫切需求，一举解决我国半导体激光器“缺芯”问题。困境。

06-06
专注中国-东非跨境贸易，蝶曦科技宣布完成300万种子轮融资

投资界（ID：pedaily）3月24日消息，专注于中国-东非跨境贸易的跨境海外科技公司蝶曦科技中国-东非贸易项目，完成1万元种子轮融资。本轮投资主要来自行业相关方，将用于商业模式拓展验证和海外团队建设。蝶希科技团队认为，在东非国家税收政策调整、一带一路倡议、非洲本土

06-17
一首Web3小白的《DAO漂流》

真爱如鬼，人人都在谈论，但没人却真真切切地见过。从某种意义上来说，把这句话开头的“真爱”换成“Web3”也未尝不可。今年，Web3已经成为大家都在讨论的一个术语，并且有强烈的趋势将其替换为“元宇宙”。但与元宇宙不同的是，大多数人只能是消费者和体验者。以DAO和Pl

06-18
打造办公社交电商，犀牛GO获数千万天使轮融资

据投资界8月19日消息，据铅笔路报道，办公社交电商“犀牛GO”获今年一月从道森资本获得数千万资金。天使轮投资。据了解，Rhino GO成立于2019年7月，创始人陈俊奇是易果新零售事业群前副总裁。以犀牛GO的代表产品悦GO为例。它基于办公室同事与同事之间牢固的社交关系，专

06-18
钟南山团队已与阿里云达成合作，致力于新冠病毒药物和疫苗的研发

为了尽快研发出新冠病毒相关疫苗和特效药物，2月13日，钟南山团队广东省医学基金会、广州呼吸健康研究院与阿里巴巴云南、马云公益基金会达成合作，加快研发临床治疗COVID-19的关键技术、有效药物和疫苗。征服新冠病毒的关键步骤之一是尽快缩短新药和疫苗的研发周期。新药、

06-17
T3旅游获数亿元A+轮融资，洪泰基金行动，

投资圈（ID：pedaily）据投资圈（ID：pedaily）7月28日消息，洪泰世家获悉，国家核心智慧出行平台南京灵星科技有限公司（以下简称“T3出行”获得洪泰基金投资的数亿元A+轮融资，本轮融资将主要用于扩大用户规模和运力、孵化生态产品和服务以及投入研究。据悉，继2018年完成7

06-18
NAND原厂自2月份起陆续涨价5%，部分美光Flash产品涨幅超过15%

财联社财联社3月2日讯，今年第一季度DRAM现货价格持续上涨。预计二季度合同价即将出现变动。铠侠与西部数据（WD）合资的日本NAND工厂发生原材料污染事件。全球NAND产量减少的影响有所扩大。尽管业内预计供应短缺效应将从二季度开始全面显现。然而，NAND价格较第一季度

06-06