首页 > 科技未来 > 内容

当我撬开骁龙8时,看到里面全是顶级会议论文

发布于:2024-06-21 编辑:匿名 来源:网络

“除了相机优化和语音助手,移动AI还有什么?”今年新一代骁龙8移动平台发布时,高通再次翻译了它。

打开你的心扉意味着什么?让手机学会“听诊”,通过声音识别用户可能患有的疾病,比如抑郁症、哮喘等;让手机“防偷窥”,通过识别陌生用户的视线自动锁定屏幕。

;让手游实现超分辨率,将以前只能在PC上才能实现的画质搬到手机上体验……更重要的是,骁龙8有能力同时运行这些AI功能!高通称,搭载骁龙8的第七代AI引擎性能较上一代提升高达4倍。

这意味着我们在玩手机的时候,同时“打开”几个AI应用是没有问题的。

更重要的是,它不仅仅是简单的AI性能提升,还为用户提供了流畅的应用体验。

在硬件工艺升级如此困难的今天,高通是如何在第七代AI引擎的性能和应用上想出这么多新花样的呢?我们翻阅了高通发布的一些研究论文和技术文档,发现了一些“端倪”:在高通发布的AIMET开源工具文档中,有提到“如何压缩AI超分辨率模型”的信息;在一篇与“防偷窥”相关的技术博客中介绍了如何在隐私保护的前提下使用目标检测技术……这些文档以及该技术博客背后的顶级会议论文均来自一个组织——高通AI研究院。

可以说,高通在7代AI引擎中“隐藏”了多家研究机构发表的AI论文。

顶文《隐藏》手机AI先来看看第七代AI引擎在拍照算法方面的改进。

在智能识别方面,高通今年将面部特征识别点增加至3个,可以捕捉到更细微的表情变化。

但与此同时,高通将人脸检测的速度提高了%。

你是怎么做到的?在 CVPR 上发表的高通研究中,我们找到了答案。

在这篇文章中,高通提出了一种新的卷积层,称为Skip-Convolutions(跳跃卷积),可以将前后两帧相减,只对变化的部分进行卷积。

没错,就像人眼一样,更容易注意到“运动部件”。

这使得骁龙8在做目标检测、图像识别等视频流实时检测的算法时,可以更加专注于目标物体本身,同时利用多余的算力来提高精度。

你可能会问,这么细致的面部识别拍照有什么用呢?此外,此次高通与徕卡合作推出了徕卡徕兹滤镜,该滤镜采用了基于AI的智能引擎,包括人脸检测等算法,让用户无需思考即可拍摄出更加智能的照片。

艺术风格的照片。

除了人脸检测之外,高通的智能拍摄功能还包括超分辨率、多帧降噪、局部运动补偿……不过,高分辨率拍摄中的视频流通常都是实时的,而到底是做什么用的呢? AI引擎做什么?如何智能处理如此大量的数据?在同一篇CVPR论文中,高通提出了一种由多个级联分类器组成的神经网络,可以根据视频帧的复杂程度改变模型中使用的神经元数量,并自行控制计算量。

面对智能视频处理“庞大而复杂”的流程,AI现在可以坚持下去了。

除了智能摄影之外,高通的语音技术也是此次的一大亮点。

正如开头提到的,第七代AI引擎支持使用手机加速分析用户语音模式,以确定哮喘、抑郁症等健康状况的风险。

那么,如何在不涉及数据采集的情况下,准确区分用户的语音呢?具体来说,高通提出了一种手机上的联邦学习方法,可以利用手机用户的语音来训练模型,同时保证语音数据的隐私不被泄露。

诸如此类的很多AI功能,在高通AI研究院发表的论文中也能找到。

我们也可以从开头提到的AI提升手机性能的理论支撑中找到线索。

这就提出了一个问题:当同时运行如此多的AI模型时,高通如何提高硬件的处理性能?这里不得不提一下高通近年来的重点研究方向——量化。

从高通公布的最新技术路线图来看,模型量化一直是AI研究院近年来研究的核心技术之一,目的是为AI模型“瘦身”。

由于功耗、算力、内存、散热能力有限,手机上使用的AI模型与PC上的有很大不同。

在PC上,GPU可以轻松达到数百瓦的功率,并且AI模型的计算可以使用16或32位浮点数(FP16、FP32)。

手机SoC的功耗只有几瓦,很难存储大型AI模型。

这时就需要将FP32模型缩减为8位整数(INT8)甚至4位整数(INT4),同时保证模型精度不遭受太大损失。

以AI抠图模型为例。

我们通常可以利用计算机处理器的计算能力来实现非常准确的人工智能抠图。

不过相比之下,如果想要用手机实现AI抠图的“类似效果”,就得使用到建模量化的方法。

为了将更多的AI模型放到手机上,高通做了大量的量化研究。

峰会发表的论文包括无数据量化DFQ、舍入机制AdaRound、联合量化剪枝技术Bayesian Bits)等。

其中,DFQ是一种无数据量化技术,可以减少训练AI任务的时间,提高量化精度性能。

在手机上最常见的视觉AI模型MobileNet上,DFQ取得了超越所有其他方法的最佳性能:AdaRound则可以将复杂的Resnet1 8和Resnet 50网络的权重量化为4位,大大减少了网络的存储空间模型,而仅损失不到 1% 的精度:贝叶斯位作为一种新的量化操作,不仅可以将位宽加倍,还可以量化每个新位宽下全精度值与之前舍入值之间的残差,在准确性和效率之间提供更好的权衡。

这些技术不仅让更多的AI模型以更低的功耗运行在手机上,也让原本只能在电脑上运行的游戏AI超分辨率(类似DLSS)现在可以在骁龙8上运行。

甚至有些AI模型可以“同时运行”,比如姿势检测和人脸识别:事实上,论文只是第一步。

想要将AI能力快速应用到更多应用中,还需要更多相应的平台和开源工具。

高通保持开放态度,将更多AI能力释放到应用中。

高通AI研究院通过合作、开源等方式,与更多开发者社区和合作伙伴分享了这些论文中高效构建AI应用的方法和模型。

由此,我们可以在骁龙8上体验到更多有趣的功能和应用。

一方面,高通与谷歌合作,与开发者分享快速开发更多AI应用的能力。

高通在骁龙8上搭载了谷歌的Vertex AI NAS服务,每月更新一次,这意味着开发者在第七代AI引擎上开发的AI应用的模型性能也可以快速更新。

使用NAS,开发者可以自动利用AI生成合适的模型,包括高通在峰会上宣布的智能摄影算法、语音翻译、超分辨率……都可以纳入AI的“筛选范围”,并自动提供开发人员的最佳模型。

哪个匹配最好的模型。

这里使用了高通的运动补偿和帧插值算法。

开发者也可以通过NAS实现类似这些的AI技术,而且也可以更好的适配骁龙8,不存在“训练不足”的问题。

想象一下,以后使用搭载骁龙8的手机玩游戏时,会感觉画面更加流畅,但不会消耗更多电量(指功耗增加):同时,维护AI模型的构建也变得更加简单。

据谷歌称,与其他平台相比,Vertex AI NAS 可以将训练模型所需的代码行数减少近 80%。

另一方面,高通也开源了多年来积累的量化研究工具。

去年,高通开源了一款名为 AIMET(AI Model Efficiency Toolkit)的模型“效率提升”工具。

它包含神经网络剪枝、奇异值分解(SVD)等大量压缩和量化算法,其中不少是高通AI研究院发表的顶级会议论文成果。

开发者使用AIMET工具后,可以直接利用这些算法来改进自己的AI模型,让其在手机上运行得更加流畅。

高通的量化能力不仅开源给普通开发者,还让更多来自领先AI公司的AI应用能够在骁龙8上落地。

在新的骁龙8上,他们与人工智能领域知名公司Hugging Face进行了合作。

NLP,让手机上的智能助手能够帮助用户分析通知并推荐哪些通知可以优先处理,让用户一眼就能看到最重要的通知。

当在 Qualcomm AI Engine 上运行他们的情感分析模型时,它比普通 CPU 快 30 倍。

正是技术研究的积累和在技术上保持的开放态度,让高通不断刷新手机行业的各种AI“新思路”:从之前的视频智能“淘汰”、智能会议静音,到今年的反窥视屏、手机超分辨率……以及更多论文、平台和开源工具实现的AI应用也都包含在这个AI引擎中。

一直隐藏在这些研究背后的高通AI研究院,随着第七代AI引擎的亮相,重新浮出水面。

高通AI的“软硬件兼备” 很多时候,我们对高通AI的印象似乎还是集中在AI引擎的“硬件性能”上。

毕竟,自2018年推出首个AI项目以来,高通一直在硬件性能方面提升AI模型的处理能力。

不过,高通对于AI算法的研究也是“谋划已久”。

2016年,高通成立了AI研究院,由AI领域知名理论学者Max Welling担任院长,他是深度学习之父Hinton的学生。

据不完全统计,高通成立AI研究院以来,已在NeurIPS、ICLR、CVPR等AI顶级学术会议上发表数十篇论文。

其中,至少有四篇模型压缩论文在移动AI端实现,还有多篇与计算机视觉、语音识别、隐私计算相关的论文。

上述第七代AI引擎可以说只是高通近年来AI算法研究成果的一个缩影。

通过Qualcomm AI的研究成果,高通也成功将AI模型扩展到了许多前沿技术应用场景。

在自动驾驶方面,高通推出了骁龙汽车数字平台,“覆盖”从芯片到AI算法的一站式解决方案。

目前,已与超过25家车企达成合作,使用其解决方案的联网汽车数量已达2亿辆。

其中,宝马的下一代辅助驾驶系统和自动驾驶系统将采用高通的自动驾驶解决方案。

在XR上,高通发布了Snapdragon Spaces XR开发平台,用于开发头戴式AR眼镜等设备和应用。

通过与Wanna Kicks合作,骁龙8还将第七代AI引擎的能力带到了AR试戴APP中。

在无人机方面,高通今年发布了Flight RB5 5G平台。

其很多功能,如避障、无人机摄影防抖等,都可以通过平台搭载的AI模型来实现。

其中,第一架抵达火星的无人机“匠心号”配备了高通公司提供的处理器和相关技术。

当我撬开骁龙8时,看到里面全是顶级会议论文

回过头来看,不难发现,这次高通在AI性能方面不再强调硬件算力(TOPS)的提升。

而是将软硬件结合起来获取AI性能提升4倍的数据,进一步提升AI应用体验。

全面落实。

这不仅表明高通更加注重实际的用户体验,也表明了高通对自身软件实力的信心,因为硬件不再是高通AI能力的完整体现。

可以说,骁龙8第七代AI引擎的升级,标志着高通AI软硬件融合的开始。

近期,高通提出了几项关于编解码器的最新研究,并发表在 ICCV 和 ICLR 上。

在这些论文中,高通还利用AI算法展示了编解码器优化的新思路。

在一项利用GAN原理的研究中,高通最新的编解码算法使图像不仅更清晰,而且体积更小,只需要14.5KB即可完成:相比之下,原始编解码算法每帧需要14.5KB。

帧压缩到16.4KB后,森林会变得极其模糊:在另一篇采用帧插值结合神经编解码器思想的论文中,高通选择将P帧压缩和基于神经网络的帧插值补偿相结合,使用AI预测帧插值后所需的运动补偿。

经过测试,该算法优于谷歌此前在CVPR上的SOTA记录,也优于目前基于H.标准的开源编解码器的压缩性能。

这并不是高通第一次尝试将AI模型应用到更多领域。

视频编解码器的应用是另一个新的方向。

如果这些模型能够在平台甚至应用程序上成功实现,我们将能够在我们的设备上观看视频而不会出现任何故障。

随着“软硬件一体化”解决方案的不断推进,未来我们或许真的能看到这些最新的AI成果应用到智能手机上。

结合高通在PC、汽车、XR等领域的“秀肌肉”……可以预见,你熟悉的高通、你熟悉的骁龙肯定不会止步于手机,其AI能力也不会止步于手机。

停在手机上。

当我撬开骁龙8时,看到里面全是顶级会议论文

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 宸汐健康完成超亿元A轮融资,国药控股加速创造新生产力

    宸汐健康完成超亿元A轮融资,国药控股加速创造新生产力

    投资圈(ID:pedaily)4月10日消息,国药控股健康管理及患者综合服务平台宸汐健康宣布完成过亿人民币A轮融资。 本轮融资由上海国际集团资产管理有限公司(“上海国际资管”)领投,耀金资本(原国药中金)、四川创新发展投资管理有限公司跟投。 今年4月太平洋保险成立后,公司

    06-18

  • 国元证券一季度归属母公司净利润3.34亿元,同比增长18.01%

    国元证券一季度归属母公司净利润3.34亿元,同比增长18.01%

    今年1-3月,公司实现营收9.22亿元,同比增长18.01% ——同比增长1.32%;归属于母公司净利润3.34亿元,同比增长18.01%。 同比增长18.01%。

    06-18

  • 江西省现代产业引导基金来了,规模600亿

    江西省现代产业引导基金来了,规模600亿

    据投资界(ID:pedaily)5月16日消息,近日,经江西省市场监督管理局批准,江西省现代产业引导基金(有限合伙) 注册于赣江新区,注册资本1亿元。 来源:天眼查 继江西国控私募基金管理有限公司(简称“国控基金”)于4月18日取得基金管理人资格后,江西省现代产业引导基金(

    06-17

  • NYPC卡贝基金设立3亿元基金 诚和创投承诺注资

    NYPC卡贝基金设立3亿元基金 诚和创投承诺注资

    据投资界10月20日消息,NYPC卡贝基金CEO大卫卡贝昨天透露,该机构近期在苏州注册了一支新的人民币基金。 该基金名为“苏州卡贝登基金”,募集目标3亿元。 LP主要来自苏州地区。 该基金没有特定的目标投资领域,专注于消费品、医疗保健、教育和清洁技术行业。    据了解,今

    06-18

  • B站发布2023年Q1财报:毛利润同比增长37%,净亏损同比大幅收窄72%

    B站发布2023年Q1财报:毛利润同比增长37%,净亏损同比大幅收窄72%

    北京时间6月1日(美国东部时间6月1日),哔哩哔哩(纳斯达克股票代码:BILI,港交所:(以下简称“哔哩哔哩”)公布了截至2019年3月31日的第一季度未经审计财务报告。 财报显示,第一季度,哔哩哔哩总收入达到50.7亿元人民币,日均活跃用户达9万,同比增长18% 新的一年,B站将

    06-18

  • 一起教育科技发布2023年第一季度财报,数字化转型业务稳步推进

    一起教育科技发布2023年第一季度财报,数字化转型业务稳步推进

    6月15日,一起教育科技(YQ.US)发布第一季度财报。 财报数据显示,截至2019年3月31日,易通教育科技现金及等价物及短期投资总额为6.4亿元。 公司账面现金充足,为未来发展提供充足的资本储备。 报告期内,公司净营收为人民币1万元,非美国通用会计准则调整后净亏损为人民币1

    06-18

  • 【全球财经24小时】2024年2月18日投融资事件汇总及详情

    【全球财经24小时】2024年2月18日投融资事件汇总及详情

    欢迎订阅《全球财经24小时》系列文章,动动你的小手指,帮助我们更好更快地获取资讯给你~ 点击此处输入表格摘要。 今日全球市场共发生14起投资披露事件,其中境内10起,境外4起。 其中,国内先进制造业3起,医疗健康行业5起,消费行业1起,电商行业1起。 涉外企业服务行业1例

    06-17

  • 为了迎接更多的Model 3,特斯拉的充电网络和加油站走到了一起

    为了迎接更多的Model 3,特斯拉的充电网络和加油站走到了一起

    据《华盛顿邮报》报道,特斯拉目前正在与美国连锁加油站Sheetz洽谈合作,希望开设后者的连锁加油站在美国的商店建设充电桩并扩大其充电网络。 Sheetz、副总裁、Michael和Lorenz表示,双方目前正在讨论此项合作,尚未达成明确协议。 特斯拉发言人透露,特斯拉正在积极与各加油

    06-18

  • 6亿,河南卫辉市成立新兴产业基金

    6亿,河南卫辉市成立新兴产业基金

    投资圈——解码LP消息,7月20日,我市中鼎创新股权投资基金揭牌。 该基金总规模6亿元,将重点支持新能源、新材料、高端装备、数字经济等新兴产业。 据了解,中鼎创新股权投资基金由卫辉投资集团与中原证券共同设立。 该基金是新乡市8个县(市)中第一只股权投资基金。 也是中

    06-18

  • 《大白兔视频》获数千万元A轮融资

    《大白兔视频》获数千万元A轮融资

    11月19日消息,据36氪报道,MCN《白兔视频》已完成数千万元A轮融资,投资方为中林资本、野草创投等机构,嘉银资本担任独家财务顾问。 白兔视频成立于2007年,现已孵化出拥有抖音粉丝的网红罗望语。 据悉,罗望宇已连续四周位居《星图》种草榜榜首,单视频最高带货数超过一万。

    06-18

  • 拼多多获1.1亿美元B轮融资,钱还没用完就已经做好了开战的准备!

    拼多多获1.1亿美元B轮融资,钱还没用完就已经做好了开战的准备!

    来自投资界的消息,移动社交电商拼多多宣布完成1.1亿美元B轮融资。 投资方为高榕资本、新天域资本、腾讯等机构。 泰合资本负责本轮融资。    拼多多成立于2019年9月,是一家专注于C2B团购的第三方社交电商平台。 通过与好友、家人、邻居等发起团购,用户可以以更低的价格购

    06-18

  • 俄罗斯搜索引擎Yandex计划发起IPO融资15亿美元

    俄罗斯搜索引擎Yandex计划发起IPO融资15亿美元

    外媒报道,俄罗斯领先的搜索引擎、俄罗斯最大的互联网公司Yandex据称正在考虑首次公开募股,让该公司筹集1十亿英镑(15.6 亿美元)。 。 有报道称,Yandex 正在考虑明年初在英国上市,但尚未确定在美国纳斯达克市场的选择。   在俄罗斯互联网巨头 Mail.ru成功上市后,Yande

    06-18