首页 > 科技未来 > 内容

当我撬开骁龙8时,看到里面全是顶级会议论文

发布于:2024-06-21 编辑:匿名 来源:网络

“除了相机优化和语音助手,移动AI还有什么?”今年新一代骁龙8移动平台发布时,高通再次翻译了它。

打开你的心扉意味着什么?让手机学会“听诊”,通过声音识别用户可能患有的疾病,比如抑郁症、哮喘等;让手机“防偷窥”,通过识别陌生用户的视线自动锁定屏幕。

;让手游实现超分辨率,将以前只能在PC上才能实现的画质搬到手机上体验……更重要的是,骁龙8有能力同时运行这些AI功能!高通称,搭载骁龙8的第七代AI引擎性能较上一代提升高达4倍。

这意味着我们在玩手机的时候,同时“打开”几个AI应用是没有问题的。

更重要的是,它不仅仅是简单的AI性能提升,还为用户提供了流畅的应用体验。

在硬件工艺升级如此困难的今天,高通是如何在第七代AI引擎的性能和应用上想出这么多新花样的呢?我们翻阅了高通发布的一些研究论文和技术文档,发现了一些“端倪”:在高通发布的AIMET开源工具文档中,有提到“如何压缩AI超分辨率模型”的信息;在一篇与“防偷窥”相关的技术博客中介绍了如何在隐私保护的前提下使用目标检测技术……这些文档以及该技术博客背后的顶级会议论文均来自一个组织——高通AI研究院。

可以说,高通在7代AI引擎中“隐藏”了多家研究机构发表的AI论文。

顶文《隐藏》手机AI先来看看第七代AI引擎在拍照算法方面的改进。

在智能识别方面,高通今年将面部特征识别点增加至3个,可以捕捉到更细微的表情变化。

但与此同时,高通将人脸检测的速度提高了%。

你是怎么做到的?在 CVPR 上发表的高通研究中,我们找到了答案。

在这篇文章中,高通提出了一种新的卷积层,称为Skip-Convolutions(跳跃卷积),可以将前后两帧相减,只对变化的部分进行卷积。

没错,就像人眼一样,更容易注意到“运动部件”。

这使得骁龙8在做目标检测、图像识别等视频流实时检测的算法时,可以更加专注于目标物体本身,同时利用多余的算力来提高精度。

你可能会问,这么细致的面部识别拍照有什么用呢?此外,此次高通与徕卡合作推出了徕卡徕兹滤镜,该滤镜采用了基于AI的智能引擎,包括人脸检测等算法,让用户无需思考即可拍摄出更加智能的照片。

艺术风格的照片。

除了人脸检测之外,高通的智能拍摄功能还包括超分辨率、多帧降噪、局部运动补偿……不过,高分辨率拍摄中的视频流通常都是实时的,而到底是做什么用的呢? AI引擎做什么?如何智能处理如此大量的数据?在同一篇CVPR论文中,高通提出了一种由多个级联分类器组成的神经网络,可以根据视频帧的复杂程度改变模型中使用的神经元数量,并自行控制计算量。

面对智能视频处理“庞大而复杂”的流程,AI现在可以坚持下去了。

除了智能摄影之外,高通的语音技术也是此次的一大亮点。

正如开头提到的,第七代AI引擎支持使用手机加速分析用户语音模式,以确定哮喘、抑郁症等健康状况的风险。

那么,如何在不涉及数据采集的情况下,准确区分用户的语音呢?具体来说,高通提出了一种手机上的联邦学习方法,可以利用手机用户的语音来训练模型,同时保证语音数据的隐私不被泄露。

诸如此类的很多AI功能,在高通AI研究院发表的论文中也能找到。

我们也可以从开头提到的AI提升手机性能的理论支撑中找到线索。

这就提出了一个问题:当同时运行如此多的AI模型时,高通如何提高硬件的处理性能?这里不得不提一下高通近年来的重点研究方向——量化。

从高通公布的最新技术路线图来看,模型量化一直是AI研究院近年来研究的核心技术之一,目的是为AI模型“瘦身”。

由于功耗、算力、内存、散热能力有限,手机上使用的AI模型与PC上的有很大不同。

在PC上,GPU可以轻松达到数百瓦的功率,并且AI模型的计算可以使用16或32位浮点数(FP16、FP32)。

手机SoC的功耗只有几瓦,很难存储大型AI模型。

这时就需要将FP32模型缩减为8位整数(INT8)甚至4位整数(INT4),同时保证模型精度不遭受太大损失。

以AI抠图模型为例。

我们通常可以利用计算机处理器的计算能力来实现非常准确的人工智能抠图。

不过相比之下,如果想要用手机实现AI抠图的“类似效果”,就得使用到建模量化的方法。

为了将更多的AI模型放到手机上,高通做了大量的量化研究。

峰会发表的论文包括无数据量化DFQ、舍入机制AdaRound、联合量化剪枝技术Bayesian Bits)等。

其中,DFQ是一种无数据量化技术,可以减少训练AI任务的时间,提高量化精度性能。

在手机上最常见的视觉AI模型MobileNet上,DFQ取得了超越所有其他方法的最佳性能:AdaRound则可以将复杂的Resnet1 8和Resnet 50网络的权重量化为4位,大大减少了网络的存储空间模型,而仅损失不到 1% 的精度:贝叶斯位作为一种新的量化操作,不仅可以将位宽加倍,还可以量化每个新位宽下全精度值与之前舍入值之间的残差,在准确性和效率之间提供更好的权衡。

这些技术不仅让更多的AI模型以更低的功耗运行在手机上,也让原本只能在电脑上运行的游戏AI超分辨率(类似DLSS)现在可以在骁龙8上运行。

甚至有些AI模型可以“同时运行”,比如姿势检测和人脸识别:事实上,论文只是第一步。

想要将AI能力快速应用到更多应用中,还需要更多相应的平台和开源工具。

高通保持开放态度,将更多AI能力释放到应用中。

高通AI研究院通过合作、开源等方式,与更多开发者社区和合作伙伴分享了这些论文中高效构建AI应用的方法和模型。

由此,我们可以在骁龙8上体验到更多有趣的功能和应用。

一方面,高通与谷歌合作,与开发者分享快速开发更多AI应用的能力。

高通在骁龙8上搭载了谷歌的Vertex AI NAS服务,每月更新一次,这意味着开发者在第七代AI引擎上开发的AI应用的模型性能也可以快速更新。

使用NAS,开发者可以自动利用AI生成合适的模型,包括高通在峰会上宣布的智能摄影算法、语音翻译、超分辨率……都可以纳入AI的“筛选范围”,并自动提供开发人员的最佳模型。

哪个匹配最好的模型。

这里使用了高通的运动补偿和帧插值算法。

开发者也可以通过NAS实现类似这些的AI技术,而且也可以更好的适配骁龙8,不存在“训练不足”的问题。

想象一下,以后使用搭载骁龙8的手机玩游戏时,会感觉画面更加流畅,但不会消耗更多电量(指功耗增加):同时,维护AI模型的构建也变得更加简单。

据谷歌称,与其他平台相比,Vertex AI NAS 可以将训练模型所需的代码行数减少近 80%。

另一方面,高通也开源了多年来积累的量化研究工具。

去年,高通开源了一款名为 AIMET(AI Model Efficiency Toolkit)的模型“效率提升”工具。

它包含神经网络剪枝、奇异值分解(SVD)等大量压缩和量化算法,其中不少是高通AI研究院发表的顶级会议论文成果。

开发者使用AIMET工具后,可以直接利用这些算法来改进自己的AI模型,让其在手机上运行得更加流畅。

高通的量化能力不仅开源给普通开发者,还让更多来自领先AI公司的AI应用能够在骁龙8上落地。

在新的骁龙8上,他们与人工智能领域知名公司Hugging Face进行了合作。

NLP,让手机上的智能助手能够帮助用户分析通知并推荐哪些通知可以优先处理,让用户一眼就能看到最重要的通知。

当在 Qualcomm AI Engine 上运行他们的情感分析模型时,它比普通 CPU 快 30 倍。

正是技术研究的积累和在技术上保持的开放态度,让高通不断刷新手机行业的各种AI“新思路”:从之前的视频智能“淘汰”、智能会议静音,到今年的反窥视屏、手机超分辨率……以及更多论文、平台和开源工具实现的AI应用也都包含在这个AI引擎中。

一直隐藏在这些研究背后的高通AI研究院,随着第七代AI引擎的亮相,重新浮出水面。

高通AI的“软硬件兼备” 很多时候,我们对高通AI的印象似乎还是集中在AI引擎的“硬件性能”上。

毕竟,自2018年推出首个AI项目以来,高通一直在硬件性能方面提升AI模型的处理能力。

不过,高通对于AI算法的研究也是“谋划已久”。

2016年,高通成立了AI研究院,由AI领域知名理论学者Max Welling担任院长,他是深度学习之父Hinton的学生。

据不完全统计,高通成立AI研究院以来,已在NeurIPS、ICLR、CVPR等AI顶级学术会议上发表数十篇论文。

其中,至少有四篇模型压缩论文在移动AI端实现,还有多篇与计算机视觉、语音识别、隐私计算相关的论文。

上述第七代AI引擎可以说只是高通近年来AI算法研究成果的一个缩影。

通过Qualcomm AI的研究成果,高通也成功将AI模型扩展到了许多前沿技术应用场景。

在自动驾驶方面,高通推出了骁龙汽车数字平台,“覆盖”从芯片到AI算法的一站式解决方案。

目前,已与超过25家车企达成合作,使用其解决方案的联网汽车数量已达2亿辆。

其中,宝马的下一代辅助驾驶系统和自动驾驶系统将采用高通的自动驾驶解决方案。

在XR上,高通发布了Snapdragon Spaces XR开发平台,用于开发头戴式AR眼镜等设备和应用。

通过与Wanna Kicks合作,骁龙8还将第七代AI引擎的能力带到了AR试戴APP中。

在无人机方面,高通今年发布了Flight RB5 5G平台。

其很多功能,如避障、无人机摄影防抖等,都可以通过平台搭载的AI模型来实现。

其中,第一架抵达火星的无人机“匠心号”配备了高通公司提供的处理器和相关技术。

当我撬开骁龙8时,看到里面全是顶级会议论文

回过头来看,不难发现,这次高通在AI性能方面不再强调硬件算力(TOPS)的提升。

而是将软硬件结合起来获取AI性能提升4倍的数据,进一步提升AI应用体验。

全面落实。

这不仅表明高通更加注重实际的用户体验,也表明了高通对自身软件实力的信心,因为硬件不再是高通AI能力的完整体现。

可以说,骁龙8第七代AI引擎的升级,标志着高通AI软硬件融合的开始。

近期,高通提出了几项关于编解码器的最新研究,并发表在 ICCV 和 ICLR 上。

在这些论文中,高通还利用AI算法展示了编解码器优化的新思路。

在一项利用GAN原理的研究中,高通最新的编解码算法使图像不仅更清晰,而且体积更小,只需要14.5KB即可完成:相比之下,原始编解码算法每帧需要14.5KB。

帧压缩到16.4KB后,森林会变得极其模糊:在另一篇采用帧插值结合神经编解码器思想的论文中,高通选择将P帧压缩和基于神经网络的帧插值补偿相结合,使用AI预测帧插值后所需的运动补偿。

经过测试,该算法优于谷歌此前在CVPR上的SOTA记录,也优于目前基于H.标准的开源编解码器的压缩性能。

这并不是高通第一次尝试将AI模型应用到更多领域。

视频编解码器的应用是另一个新的方向。

如果这些模型能够在平台甚至应用程序上成功实现,我们将能够在我们的设备上观看视频而不会出现任何故障。

随着“软硬件一体化”解决方案的不断推进,未来我们或许真的能看到这些最新的AI成果应用到智能手机上。

结合高通在PC、汽车、XR等领域的“秀肌肉”……可以预见,你熟悉的高通、你熟悉的骁龙肯定不会止步于手机,其AI能力也不会止步于手机。

停在手机上。

当我撬开骁龙8时,看到里面全是顶级会议论文

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 中关村集成电路设计园正式开园

    中关村集成电路设计园正式开园

    中关村集成电路设计园正式开园。 第二届“芯动北京”中关村集成电路产业论坛成功举办。 11月16日,中关村集成电路设计园正式开园并举办第二届。 “芯动力北京”中关村集成电路产业论坛成功举办。 本次活动在中国半导体行业协会和北京市相关委局的指导下,在中国半导体协会集成

    06-06

  • “云海曙造宁波城”来了,一起去一场知识与实践的盛会

    “云海曙造宁波城”来了,一起去一场知识与实践的盛会

    在宁波海曙区,一座既简约又现代的商业大厦矗立在涌水大桥旁。 22层高楼的玻璃是如此清澈透亮,似乎照亮了周围的建筑和溪流。 它建于2001年,有一个响亮的名字——宁波国际大厦。 2019年5月29日,这座大厦的顶层四层迎来了一位大客人的落户——宁波阿里中心。 宁波已经具备发

    06-18

  • 金鱼嘴基金块以新姿态助力南京创新崛起

    金鱼嘴基金块以新姿态助力南京创新崛起

    2019年新型冠状病毒肺炎疫情的爆发,导致全球经济面临增长放缓和结构调整,中国城市经济排名也面临着下滑一波“洗牌”。 随着今年上半年我国GDP数据的陆续公布,十大城市排名也正式出炉,依次为:上海、北京、深圳、重庆、广州、苏州、成都、杭州、南京、和天津。 此次排名前

    06-17

  • 王小川再次发布大模,不过这次是闭源的

    王小川再次发布大模,不过这次是闭源的

    8月8日,立秋的北京终于短暂摆脱了持续近两个月的酷暑,气温舒适。 海淀塞尔大厦,身穿黑色T恤的王小川迟到了。 自百川智能正式宣布启动以来,已经过去了近四个月的时间。 在此期间,百川七号B、百川十三号B相继开源,每两个月一个版本,进展迅速。 而他们的第三款大车型百川

    06-17

  • 首次发布 -雷睿科技完成数千万A轮融资

    首次发布 -雷睿科技完成数千万A轮融资

    投资社区(ID:pedaily)2月23日消息,近日,雷睿科技宣布完成数千万A轮融资,由蓝驰创投领投。 镭科技成立于2011年,是一家模具3D打印应用解决方案提供商,致力于3D打印技术在模具行业的深度工业应用。 创始人和CEO张国良毕业于中国人民大学和复旦大学,拥有多年的制造经验。

    06-17

  • 瑞萨电子推出 R-Car 联盟活跃合作伙伴计划

    瑞萨电子推出 R-Car 联盟活跃合作伙伴计划

    瑞萨电子推出 R-Car 联盟活跃合作伙伴计划,加速汽车移动领域的创新 55 家合作伙伴公司联合发起该计划,构建强大的生态系统,帮助客户快速、轻松选择解决方案 2020 年 10 月 16 日,日本东京 - 全球领先的半导体解决方案供应商瑞萨电子株式会社(TSE:)今天宣布启动“R-Car

    06-06

  • 人人网今年将赴美IPO,计划融资5亿美元

    人人网今年将赴美IPO,计划融资5亿美元

    据外媒报道,人士周五透露,中国社交网站人人网目前正在准备今年赴美IPO,预计筹集约5亿美元。 美元资金。   新闻人士表示,投行摩根士丹利、德意志银行和瑞士信贷将担任人人网首次公开募股的联席证券承销商。 据人士透露,人人网将于今年6月前向美国证监会提交上市申请。

    06-18

  • 运动医学龙头企业万杰天源获亿联资本超亿元战略投资

    运动医学龙头企业万杰天源获亿联资本超亿元战略投资

    据投资界4月26日消息,近日,北京万杰天源医疗器械有限公司(以下简称“万杰天源”)国内领先的运动医学公司(简称“万界天元”)获得精英资本过亿元战略投资。 这是精英资本在中国运动医学领域的又一投资举措。 WinX Capital担任独家投资者。 万杰天源是一家专业从事运动医

    06-17

  • 欢牛蛋糕屋完成近千万美元A轮融资,顺为资本独家投资

    欢牛蛋糕屋完成近千万美元A轮融资,顺为资本独家投资

    投资圈(ID:pedaily)据2月17日消息,原创甜品烘焙连锁品牌欢牛蛋糕屋宣布完成近美国融资1000万美元A轮融资。 本轮融资,由顺为资本独家投资,指数资本担任独家财务顾问。 本轮融资将主要用于门店扩张、供应链建设、品牌推广和团队建设。 目前,国内烘焙市场已达到近亿规模,

    06-18

  • 英飞凌科技被选为全球最具可持续发展企业

    英飞凌科技被选为全球最具可持续发展企业

    英飞凌科技股份公司再次入选道琼斯可持续发展全球指数,跻身全球最具可持续发展企业之列。 英飞凌从半导体行业47家参评企业中脱颖而出,成为全球指数上榜的六家企业之一。 该榜单由专注于可持续发展投资的专业机构RobecoSAM发布。 英飞凌首席财务官斯文施耐德博士表示:“我们

    06-06

  • 视频网站土豆网纳斯达克上市融资1.74亿美元

    视频网站土豆网纳斯达克上市融资1.74亿美元

    据投资界8月18日消息,视频分享网站土豆网正式登陆纳斯达克。 北京时间22:40开始交易,开盘价25.11美元。 较发行价低13.4%。 随后股价有所反弹,但始终没有回到发行价之上。 盘中最高价27.75美元,收盘价25.7美元,较发行价下跌11.38%。 它筹集了1.74亿美元,市值超过7亿美元

    06-17

  • 为什么我看好“小程序”?

    为什么我看好“小程序”?

    Airbnb 再次筹集资金。 据BI报道,该公司已筹集5.55亿美元新融资,估值达1亿美元,由Google Capital和Technology Crossover Ventures领投。 这是其上个月 8.5 亿美元融资计划的一部分。 对于Airbnb员工来说,此次融资最重要的或许是他们可以在交易中出售部分股份。 Airbnb 是

    06-17