首页 > 科技动态 > 内容

解读- Arm机器学习处理器的独特之处

发布于:2024-06-17 编辑:匿名 来源:网络

【图片来源:Arm社区 楼主:Arm社区】雷锋网记者:Arm社区最近发表了一篇文章,深入介绍了一种机器学习处理器(Machine Learning Processor),它是了解该处理器可以加速边缘设备上的计算过程;这是Arm首次专门推出类似NPU的AI专用处理器。

雷锋网整理全文如下。

想想看,你有多少个连接设备?无论您是小玩意儿爱好者还是普通小玩意儿拥有者,您现在拥有的小玩意儿很可能比五年前还要多。

从智能手机和平板电脑到个人健身追踪器、智能哮喘吸入器和智能门铃,我们年复一年地变得更加互联,导致个人数据爆炸式增长。

根据最近的一份报告,全球人均联网设备数量将从过去十年的不到 2 台跃升至 2020 年的 6.58 台——大量设备会产生大量数据。

传统上,这些数据将被发送到云端进行处理;但随着数据量和设备呈指数级增长,不断地来回移动数据是不切实际的,更不用说安全且具有成本效益了。

幸运的是,机器学习 (ML) 的最新进展意味着现在可以在设备上完成比以往更多的处理和预处理。

这带来了多种好处,包括由于降低了数据泄露风险而提高了安全性、节省了成本和功耗。

在云和设备之间来回移动数据的基础设施并不便宜,因此设备上可以完成的处理越多越好。

性能曲线上的功率和效率设备上的机器学习从 CPU 开始,CPU 充当熟练的“流量控制器”,可以自行管理整个机器学习工作负载,也可以将选定的任务分配给特定的机器学习处理器。

Arm CPU 和 GPU 已经跨越了性能曲线,为数千个 ML 用例提供支持,尤其是在移动设备上,边缘机器学习推动了消费者期望的标准功能的实现。

随着这些处理器变得更加强大和高效,它们能够驱动更高的性能,为边缘的安全机器学习提供更多的设备上计算能力。

(例如,第三代DynamIQ大核Arm Cortex-A77 CPU,可以在不影响电池寿命的情况下管理计算密集型任务,以及Arm Mali-G77 GPU,可以为ML提供60%的性能提升。

)但是,虽然 CPU 和 GPU 本身就是 ML 的动力源,但在最密集、最高效的性能要求下,它们可能很难独自满足该需求。

正是在这些任务中,Arm ML 处理器等专用神经处理单元 (NPU) 的强大功能将派上用场,为边缘的 ML 推理提供最高吞吐量和最高效的处理。

平衡性能和功耗 是什么让 ML 处理器如此特别?它的特别之处在于它基于全新的架构,面向智能手机、智能相机、增强现实和虚拟现实设备(AR/VR)、无人机以及医疗电子和消费电子等互联设备。

其高达 4 TOP/s 的计算性能实现了以前由于电池寿命或热限制而无法实现的新用例 - 允许开发人员创造新的用户体验,例如 3D 面部解锁或具有深度控制或肖像照明的高级肖像模式功能等等。

当然,性能优越是一件好事。

但如果它要求您每隔几个小时给设备充电一次或随身携带移动电源,那就不太好了。

为了将用户从充电线的束缚中解放出来,这款机器学习处理器拥有业界领先的 5TOPs/W 功率效率,这是通过重量压缩、激活压缩和 Winograd 等最先进的优化实现的。

Winograd 使关键卷积滤波器的性能比其他 NPU 更好,占用空间更小,并提高效率,同时减少任何给定设计所需的组件数量。

解读- Arm机器学习处理器的独特之处

这反过来又降低了成本和功耗要求,同时又不影响用户体验。

该架构由用于高效执行卷积层的固定功能引擎和用于执行非卷积层以及实现选定原语和运算符的可编程层引擎组成。

这些原生支持的功能与常见的神经框架紧密集成,降低了网络部署成本,从而加快了上市时间。

【图片来源:Arm 社区 楼主:Arm 社区】我们来看看这款处理器的参数: 性能:CPU、GPU、DSP 提供巨大提升,最高可达 5 TOPs/W 加速器;网络支持:处理各种流行的神经网络,包括卷积层(CNN)和递归层(RNN),用于分类、对象检测、图像增强、语音识别和自然语言理解;安全性:利用Arm TrustZone架构的基础,最大限度地减少攻击面执行;可扩展性:可多核扩展,单集群最多8个NPU和32个TOP,网格配置最多64个NPU;神经框架支持:与现有框架紧密集成:TensorFlow、TensorFlow Lite、Caffe、Caffe 2 等通过 ONNX 实现的框架; Winograd 卷积:与其他 NPU 相比,普通滤波器速度快 %,能够在更小的区域内实现更高的性能;内存压缩:通过各种压缩技术,最大限度地减少系统内存带宽;异构机器学习计算:Arm Cortex-A CPU 和 Arm Mali GPU 的优化使用;开源软件功能:通过 Arm NN 支持降低成本并避免锁定;为了使开发人员和未来的开发变得更容易,这款 ML 处理器具有集成的网络控制单元和 DMA(直接内存访问)。

这个DMA可以管理整个网络的执行和遍历,还可以在后台将数据移入和移出主存。

同时,板载内存允许集中存储权重和特征图,减少与外部内存的通信并延长电池寿命,这是对消费者期望的标准用户体验的另一个认可。

至关重要的是,这款机器学习处理器足够灵活,可以支持更高要求的用例,运行更多、更大的并发特性:单个集群中可以配置 8 个核心,达到 32 TOP/s 的性能;或者网格配置中最多 64 个 NPU。

最终,这款机器学习处理器增强了性能、提高了效率、降低了网络部署成本,并且通过紧密耦合固定功能和可编程引擎,允许固件随着新功能的开发而更新,从而使这种设计不会过时。

总而言之,通过将功能、效率和灵活性相结合,这款 ML 处理器定义了边缘 ML 推理的未来,使开发人员能够在满足未来用例需求的同时创造当今最佳的用户体验。

雷锋网注:本文编译自Arm社区,雷锋网编译。

雷锋网版权文章未经授权禁止转载。

详情请参阅转载说明。

解读- Arm机器学习处理器的独特之处

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 再次!新能源企业长期合同履约五个要点

    再次!新能源企业长期合同履约五个要点

    当前,我国光伏、储能等新能源产业正处于快速发展阶段,大量企业积极走出国门,开拓海外市场。 “中国全球电动汽车产销量占全球60%,光伏产业链产能已占全球80%。 ”面对高频创新、全球化加速、产业链深度融合等挑战,新能源企业科学管理、降本增效。 ,提升核心竞争力的需要

    06-18

  • 皖药公司1.5亿投资LP

    皖药公司1.5亿投资LP

    投资界-解码LP获悉,近日,丰源药业发布公告称,公司已与北京金工宏源投资管理有限公司(简称:普宏资本)、上海普宏投资有限公司与北京九城投资有限公司共同投资设立合肥康宏生物医药健康产业投资中心(有限合伙)。 该基金认购资本总额为2亿元,其中公司作为有限合伙人以自

    06-18

  • Spark Thinking完成总超4亿美元E轮融资

    Spark Thinking完成总超4亿美元E轮融资

    投资圈(ID:pedaily)1月25日消息,学科精品在线教育公司Spark Thinking宣布完成E3轮融资。 过去5个月,星火思维共获得E1至E3三轮融资,融资金额超过4亿美元,再次打破在线小班赛道融资规模纪录。 本轮融资由挚信资本领投,现有股东跟投,广源资本继续担任独家投资方。 从20

    06-17

  • 海外多渠道客服,摆脱投诉慢问题

    海外多渠道客服,摆脱投诉慢问题

    .wp-block-column h3{margin-left:0} 随着全球化的发展,很多企业都在积极拓展海外市场。 然而,在面对海外客户的服务需求时,很多企业都面临一个通病:投诉慢。 传统的客户服务体系无法有效应对海外客户的投诉,导致投诉处理时间过长,严重影响客户体验和企业声誉。 为了解决

    06-17

  • 穷人的天堂超市天还没亮就倒塌了

    穷人的天堂超市天还没亮就倒塌了

    被各种“刺客”干掉后,折扣店变成了新宠的。 小吃忙、小吃友名、赵一鸣小吃等折扣店在县城、乡镇的商业街上横行。 Good Deals、High Deals、Prosperous Market等折扣店纷纷开张,追逐资本。 就连零售巨头也开始抢夺折扣市场:盒马宣布全面折扣;永辉在门店增设正品折扣店;良

    06-18

  • 王勇:数字经济、绿色低碳经济快速发展

    王勇:数字经济、绿色低碳经济快速发展

    中新社上海新闻6月30日电(高志苗)“聚焦上海智能制造、产业共赢未来”专题系列活动暨一年一度的全球“未来产业”“明星”未来能源专题大赛动员会近日在上海举行。   国家电力投资集团有限公司核能产业创新中心副主任王勇在致辞中表示,当今世界正在迎来新一轮科技革命和产

    06-17

  • 滁州市首支百亿股权投资基金,总规模达100亿元

    滁州市首支百亿股权投资基金,总规模达100亿元

    上头条新闻9月28日,国家战略新兴产业基金(滁州)签约仪式在滁州举行。 该基金总规模1亿元,将重点投资光伏、锂电池、半导体、汽车装备、新材料等相关项目,同时覆盖滁州市8个重大产业链项目。 据了解,该基金由中国国有企业结构调整基金有限责任公司(以下简称“国资调整基

    06-18

  • 【融资24小时】2022年6月11日至12日投融资事件汇总及详情

    【融资24小时】2022年6月11日至12日投融资事件汇总及详情

    2022年6月11日至12日。 过去48小时内,国内市场共发生3起投资披露事件,1起汽车交通(新菱能源链集团)、企业服务(富林特创意产业大脑)、娱乐传媒(游良文化)。 详情 汽车交通创新能源数字开放平台【新链能源链集团】完成上市,净融资额数千万美元。 点击查看企业服务产业

    06-18

  • 云天励飞与深圳联通达成战略合作 5 AIoT产业生态建设又添重量级合作伙伴

    云天励飞与深圳联通达成战略合作 5 AIoT产业生态建设又添重量级合作伙伴

    继6月与深圳人工智能独角兽奥比中光战略合作推动AI+IoT场景应用后,云天励飞助力打造自主知识产权可控5AIoT产业生态建设新增深圳联通作为重量级合作伙伴。 7月5日,云天励飞与深圳联通签署战略合作框架协议,共同推动5G+人工智能+物联网等跨领域技术创新和应用落地。 双方此

    06-17

  • 新闻 -诚益生物科技完成国药资本领投的1亿元A轮融资

    新闻 -诚益生物科技完成国药资本领投的1亿元A轮融资

    投资圈9月6日,新药研发公司上海诚益生物科技有限公司(“诚益生物”)近日宣布,已完成1亿元A轮融资。 此次人民币A轮融资由国药资本领投,糜方资本、泰福资本跟投。   诚益生物由原礼来中国研发中心化学部负责人周敬业博士和原礼来中国研发中心首席科学家徐剑锋博士共同创

    06-18

  • 鑫康合完成B+轮融资,推动创新药研发

    鑫康合完成B+轮融资,推动创新药研发

    投资界(ID:pedaily)7月26日消息,鑫康合生物医药近日完成新一轮超亿元融资,领投方为鑫康合生物医药。 苏州高特佳信银汇鑫基金获北京生命园创投、广州信泰、扬州丰晟等知名金融机构跟投,合唐创新、北极光创投、辰德资本等老股东持续注资。 本轮融资筹集的资金将主要用于推

    06-18

  • 百家云网纳斯达克上市,中国迎来美股首家音视频SaaS上市公司

    百家云网纳斯达克上市,中国迎来美股首家音视频SaaS上市公司

    12月25日,国内音视频技术服务商百家云网宣布与富维影业(控股)有限公司合并。 上市交易正式完成。 至此,孔夫子已正式在纳斯达克上市,成为国内最大的音视频SaaS股。 公司新股票代码将变更为“RTC”,即“Real Time Communication”的缩写。 此外,公告还透露,根据富维影业

    06-18