首页 > 科技未来 > 内容

高效、低耗、快速,CEVA新推出DSP领跑

发布于:2024-06-17 编辑:匿名 来源:网络

简介:CEVA今日发布第五代成像与计算机视觉DSP产品CEVA-XM6,性能更优、算力更强大、成本更低能源消耗。

深度学习、神经网络和图像/视觉处理已经是计算机科学的重要领域,但它们所依赖的许多工具仍处于起步阶段。

机器学习所需的实时、准确处理数据的能力通常也非常昂贵。

注:本文首发于ANAND TECH,作者Ian Cutress,雷锋网编译,未经许可不得转载。

深度学习、神经网络和图像/视觉处理已经成为一个很大的领域,但其应用仍处于起步阶段。

汽车是这些领域最典型的应用例子。

解决汽车面临的问题需要对硬件和软件同时进行深入的理解和开发,以及实时高精度处理数据的能力。

这为其他机器学习编码开辟了一系列路径,随之而来的就是成本和功耗问题。

CEVA-XM4 DSP希望成为首款支持深度学习的可编程DSP,而就在今天,带有软件生态系统的全新XM6 IP也已推出,效率更高,计算能力更强,还有新的节能专利。

玩IP游戏当CEVA宣布XM4 DSP推理定点算法中预训练的精度与全算法基本一致,误差小于1%时,获得了该领域多项分析师奖项。

CEVA表示,高性能和能效使其在竞争中脱颖而出,并且软件框架取得了初步进展。

该IP于第一季度发布,次年获得许可证,采用该IP生产的第一批硅钢将于今年下线。

此后,CEVA 发布了 CDNN2 平台,这是一种一键式编译工具,可以训练网络并将其转换为适合 CEVA XM IPS 的代码。

新一代XM6集成了前几代XM4的功能,改进了配置,接入了硬件加速器,新增了硬件加速器。

而且,它还保留了CDNN2平台的兼容性。

这样的编码兼容XM4,也可以在XM6上进行高性能运算。

与 ARM 一样,CEVA 也是 IP 业务的一部分,与半导体公司合作,然后将其销售给 OEM。

新产品从创意到实际市场通常需要很长时间,尤其是当安全和汽车等行业快速发展时。

CEVA 将 XM6 转变为可扩展、可编程 DSP,可以通过单一代码库跨越市场,同时利用附加功能来提高功耗、性能并降低成本。

今天发布的产品包括新的 XM6 DSP、CEVA 的新系列成像和视觉软件库、一套新的硬件加速器以及它们与 CDNN2 生态系统的集成。

CDNN2 是一种一键式编译工具,可检测卷积并应用最佳方法通过逻辑块和加速器传输数据。

XM6将支持OpenCL和C++开发工具,以及软件元素,包括CEVA的计算机视觉、神经网络和具有第三方工具的视觉处理库。

该硬件实现了与标准 XM6 内核处理部分的 AXI 连接,以与加速器和内存交互。

XM6 IP包含卷积硬件加速器CDNN Assistant,它允许低功耗固定功能硬件处理神经网络系统的困难部分,例如GoogleNet,校正鱼眼或扭曲镜头上的图像,图像的扭曲是已知的,并且转换功能是固定功能友好的,以及其他第三方硬件加速器。

XM6的两项新硬件功能将有助于大多数图像处理和机器学习算法。

第一个是分散-聚集,或者说能够在一个周期内将L1中缓存的32个地址值读取到向量寄存器中。

CDNN2 编译工具可识别串行代码加载并实现矢量化以实现此功能。

当所需数据通过内存结构分布时,分散-聚集可缩短数据加载时间。

由于 XM6 是可配置 IP,L1 数据存储的大小/相关性在芯片设计级别上是可调的,CEVA 表示此功能对任何 L1 大小都有效。

此阶段处理使用的向量寄存器是宽度为8的VLIW实现器,这样的配置足以满足要求。

高效、低耗、快速,CEVA新推出DSP领跑

第二个功能称为“滑动窗口”数据处理,这种特定的视觉处理技术已获得 CEVA 的专利。

在过程或智能中处理图像的方法有很多,并且算法通常会立即使用平台所需的块或大片像素。

对于智能部分,这些块的数量会重叠,导致图像的不同区域被不同的计算区域重复使用。

CEVA 的方法是保留这些数据,以便进一步分析所需的信息更少。

听起来是不是很简单?在 中,我做了类似的 3D 微分方程分析,确实如此。

令我惊讶的是,它之前还没有被实现用于视觉/图像处理。

如果您有地方存储它,则可以通过重用原始数据来节省时间和精力。

CEVA 声称,XM6 在重矢量工作负载下的性能增益是 XM4 的 3 倍,移植的内核同比平均提升了 2 倍。

在编码方面,XM6 也比 XM4 更容易配置,提供“多 50% 的控制”。

结合特定的 CDNN 硬件加速器(HWA),CEVA 指出生态系统中的卷积层(例如 GoogleNet)消耗了大部分周期。

CDNN HWA 采用这种编码并通过 MAC 为其实现固定硬件,使用 16 位支持实现了 8 倍的性能增益和 95% 的利用率。

CEVA提到,使用12位方法可以节省芯片面积和成本,同时最大限度地减少精度损失,但一些开发人员要求采用完整的16位方法来支持未来的项目,因此选择了16位。

在该领域的汽车图像/视频处理方面,CEVA有两大竞争对手,分别是MobilEye和NVIDIA,后者推出了TX1以方便神经网络的训练和推理。

基于TX1的TSMC 20nm MHz平面处理技术,CEVA表示,他们的内部模拟表明,单机XM6在平台方面的效率提高了25倍,并且比AlexNet和GoogleNet快四倍。

当然,虽然 XM6 也可以在 16nm 或 28nm FinFET 上运行,但这些是其在 20nm 下运行的结果。

这意味着,根据单批 TX1 的已发布数据,在 FP16 下使用 Alexnet 的 XM6 可以以 67 fps 运行,而在 67 fps 下运行时仅需要 5.1 mW,而仅需要 5.1 mW。

在 16FF 中,功率数字可能较低,CEVA 告诉我们,他们的内部测量最初是在 28 nm/16FF 情况下完成的,但他们使用 TX1 在 20 nm 情况下重新测量了它的各个方面。

需要注意的是,TX1多批次值表明比单批次值更好的效率,但是,它无法提供额外的比较值。

CEVA 还使用 DVFS 方案实现功率门控,该方案可在 DSP 或加速器的各个部分空闲时降低功耗。

很明显,NVIDIA 的优势在于其解决方案的可用性以及 CUDA/OpenCL 软件开发,而 CEVA 希望通过一键式软件平台(例如 CDNN2)和改进的硬件(例如 XM6)来实现这两者。

了解哪些半导体合作伙伴和未来的实施工具可以将图像处理与机器学习结合起来。

CEVA指出,智能手机、汽车、安全以及无人机和自动化等商业应用将是主要目标。

来自:ANAND TECH 推荐阅读:微软CEO纳德拉:我们的AI之路将会不一样。

高效、低耗、快速,CEVA新推出DSP领跑

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 一级市场并购退出的难点是什么?

    一级市场并购退出的难点是什么?

    自2019年港股、美股IPO退出受阻以来,创业者和投资者开始意识到IPO退出是一座相对被动的独木桥,并购退出开始受到关注。 今年年中,A股IPO退出因政策调整持续收紧,并购退出关注度再度升级。 诚然,过去二十年中国私募股权市场一直以IPO退出为主,而并购退出一直尤为小众。 然

    06-18

  • IC分销商:8英寸产能紧张明年Q1将继续推高芯片价格

    IC分销商:8英寸产能紧张明年Q1将继续推高芯片价格

    据IC分销商人士透露,由于8英寸晶圆代工产能持续紧张,电源管理IC、网络芯片、供应商的工业和汽车MCU今年第一季度仍有能力提价。 据digitimes报道,随着疫情期间全球企业数字化转型需求增加,以及多个主要国家积极推动碳减排,一线制造商、品牌供应商、金融机构正在实施ESG管

    06-08

  • 吉利汽车与大搜车达成战略合作,打造全国首个汽车直销数字化新零售网络

    吉利汽车与大搜车达成战略合作,打造全国首个汽车直销数字化新零售网络

    5月18日,吉利汽车与大搜车宣布战略合作,共同打造全国首个数字化“实直销、定点”在汽车直销新零售网络中,双方合作的首款直销车型——缤越PRO轻骑BSG版,在大搜车旗下汽车新零售平台当个车上独家推出,固定价格全国0元价。 大搜车创始人兼CEO姚军红(左)与吉利汽车集团副总

    06-17

  • 普洛斯在日本和欧洲的两只物流收益基金已完成新一轮募资

    普洛斯在日本和欧洲的两只物流收益基金已完成新一轮募资

    投资界(ID:pedaily)1月15日消息。 近日,普洛斯在日本和欧洲的两只物流收益基金完成了新一轮募资。 筹集的资金为“GLP日本收入基金”(GLP JIF)和“GLP欧洲收入基金II”(GLP EIP II)。 过去12个月,普洛斯全球物流行业基金管理的资产增加了近1亿美元。 GLP JIF是日本最

    06-18

  • 专注钢铁数字供应链服务,兰格获近亿元A轮融资

    专注钢铁数字供应链服务,兰格获近亿元A轮融资

    投资社区(ID:pedaily)11月30日消息,据创业网消息,钢铁数字供应链服务平台“兰格”宣布据了解,其已完成奇富资本独家投资的近亿元A轮融资。 据悉,本轮融资将主要用于拓展外部区域市场,以及平台智能化、数字化的迭代升级。 据了解,兰格成立于2017年,专注服务钢铁行业2

    06-18

  • 恒大已安排136亿港元自有资金提前偿还美元债本息

    恒大已安排136亿港元自有资金提前偿还美元债本息

    据6月24日消息,今日,中国恒大发布公告称,已安排约136亿港元自有资金偿还美元债本息。 1亿港元转入债券偿还账户,用于偿还本年度债券偿还账户。 6月28日到期的14.5亿美元债券以及全部到期境外美元债到期应付利息近3亿美元,合计约17.5亿美元。 至此,恒大今年3月之前将无境

    06-17

  • B2B医药营销平台“药师帮”完成新一轮融资2.7亿美元

    B2B医药营销平台“药师帮”完成新一轮融资2.7亿美元

    B2B医药营销平台“药师帮”近日完成新一轮融资2.7亿美元。 本轮融资参与方包括珠江投资、百度、阳光保险、松鹤资本、广州基金及某国家主权基金等。 本轮融资将主要用于合同履约各环节的技术升级、药企院外市场数字化营销系统的迭代与建设、药店专业服务场景的数据共享平台建设

    06-18

  • 重庆200亿资金来了

    重庆200亿资金来了

    重庆越来越热闹了。 投资界-Decode LP获悉,近日,重庆两江新区国有企业共同投资设立高质量发展产业投资基金,总金额1亿元,重点关注重点行业技术创新引导投资和重大项目,推动新区乃至重庆产业高质量发展。 据悉,本次母基金总规模1亿元,投资采取“母基金+重大项目直投+专项

    06-18

  • 诞生125年后,圆形方向盘即将变成方形?

    诞生125年后,圆形方向盘即将变成方形?

    前段时间,丰田公布了bZ纯电动专属系列首款车型bZ4X的详细信息。 新车定位中型纯电动SUV,车身尺寸与RAV4类似。 新车的外观我大致了解了一下。 它与8个月前上海车展上展示的概念车没有什么不同。 虽然值得肯定,但也在情理之中。 真正让我惊讶的是方向盘——它采用了异形方向

    06-21

  • 特殊材料替代硅制造半导体薄膜

    特殊材料替代硅制造半导体薄膜

    据美国《每日科学》网站9日报道,美国麻省理工学院(MIT)的工程师近日研发出一项新技术。 他们用一批特殊材料代替硅,制造出超薄半导体薄膜。 新技术为科学家提供了制造柔性电子器件的低成本解决方案,所得电子器件的性能将优于现有硅基器件,有望在未来智慧城市中“大展拳脚

    06-06

  • 2020年我不再开店了

    2020年我不再开店了

    粥店被房东拿走后,王叶松了一口气。 “店铺转让”已经发布近一个月了,却没有人关注。 疫情虽然散去,但线下业务依然没有起色。 王叶没有承担每月高昂的费用,最终无奈选择及时止损,直接取消租约。 此前,他和他的网红粥店已经苦苦挣扎了三个月。 下半年,带着上次“网红煎

    06-17

  • 比亚迪:子公司拟出资3亿美元参与投资基金

    比亚迪:子公司拟出资3亿美元参与投资基金

    据10月8日消息,比亚迪宣布,旗下子公司Golden Link拟出资3亿美元参与投资基金Community Fund LP。 预计募资规模不超过6亿美元,主要投资科技、医疗创新等领域的优秀子基金。

    06-17