TinyML-5:TFLite Quantization 背后的运行机制

发布于:2024-10-24 编辑:匿名 来源:网络

引文 上一篇文章描述了为什么量化量化 int8 足以运行 inference,以及 Quantization 量化对 TinyML 的重要性,但没有深入解释 Quantization 的实现机制。这篇博文我打算从TFlite的案例代码开始,从代码的Optimize选项开始讲讲TFLite背后的Quantization的PTQ和QAT技术。

TF-Lite 示例:Optimize Optionsstflite exmaple 众所周知,使用 TFLite 对 TF 模型进行 Quantization 技术转换,可以减少权重,提高推理速度。其背后的机制是什么?上面代码的一个典型应用场景是使用TFLite的转换器来转换保存的模型。

转换器优化的 tf.lite.Optimize 有三个可选参数(DEFAULT、OPTIMIZE_FOR_SIZE、OPTIMIZE_FOR_LATENCY)。他们有什么区别?顾名思义,“FOR_SIZE”应该侧重于优化模型的大小,“FOR_LATENCY”应该侧重于优化推理速度;那么问题来了,同样是QUANTIZATION,这两个方向的实现机制有什么区别呢?量化技术分类 从高层次来看,TFLite 的量化技术有两大类: 训练后量化(PTQ) 量化权重压缩(针对尺寸) 量化推理计算(针对延迟) 量化感知训练(QAT) 量化感知训练:QAT 量化意识训练:训练期间量化重量。

在这里,甚至梯度也是根据量化权重计算的。通俗地说,训练过程量化每一层的输出,让网络习惯精度降低的训练,最终在推理部署时实现更小的精度损失。

这篇文章主要讲的是PTQ,以后有机会我会再展开。训练后量化(PTQ) PTQ 的作用是将 TF 模型的权重的 float32 转换为合适的 int8,存储在 tflite 模型中,并在运行时将其转换为浮点数。

然而,不同的策略导致两者在压缩和运行转换时存在差异。 Quantized Weight Compression (for size) algoquantized权重压缩用于sizedecompress解压,将模型中保存的权重的int8转换回float32,并将范围缩放回原来的值,然后执行标准浮点乘法;获得的好处是网络被压缩,模型的尺寸减小。

量化推理计算(针对延迟) 摆脱浮点计算以加速推理是量化的另一种选择。具体来说,将输出浮点计算转换为整数乘法。

这里先岔开话题,讲一下背景知识:浮点 vs 定点。 浮点 vs 定点 浮点数使用尾数和指数来表示实际值,两者都可以变化。

指数允许表示各种数字,尾数给出精度。小数点可以“浮动”,即出现在相对于数字的任何位置。

浮点 vs 定点 如果用固定比例因子替换指数,则可以使用整数来表示相对于该常量的数值(即该常量的整数倍)。小数点的位置现在由比例因子“固定”。

回到数字行的例子,比例因子的值决定了线上 2 个刻度之间的最小距离,而这些刻度的数量取决于我们用来表示整数的位数(对于 8 位固定整数)点,或 28)。我们可以使用它们来权衡范围和精度。

任何不是常量整数倍的值都会四舍五入到最接近的点。针对延迟的伪代码量化推理计算 例如,我们手动降低每个输入的点积的精度,因此不再需要全范围的 32 位浮点值。

整个推理可以用整数或者定点浮点数来实现,即整数乘法。放在一起,下图(摘自一篇博文)将PTQ相关的技术内容结合在一起,可以更好的总结。

训练后量化进一步阅读TinyML实践-1:什么和为什么TinyML?TinyML实践-2:TinyML如何工作?TinyML实践-3:牛运动姿势识别的落地实现TinyML-4:(量化)int8足以用于MLEdxHarvardXTinyML2 -1.4:移动和边缘物联网设备上的机器学习 - 第 2 部分如何通过量化加速和压缩神经网络8 位量化和 TensorFlow Lite:以低精度加速移动推理 TF-Lite 中的量化:acob、Benoit 等人。 “神经网络的量化和训练,以实现高效的纯整数算术推理。

” arXiv 预印本 arXiv:.7 ()。量化训练Gupta、Suyog 等人。

“深度学习的数值精度有限。”国际机器学习会议。

.Courbariaux、Matthieu、Yoshua Bengio 和 Jean-Pierre David。 “用低精度乘法训练深度神经网络。

” arXiv 预印本 arXiv:.().Wu, Shuang, et al. “深度神经网络中整数的训练和推理。”arXiv预印本arXiv:.0().极低比特量化Zhu, Chenzhuo, et al. “经过训练的三元量化。

” arXiv 预印本 arXiv:.4 ().Courbariaux、Matthieu 等人。 “二值化神经网络:训练深度神经网络,其权重和激活被限制为 + 1 或 -1。

” arXiv 预印本 arXiv:.0 ().Rastegari, Mohammad 等人。 “Xnor-net:使用二进制卷积神经网络进行 Imagenet 分类。

”欧洲计算机视觉会议。 Springer,Cham,压缩量化Han、Song、Huizi Mao 和 William J. Dally。

“深度压缩:通过修剪、训练量化和霍夫曼编码来压缩深度神经网络。” arXiv 预印本 arXiv:.9 ()。

TinyML-5:TFLite Quantization 背后的运行机制

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 【24小时创业】2022年8月18日

    【24小时创业】2022年8月18日

    投融资 昨日,国内市场共发生20起投资披露事件,其中先进制造领域7起(启芯半导体、冕冠半导体、启源芯电、新泰半导体、新科集成、星宇空间、每科深思)、汽车交通案例6个(浩一充电、华丰汇众、枫叶出行、猛狮科技、欣旺达EVB、维都科技)、医疗健康案例2个(瑞顺生物、中科

    06-17

  • 信银理财副总裁贺晋:拟设立10亿长三角股权投资基金

    信银理财副总裁贺晋:拟设立10亿长三角股权投资基金

    据投资界(微信ID:pedaily)12月4日消息,昨日,《走进信银理财-温度》信银理财副总裁贺晋在上海召开的《财富行者》媒体发布会上表示,信银理财坚定落实监管要求,稳步推进金融产品转型。 今年信银理财新老产品比例将达到7:3。 可以说,我们的产品转型就在眼前。 ”贺晋介绍

    06-17

  • GeekPwn:电脑管家团队1秒攻破Surface Pro 4,两次夺得世界黑客大赛冠军

    GeekPwn:电脑管家团队1秒攻破Surface Pro 4,两次夺得世界黑客大赛冠军

    5月12日,世界黑客大赛GeekPwn澳门站盛大举行。 腾讯电脑管家网络攻防队一秒破解微软Surface Pro 4,控制Surface摄像头,实现远程监控,成为本次GeekPwn澳门大赛的最大亮点。 腾讯电脑管家网络攻防小组成功攻入Surface Pro 4,将黑客电影中的场景当场变成了真实的现实:通过利

    06-18

  • 第十八届中国中小企业年会正式启动

    第十八届中国中小企业年会正式启动

    9月27日,由中国中小企业商业企业协会联合多家科研单位共同主办的第十八届中国中小企业年会启动仪式和技术机构,举行了。 年会定于11月24日至26日在北京举行。 以“推动企业技术创新,践行中国式现代化”为主题。 任兴磊执行会长在讲话中提到,起点关系大局,起点决定未来。

    06-17

  • 雅高矿业上市,凯雷退出

    雅高矿业上市,凯雷退出

    雅高矿业控股集团是一家集矿业投资与开采、石材加工与销售、石材供应与安装为一体的综合性企业集团。 雅高全产业链整合的战略布局涵盖矿山收购与开采、产品研发与设计、终端渠道建设、销售与售后服务等,实现资源的优化整合。 目前产品已覆盖全球50多个国家。 2019年7月26日

    06-17

  • 新闻 -谐波减速器公司来福谐波已完成6000万元B轮融资,上海金普领投

    新闻 -谐波减速器公司来福谐波已完成6000万元B轮融资,上海金普领投

    据投资界9月7日消息,谐波减速器公司普廷谐波已完成1万元B轮融资。 本轮融资由上海金浦领投,北极光跟投。 本轮融资将主要用于扩大产能以及谐波机电一体化产品的研发。 据悉,今年3月,来福和谐宣布获得由北极光创投领投、乳山资本跟投的数千万元A轮融资。   谐波减速机诞

    06-17

  • 从品酒神器到大学生礼包,看阿里云如何贴近地面飞行

    从品酒神器到大学生礼包,看阿里云如何贴近地面飞行

    作者 |胡海杰崇高的云服务与你我有何关系?日前在北京举行的阿里云峰会上,两款本土产品应用让人印象深刻,分别是一款品酒神器和一款助力大学生在线开发实践的云服务。 阿里巴巴集团副总裁华先胜在推广酒品鉴赏盒产品时表示,它可以通过图像识别、称重、光学扫描等方式识别茅

    06-18

  • 我们想象的AI可能已经过时了

    我们想象的AI可能已经过时了

    今年,AI在绘画上行动起来。 有人欢呼:可以给关键词画图的AI模型,让创作成本接近于零;还有人感叹:在强大的人工智能面前,人类独特的能力正在一一丧失。 当然,也有人感到恐慌:一些图书馆宣布不接受人工智能生成的作品存储,一些画家和漫画家发表反对人工智能模型绘画的声

    06-18

  • 圣茂焊锡材料(苏州)有限公司将于

    圣茂焊锡材料(苏州)有限公司将于

    三月中国电子展推出新款锡膏和助焊剂 - 圣茂焊锡材料(苏州)有限公司很高兴地宣布将参加慕尼黑电子展中国展。 将于3月20日至22日在上海新国际博览中心隆重举行。 公司将展示PQ10系列低温锡膏、适用于汽车电子的新型P系列锡膏、PW水溶性锡膏、SMF-WC53水溶性植球助焊剂及BGA锡

    06-06

  • 无人机器人公司“Insidenoid Robotics”获1500万美元A轮融资,Pitango领投

    无人机器人公司“Insidenoid Robotics”获1500万美元A轮融资,Pitango领投

    6月16日消息:据Finsmes报道,无人机器人公司Insidenoid Robotics近日获得1万美元A轮融资。 本轮融资由Pitango领投,Target Global、欧洲创新理事会基金和Spider Capital跟投。 据了解,本轮融资将用于投资全力生产并制定其GTM(进入市场)战略。 该公司最近还推出了Tando?室

    06-18

  • 山东威达拟出资1.99亿元设立产业基金

    山东威达拟出资1.99亿元设立产业基金

    山东威达(26日)4月12日晚间发布公告:为实现产业运营与资本运营良性互动,公司拟作为有限合伙人与北京富唐航空投资管理有限公司合作共同发起设立广西南宁航县鑫达产业基金合伙企业(有限合伙),双方于4月10日签署了相关《合伙协议》。 据悉该基金认缴出资总额为2亿元人民币

    06-18

  • 芬香消客获中软国际近亿元融资

    芬香消客获中软国际近亿元融资

    据5月25日消息,CRM SaaS初创公司“芬香消客”宣布获得中软国际近亿元战略投资。

    06-18