模型部署优化的学习路径是什么?

发布于:2024-10-24 编辑:匿名 来源:网络

模型部署和优化的方向其实比较广泛。从完成模型训练到最终将模型部署到实际硬件上,整个过程涉及很多不同层面的工作,每个环节都有不同的技术要求。

部署过程大致可以分为以下几个环节: 模型部署过程 1.模型转换 从训练框架获取模型后,根据需求转换为相应的模型格式。模型格式的选择通常根据公司业务侧SDK的需求,通常是caffe模型或onnx模型,以方便不同框架之间的模型适配。

该环节的工作需要了解caffe/onnx等相应的训练框架和模型格式。常用的框架如Pytorch、TensorFlow都有非常成熟的社区和相应的博客或教程; caffe和onnx模型格式也有很多公开文档可以参考和学习。

即使你没有找到任何文章可以参考,幸运的是两者都是开源的,你仍然可以通过阅读源代码和示例代码找到答案。 2.模型优化这里的模型优化是指与后端无关的一般优化,比如常量折叠、算术优化、依赖优化、函数优化、算子融合、模型信息简化等。

有些训练框架会包括一些导出训练模型时的上述优化流程。同时,如果模型格式进行转换,不同IR表示之间的差异可能会引入一些冗余或可优化的计算,因此通常需要也会进行一些模型优化操作。

这个环节的工作需要对计算图的执行过程、每个op的计算定义、程序运行性能模型有一定的了解,从而知道如果模型是优化后的模型,如何保证优化后的模型有更好的性能优化。理解越深入,就越能发现模型的潜在性能。

3.模型压缩从广义上讲,模型压缩也是模型优化的一部分。模型压缩本身还包括很多方法,如剪枝、蒸馏、量化等。

模型压缩的根本目的是获得更小的模型,减少存储需求和减少计算量,从而达到加速的目的。该环节的工作需要对压缩算法本身、模型涉及的算法任务、模型结构设计、硬件平台计算流程有一定的了解。

当由于模型压缩操作导致模型精度下降时,只有充分了解模型算法以及模型在硬件上的计算细节,才能分析精度下降的原因并提供针对性的解决方案。对于模型压缩来说更重要的往往是工程经验,因为当同一个模型部署在不同的硬件后端时,由于硬件计算的差异,对精度的影响往往是不同的。

这只能通过积累工程经验来实现。不断改进。

OpenPPL也逐渐开源了自己的模型压缩工具链,并介绍了上述模型算法、压缩算法和硬件平台适配等知识。 4. 模型部署 模型部署是整个流程中最复杂的环节。

从工程角度来看,主要核心任务是模型打包、模型加密、SDK封装。在实际产品中,经常会使用多种模型。

模型打包是指将模型所涉及的前处理和后处理以及多个模型进行集成,并添加一些其他描述性文件。模型打包的格式和模型加密的方法与具体的SDK有关。

这个环节涉及到的主要技能与SDK开发关系比较密切。从功能上来说,对部署最终性能影响最大的肯定是SDK中包含的后端库,即实际运行模型的推理库。

开发高性能推理库所需的技能必须更广泛、更专业。并行计算的编程思想在不同平台上是通用的,但不同的硬件架构有各自的特点,推理库的开发思路也不同,这需要对后端架构系统有一定的了解。

具体到不同架构的编程学习,建议参考目前各大厂商的开源推理库进行进一步学习。

模型部署优化的学习路径是什么?

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 可瑞生物完成1亿元Pre-A+轮融资,由阳光聚变领投、馨瑞医疗

    可瑞生物完成1亿元Pre-A+轮融资,由阳光聚变领投、馨瑞医疗

    投资界(ID:pedaily)10月31日消息,北京可瑞生物科技有限公司近日完成1亿元人民币融资Pre-A+轮本轮融资由阳光聚融、馨瑞医疗联合领投,龙门资本跟投。 本轮融资将用于推进多个创新TCR-T细胞治疗产品和可溶性TCR蛋白药物开发管线,包括针对KRAS-G12突变的细胞治疗产品和针对

    06-18

  • Zynga上市估值约为150亿美元, KPCB营收或超16.5亿

    Zynga上市估值约为150亿美元, KPCB营收或超16.5亿

    Zynga CEO马克平库斯(Mark Pincus)  简介:科技博客Business Insider周六发文称,Zynga本周提交了IPO(首次公开募股)申请,计划筹集10亿美元。 Zynga在招股说明书中列出了所有持股5%以上的股东,其中包括首席执行官马克平卡斯(Mark Pincus)。   以下为文章全文:  Z

    06-17

  • 京东更换域名,揭示平台方向,盈利是上市的前提

    京东更换域名,揭示平台方向,盈利是上市的前提

    2015年京东将域名从buy.com变更为jd.com。 很多人在问为什么不换成京东,这引发了很多想象,但其实都是胡乱的想法。 京东也已经落入京东手中。 不作为主域名可能是因为有些地区的人士j和zh不分开,ong.eng.ang不分开。 我猜他们不能正确拼写所有内容,所以它只是 jd。 更好地

    06-18

  • 2019“年度最佳AI掘金案例榜”揭晓,极米荣获最佳智能投影设备奖

    2019“年度最佳AI掘金案例榜”揭晓,极米荣获最佳智能投影设备奖

    12月17日,雷锋网公布“年度最佳AI掘金案例榜”,国内领先的智能投影设备中国作为唯一入选该榜单的投影品牌,厂商极米科技荣获“最佳智能投影设备奖”。 该榜单评选出各领域人工智能研发和应用最具代表性的企业。 榜单中还包括OPPO、荣耀、苹果等知名品牌。 “年度人工智能最

    06-17

  • 10月DRAM价格暴跌9%

    10月DRAM价格暴跌9%

    IT之家 据韩媒The Lec 11月11日报道,今年10月DRAM和NAND价格集体暴跌。 分析人士认为,这是由于美国对华为的制裁,加剧了存储芯片市场价格的下跌。 据市场研究公司DRAM Exchange上月30日统计,截至10月底,PC DRAM(DDR4 8Gb)固定交易价格为2.85美元,较9月交易价格下降8.

    06-06

  • IDC:2021年云上数据量将超过传统数据中心 All in Cloud是趋势

    IDC:2021年云上数据量将超过传统数据中心 All in Cloud是趋势

    据知名研究机构IDC预测,全球公有云上存储的数据量将超过传统数据中心到2021年,传统数据中心对企业数据的控制将被云打破,企业将进入All in Cloud时代。 IDC预测,全球数据量正在迎来爆发,从2018年的33ZB增长到2018年的ZB。 推动这一增长的重要因素之一是云计算具有弹性扩

    06-18

  • 红杉数据库完成千万美元C轮融资,嘉实投资领投

    红杉数据库完成千万美元C轮融资,嘉实投资领投

    据投资界8月18日消息,金融级分布式数据库公司红杉数据库近日宣布完成C轮融资由嘉实投资领投。 本轮领投方为嘉实投资,启明创投、DCM 等为早期投资方。   SequoiaDB成立6年来一直坚持技术驱动产品,专注于打造金融级分布式数据库。 成为国内首家入选Gartner数据库报告的数

    06-18

  • 全球半导体市场仍处下滑期,三星、Intel 均受影响

    全球半导体市场仍处下滑期,三星、Intel 均受影响

    全球半导体市场仍处于下滑期,三星、英特尔均受到影响。 据雷锋网报道,2020年8月6日,半导体行业协会(SIA)发布最新报告。 报告显示,今年第二季度,全球半导体销售额达到10亿美元,环比小幅增长0.3%,但较去年第二季度下降16.8%。 【图片来源:SIA 所有者:SIA】其中,202

    06-18

  • 火爆7年之后,苹果是如何打造出最经典的iPhone广告的?

    火爆7年之后,苹果是如何打造出最经典的iPhone广告的?

    说起苹果的经典广告,你可能会想到《》,苹果单枪匹马对抗老大哥IBM,或者《Think Different》系列广告,向爱因斯坦等“相信科学的狂人”致敬。 他们可以改变世界。 ”致敬,乔布斯和苹果正式向人们宣布回归。 这些经典广告为苹果的发展做出了不可磨灭的贡献,也成为了人们时

    06-21

  • 华硕灵耀Pro16体验:4K OLED屏幕加30系列独立显卡,释放你的创造力

    华硕灵耀Pro16体验:4K OLED屏幕加30系列独立显卡,释放你的创造力

    在华硕笔记本产品线中,有很多专为创作者设计的产品系列,它们兼具轻薄机身和创意表现都不错许多消费者心目中的选择。 每个产品系列都具有独特的功能。 有些采用双屏设计,使工作效率提高一倍;有的采用4K OLED面板,画质表现令人惊叹。 虽然进化的方向不同,但它们的目的却惊

    06-21

  • 安森美半导体将收购 Quantenna Communications

    安森美半导体将收购 Quantenna Communications

    此次收购创建了一个解决工业和汽车市场连接应用的平台。 此次交易的主要亮点: ? 结合两家公司的优势,进入汽车和工业低功耗连接市场 ? 将安森美半导体的电源管理和蓝牙技术专业知识与 Quantenna 的 Wi-Fi 和软件实力相结合 ? 立即增加非 GAAP 每股收益和可用现金 3 月 28 日

    06-06

  • 水滴公司完成2亿美元D轮融资,估值20亿美元

    水滴公司完成2亿美元D轮融资,估值20亿美元

    据投资界8月11日消息,据新浪科技报道,水滴公司完成新一轮融资近2亿美元上个月。 本轮融资估值约为20亿美元。 不过,人士并未透露具体投资者,仅表示领投者是一家名叫巨头的国际保险公司。 此前7月底,有媒体报道水滴正在筹备IPO,目前正在与高盛、美国银行接洽选择承销商。

    06-17