EKS集群单个Pod中的多个容器如何共享GPU卡

发布于:2024-10-24 编辑:匿名 来源:网络

弹性Kubernetes服务(EKS)是腾讯云容器服务推出的一种服务模式,允许用户无需购买节点即可部署工作负载。弹性容器服务EKS完全兼容原生Kubernetes,支持使用原生方式购买和管理资源,并根据容器实际使用的资源量进行计费。

弹性容器服务EKS还扩展了对腾讯云存储和网络产品的支持,同时确保开箱即用的用户容器的安全隔离。现在很多公司都会将业务部署到eks集群上。

一些深度学习服务需要 GPU 资源。 eks 还支持 GPU 部署。

但由于eks有一定的局限性,它并不像tke一样得到qgpu等组件的支持。 GPU共享。

但很多时候,我们的一个pod有多个容器,而这些容器都需要GPU资源。如果我们为每个容器申请一张GPU卡,由于GPU资源比较昂贵,这会大大增加成本。

eks 上的一个 pod 就相当于一个 micro CVM 资源,那么是否可以一个 pod 申请一张 GPU 卡,然后 pod 内的多个容器共享这张 GPU 卡呢?下面讲一下如何配置多个容器共享一个Pod的GPU卡。代码语言:javascript 复制 apiVersion: apps/v1kind: Deploymentmetadata: labels: k8s-app: gpu-test1 qcloud-app: gpu-test1 name: gpu-test1 namespace: weixniespec:replicas: 1 选择器: matchLabels: k8s-app: gpu -test1 qcloud-app:gpu-test1 模板:元数据:注释:eks.tke.cloud.tencent.com/gpu-type:T4 标签:k8s-app:gpu-test1 qcloud-app:gpu-test1 规格:容器: - 参数: - 70d 命令: - 睡眠图像:centos:7 imagePullPolicy:IfNotPresent 名称:container1 资源:限制:nvidia.com/gpu:“1” 请求:nvidia.com/gpu:“1” securityContext:特权:true -参数:- 70d 命令:- sleep env:- 名称:NVIDIA_VISIBLE_DEVICES 值:所有图像:centos:7 imagePullPolicy:IfNotPresent 名称:容器2资源:{} securityContext:privileged:true终止消息路径:/dev/termination-log终止消息策略:文件dnsPolicy:ClusterFirst imagePullSecrets:-名称:qcloudregistrykey restartPolicy:Always具体yaml配置如上。

我们来解释一下需要配置的几个点。 Annotation指定gpu卡类型 code language: javascript copy template:metadata:annotations: eks.tke.cloud.tencent.com/gpu-type: T4 # 这里指定的是其中一个容器申请的gpu卡数量T4型GPU卡。

eks上申请的gpu卡数量根据容器设置的request和limit配置。代码语言为:javascript copy name:container1resources:limits:nvidia.com/gpu:"1" requests:nvidia.com/gpu:"1"more 容器共享gpu配置,配置环境变量NVIDIA_VISIBLE_DEVICES,并设置容器到特权模式 代码语言:javascript 复制 env: - name: NVIDIA_VISIBLE_DEVICES value: all image: centos:7 imagePullPolicy: IfNotPresent name:container2 resources: {} securityContext:privileged: true 配置后,启动 pod。

可以发现两个容器都能正常启动,并且只申请了一张gpu卡。这里有 2 个每个容器都可以使用GPU资源。

EKS集群单个Pod中的多个容器如何共享GPU卡

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 3亿,江西赣江新区招商投资基金启动

    3亿,江西赣江新区招商投资基金启动

    投资圈-解码LP消息,7月18日,江西赣江新区现代产业引导基金(简称“赣江新区基金”)首支子基金江西赣江新区招商引资基金(简称“投资子基金”)成功工商登记。 该基金由江西大成产业投资管理有限公司管理,基金规模3亿元。 投资子基金主要投资于新区主导的产业实施项目。 产

    06-18

  • 存款资金被占用、利益被转移?珠海冠宇回应科创板首轮IPO问询

    存款资金被占用、利益被转移?珠海冠宇回应科创板首轮IPO问询

    珠海冠宇电池股份有限公司(以下简称:珠海冠宇)回应科创板首轮问询2月2日董事会IPO。 首轮问询共关注珠海冠宇的基本信息、业务与技术、公司治理与独立性、财务会计与管理层的讨论与分析等五个方面。 上海证券交易所涉及对赌协议、资金拆借、关联交易等48个问题。

    06-18

  • 因为安全芯片的原因,他们被挡在了 Windows 11 之外

    因为安全芯片的原因,他们被挡在了 Windows 11 之外

    Windows 11 的发布对于很多忠实的 Windows 用户来说是一件值得欢呼的事情。 但正当人们大呼“太棒了”时,现实却给了他们迎面一击——“你的电脑无法运行Windows 11”。 虽然Windows 11支持免费升级,但并不是所有Windows老用户都能享受到。 微软为系统升级设定了一系列必要条

    06-21

  • 亮牛半导体获数千万人民币A轮融资,由耀明资本领投

    亮牛半导体获数千万人民币A轮融资,由耀明资本领投

    据投资界10月31日消息,物联网芯片设计公司亮牛半导体获数千万元A轮融资A轮融资,由耀明资本(ECC)领投,老股东艾维资本、达泰资本跟投。 亮牛半导体成立于2007年,团队成员来自复旦微电子、RDA、恩智浦等知名企业和科研机构。 公司拥有强大的Wi-Fi射频、MCU和计算处理模块

    06-18

  • 云游戏技术服务商微灵时代完成数千万元Pre-A轮融资

    云游戏技术服务商微灵时代完成数千万元Pre-A轮融资

    据投资界2月24日消息,据36氪消息,云游戏技术服务商“微灵时代”近日已完成数千万元Pre-A轮融资。 完成数千万元融资。 人民币Pre-A轮融资,由彬富资本、米哈游等领投,老股东辰海资本跟投。 公司今年10月完成近千万元天使轮融资,投资方包括金山云、耀明资本等。 本轮融资将

    06-17

  • 淘宝年终好价节落下帷幕:“官方立减”订单量突破6500万,“好货好价”心态凸显

    淘宝年终好价节落下帷幕:“官方立减”订单量突破6500万,“好货好价”心态凸显

    淘宝年终好价节正式开始告一段落! 今年双12,淘宝首次将好价节作为大促主题,从分会场升级为主会场,持续加大对“好货好价”的关注力度。 与往年相比,年终好价节在优惠力度、产品规模等方面都有较大升级。 淘宝“好货好价”的心态进一步强化,“官方立即折扣”产品订单量突

    06-18

  • 工业互联网安全公司长阳科技完成数千万元Pre-B轮融资

    工业互联网安全公司长阳科技完成数千万元Pre-B轮融资

    据投资界10月15日消息,亿欧网报道,工业互联网安全公司长阳科技宣布完成数十万元融资Pre-B轮融资数百万元。 轮融资。 本轮融资由基石基金、合创资本、杭州罕王锡城股权投资合伙企业(有限合伙)、深圳富城尚德创业投资中心等四家投资机构共同完成。 其中,基石基金、和创资

    06-17

  • 微众银行AI团队牵头推动人工智能国际标准制定

    微众银行AI团队牵头推动人工智能国际标准制定

    2月21日,微众银行主办的IEEE P.1(联邦学习基础设施和应用)标准工作组第一次会议在深圳成功召开。 微众银行首席人工智能官(CAIO)、国际人工智能联合会(IJCAI)主席杨强教授担任工作组并主持会议。 会议邀请了来自深圳市标准技术研究院、鹏城实验室、中国电信、腾讯、京东

    06-18

  • 打造二手奢侈品C2B模式,奢屋速卖通获近千万元天使轮融资

    打造二手奢侈品C2B模式,奢屋速卖通获近千万元天使轮融资

    据投资界8月21日消息,据36氪报道,二手奢侈品交易平台奢屋速卖通已完成天使轮近千万元。 融资方面,本轮投资方包括赤皇资本,以及个人投资者东方汇付高管董事王聪。 奢屋速卖通创始人及CEO李俊翔表示,本轮资金将主要用于交易平台和实体体验店建设、用户资源开发、团队建设

    06-18

  • 2021年一季度业绩大幅增长的原因是什么?穗晶光电回复问询

    2021年一季度业绩大幅增长的原因是什么?穗晶光电回复问询

    深圳市穗晶光电股份有限公司回复创业板IPO第二轮问询,共涉及10项全年业绩及一季度业绩预告、营收、客户、库存、毛利率等。 一个问题。

    06-18

  • 又是合肥,全球第十大芯片代工厂

    又是合肥,全球第十大芯片代工厂

    今年9月,全球晶圆代工厂营收前10强新出炉,中国大陆厂商时隔半年多占三席。 一个是最近舆论热议的中芯国际,另一个是前不久在科创板上市的华虹半导体。 与历经坎坷的两位老大哥相比,排名全球第十、中国大陆第三的精合集成是不折不扣的“怪物新人”:从2010年成立起,就进入

    06-17

  • 一牛科技获百万投资融资,“AI赋能”会议翻译

    一牛科技获百万投资融资,“AI赋能”会议翻译

    据投资界8月20日消息,近日,专注于远程同声传译的一牛科技正式宣布完成天使轮融资,投资方为杰石资本,融资金额数百万元。 区别于传统的同声传译,一牛科技旨在利用互联网的方式构建全新的会议翻译模式,以更好、更简单的翻译产品和服务,提高会议翻译效率,加强“人机协作

    06-18