3亿,江西赣江新区招商投资基金启动
06-18
弹性Kubernetes服务(EKS)是腾讯云容器服务推出的一种服务模式,允许用户无需购买节点即可部署工作负载。弹性容器服务EKS完全兼容原生Kubernetes,支持使用原生方式购买和管理资源,并根据容器实际使用的资源量进行计费。
弹性容器服务EKS还扩展了对腾讯云存储和网络产品的支持,同时确保开箱即用的用户容器的安全隔离。现在很多公司都会将业务部署到eks集群上。
一些深度学习服务需要 GPU 资源。 eks 还支持 GPU 部署。
但由于eks有一定的局限性,它并不像tke一样得到qgpu等组件的支持。 GPU共享。
但很多时候,我们的一个pod有多个容器,而这些容器都需要GPU资源。如果我们为每个容器申请一张GPU卡,由于GPU资源比较昂贵,这会大大增加成本。
eks 上的一个 pod 就相当于一个 micro CVM 资源,那么是否可以一个 pod 申请一张 GPU 卡,然后 pod 内的多个容器共享这张 GPU 卡呢?下面讲一下如何配置多个容器共享一个Pod的GPU卡。代码语言:javascript 复制 apiVersion: apps/v1kind: Deploymentmetadata: labels: k8s-app: gpu-test1 qcloud-app: gpu-test1 name: gpu-test1 namespace: weixniespec:replicas: 1 选择器: matchLabels: k8s-app: gpu -test1 qcloud-app:gpu-test1 模板:元数据:注释:eks.tke.cloud.tencent.com/gpu-type:T4 标签:k8s-app:gpu-test1 qcloud-app:gpu-test1 规格:容器: - 参数: - 70d 命令: - 睡眠图像:centos:7 imagePullPolicy:IfNotPresent 名称:container1 资源:限制:nvidia.com/gpu:“1” 请求:nvidia.com/gpu:“1” securityContext:特权:true -参数:- 70d 命令:- sleep env:- 名称:NVIDIA_VISIBLE_DEVICES 值:所有图像:centos:7 imagePullPolicy:IfNotPresent 名称:容器2资源:{} securityContext:privileged:true终止消息路径:/dev/termination-log终止消息策略:文件dnsPolicy:ClusterFirst imagePullSecrets:-名称:qcloudregistrykey restartPolicy:Always具体yaml配置如上。
我们来解释一下需要配置的几个点。 Annotation指定gpu卡类型 code language: javascript copy template:metadata:annotations: eks.tke.cloud.tencent.com/gpu-type: T4 # 这里指定的是其中一个容器申请的gpu卡数量T4型GPU卡。
eks上申请的gpu卡数量根据容器设置的request和limit配置。代码语言为:javascript copy name:container1resources:limits:nvidia.com/gpu:"1" requests:nvidia.com/gpu:"1"more 容器共享gpu配置,配置环境变量NVIDIA_VISIBLE_DEVICES,并设置容器到特权模式 代码语言:javascript 复制 env: - name: NVIDIA_VISIBLE_DEVICES value: all image: centos:7 imagePullPolicy: IfNotPresent name:container2 resources: {} securityContext:privileged: true 配置后,启动 pod。
可以发现两个容器都能正常启动,并且只申请了一张gpu卡。这里有 2 个每个容器都可以使用GPU资源。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-18
06-18
06-18
06-17
06-18
最新文章
【玩转GPU】ControlNet初学者生存指南
【实战】获取小程序中用户的城市信息(附源码)
包雪雪简单介绍Vue.js:开学
Go进阶:使用Gin框架简单实现服务端渲染
线程池介绍及实际案例分享
JMeter 注释 18 - JMeter 常用配置组件介绍
基于Sentry的大数据权限解决方案
【云+社区年度征文集】GPE监控介绍及使用