Serverless Kubernetes和ACK虚拟节点都已基于ECI提供GPU容器实例功能,让用户在云上低成本快速搭建serverless AI实验室,用户无需维护服务器和GPU基础运行环境,极大降低AI平台运维的负担,显著提升整体计算效率。

如何使用GPU容器实例

在pod的annotation中指定所需GPU的类型(P4/P100/V100等),同时在resource.limits中指定GPU的个数即可创建GPU容器实例。每个pod独占GPU,暂不支持vGPU,GPU实例的收费与ECS GPU类型收费一致,不产生额外费用,目前ECI提供多种规格的GPU类型。(请参考https://help.aliyun.com/document_detail/114581.html

示例

1. 创建Serverless Kubernetes集群

选择深圳区域,可用区D。

2. 创建GPU容器实例

我们使用tensorflow模型对如下图片进行识别:

使用模版创建pod,其中选择P100 GPU规格。在pod中的脚本会下载上述图片文件,并根据模型进行识别计算。

apiVersion: v1
kind: Pod
metadata:
name: tensorflow
annotations:
k8s.aliyun.com/eci-gpu-type : "P100"
spec:
containers:
- image: registry-vpc.cn-shenzhen.aliyuncs.com/ack-serverless/tensorflow
name: tensorflow
command:
- "sh"
- "-c"
- "python models/tutorials/image/imagenet/classify_image.py"
resources:
limits:
nvidia.com/gpu: "1"
restartPolicy: OnFailure

部署后pod会处于pending状态:

等待几十秒后pod状态变成Running,待计算完成后会变成Terminated状态。

从pod的日志我们可以看到pod能够识别P100 GPU硬件,而且可以正确识别图片为Panda。

总结

通过以上示例可以看出,从环境搭建到计算结束,整个过程用户无需购买和管理服务器,无需安装GPU运行环境,serverless的方式可以让用户更加关注在AI模型构建,而不是底层基础设施的管理和维护。

本文作者:贤维

原文链接

本文为云栖社区原创内容,未经允许不得转载。

最新文章

  1. tomcat组成以及工作原理
  2. HDU2243 考研路茫茫——单词情结(AC自动机+矩阵快速幂)
  3. c++读入之 -- 汉字读入遇到的问题
  4. 解决DATASNAP远程方法参数超过32个的问题
  5. UITableView的详细使用
  6. asp.net 内部重定向
  7. js操作cookie,js判断浏览器属性,
  8. (大数据工程师学习路径)第一步 Linux 基础入门----命令执行顺序控制与管道
  9. VS2010+opencv2.4.10+gsl_1.8配置实现RobHess的SIFT程序
  10. 证书,CSP与Openssl
  11. Python调用ansible API系列(四)动态生成hosts文件
  12. hadoop搭建笔记(一)
  13. JavaScript 进阶
  14. 插件 DataTable 创建列表 render参数的详解与如何传递本行数据id
  15. RPC框架-通俗易懂的解释
  16. win7下使用Taste实现协同过滤算法
  17. 跑道标识和那些复杂的灯光系统 and 简介、编号、参数、标志及数量 and 飞机跑道标准与参数
  18. Flow类中的resolveBreaks与resolveContinues
  19. vue2.0 安装及项目搭建(一)
  20. Python学习---基础函数的学习

热门文章

  1. [转]js设计模式-策略模式
  2. Codeforces 220B
  3. unity限帧的正确姿势
  4. day 52
  5. JavaScript 对象的所有方法名称转换为大写
  6. openpyxl 模块的使用
  7. Android消息机制使用注意事项,防止泄漏
  8. jQuery中的工具和插件
  9. oracle-ASM存储器
  10. JQuery-- 实例:小米左右切图,淡入淡出,自动,小圆点触发轮播图