作者:Jack47

转载请保留作者和原文出处

欢迎关注我的微信公众账号程序员杰克,两边的文章会同步,也可以添加我的RSS订阅源

本文介绍在Kubernetes环境下的调试方法,希望对读者有用。如果关心Docker环境里的调试方法,可以看我的这篇文章:Useful commands for docker beginners

启动单个容器

不使用Pod或Replication Controller,启动单个容器:

$ kubectl run webserver --image=nginx

想更改镜像,又不想升级版本?

每次修改之后,需要更新镜像的版本也好烦人啊。每次构建出新的镜像,Push到Docker Registry时,可以使用一个固定的版本,然后让Kubernetes在启动某个镜像时,无论本地是否有镜像,都去Docker Registry拉取镜像就好了。

ImagePullPolicy从默认的 IfNotPresent,改为 Always

想直接修改容器里的程序,又不想更新镜像?

什么,还能这样做?在容器内部修改,比如修改了脚本,或者直接替换二进制程序,然后使用docker restart container-id。我尝试过此时使用docker commit提交修改,但是下次启动时,Kubernets就会报错。应该是有完整性校验的原因。

Pod重启了,如何看重启之前的日志?

下面的命令只能看到当前Pod的日志:

$ kubectl logs zookeeper-1

通过 --previous参数可以看之前Pod的日志

$ kubectl logs zookeeper-1 --previous

查看Pod生命周期的事件

通过如下命令,看命令末尾 events 一节,查看kubelet给APIServer发送的Pod生命周期里发生的事件

$ kubectl describe pod podname

没有看到任何事件,但是Pod重启了?

依然通过describe命令,Containers.[*].Last State一节:

$ kubectl describe pod podname
Name: kafka-1
... Containers:
kafka:
...
State: Running
Started: Sat, 08 Apr 2017 02:29:04 +0000
Last State: Terminated
Reason: OOMKilled
Exit Code: 0
Started: Fri, 07 Apr 2017 11:06:56 +0000
Finished: Sat, 08 Apr 2017 02:29:04 +0000
Ready: True
Restart Count: 1
...

可以看到 Kafka-1 这个Container因为内存消耗太多,达到内存的上限(Memory Resource Limit)而被干掉了。如果看到 Reason: Completed,说明是容器内部pid为1的程序主动退出的。

查看资源(CPU/Memory)使用情况

资源使用最多的节点

$ kubectl top nodes

资源使用最多的Pod

$ kubectl top pods

查看节点的资源使用情况

$ kubectl describe nodes | grep -A 2 -e "^\\s*CPU Requests"

如何摘下某个Pod进行Debug

使用label机制,对Pod进行标记。在Service定义中,我们添加 status: serving字段。当需要摘下某个Pod做Debug,而又不影响整个服务,可以:

$ kubectl get pods --selector="status=serving"
$ kubectl label pods webserver-rc-lxag2 --overwrite status=debuging

此时kubelet就会把这个Pod从Service的后端列表中删掉。等到Debug完,想恢复?再改回去就好了:

$ kubectl label pods webserver-rc-lxag2 --overwrite status=serving

References:

10 most common reasons kuberntes deployments fail

Kubernetes Community Resources

资助Jack47写作,打赏一个鸡蛋灌饼吧
微信打赏
支付宝打赏

最新文章

  1. cron表达式
  2. 【Win 10应用开发】Adaptive磁贴模板的XML文档结构
  3. POJ 题目2411 Mondriaan's Dream(状压DP)
  4. XQuery的 value() 方法、 exist() 方法 和 nodes() 方法
  5. Linux网络编程系列-TCP传输控制
  6. [SDK2.2]Windows Azure Virtual Network (3) 创建AD Server并添加至Virtual Network
  7. 摘抄——读《大话移动APP测试 Android与IOS》
  8. AngularJS中的http拦截
  9. spring_150804_controller
  10. 跨平台 c 开发库 tbox v1.6.0,支持跨平台协程
  11. ARC工程中添加非ARC文件
  12. 使用C#模拟ASP.NET页面中按钮点击
  13. mac下 配置 Apache Php Mysql
  14. 产品经理(五岁以下儿童)myVegas Slots排名上升的秘密
  15. 一把刀系统维护工具箱 v1.6 绿色版
  16. Oracle数据库设计小细节
  17. 需求分析--WBS
  18. 题解-洛谷P1303 A*B Problem(高精)
  19. RDMS三剑客的服务
  20. Flask--WTForms

热门文章

  1. 深入探讨 CSS 特性检测 @supports 与 Modernizr
  2. 概念 : 用户>角色>权限 的管理(Role-Based Access Control)
  3. php调用API支付接口(使用第三方接口,调用的天工接口。)
  4. AR入门系列-03-在unity中将调试好的Vuforia项目导出为APK
  5. Bootstrap学习-排版
  6. Maven settings.xml配置解读
  7. ionic 添加新module
  8. Jmeter函数引用和函数重定向
  9. js数据类型:引用和5种基本数据类型
  10. 四大组件之一---------activity的知识