前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Docker stop或者Docker kill为何不能停止容器

Docker stop或者Docker kill为何不能停止容器

作者头像
Criss@陈磊
发布于 2019-08-02 02:54:11
发布于 2019-08-02 02:54:11
4.1K00
代码可运行
举报
文章被收录于专栏:测试技术圈测试技术圈
运行总次数:0
代码可运行

背景

我们内部压力(cpu 80%,内存90%)通过stress (做页面压力测试)在容器内部做测试中,发现某几个时候通过

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
docker stop $containerid

docker cli退出后,短暂时间内docker ps查看到容器依然在运行状态。但是很快docker ps查看容器或者ps查看容器主进程pid就可以确认容器推出了。我们需要解释一下Docker stop发生了什么

Docker主要执行流程

一、Docker Stop主要流程

1.Docker 通过containerd向容器主进程发送SIGTERM信号后等待一段时间后,如果从containerd收到了容器退出消息那么容器退出成功。

2、在上一步中,如果等待超时,那么Docker将使用Docker kill 方式试图终止容器

二、Docker Kill主要流程

1.Docker引擎通过containerd使用SIGKILL发向容器主进程,等待一段时间后,如果从containerd收到容器退出消息,那么容器Kill成功

2.在上一步中如果等待超时,Docker引擎将跳过Containerd自己亲自动手通过kill系统调用向容器主进程发送SIGKILL信号。如果此时kill系统调用返回主进程不存在,那么Docker kill成功。否则引擎将一直死等到containerd通过引擎,容器退出。

Docker stop中存在的问题

在上文中我们看到Docker stop首先间接向容器主进程发送sigterm信号试图通知容器主进程优雅退出。但是容器主进程如果没有显示处理sigterm信号的话,那么容器主进程对此过程会不会有任何反应,此信号被忽略了 这里和常规认识不同,在常规想法中任何进程的默认sigterm处理应该是退出。但是namespace中pid==1的进程,sigterm默认动作是忽略。也即是容器首进程如果不处理sigterm,那么此信号默认会被忽略,这就是很多时候Docker Stop不能立即优雅关闭容器的原因——因为容器主进程根本没有处理SIGTERM

特别指出linux上全局范围内pid=1的进程,不能被sigterm、sigkill、sigint终止 进程组首进程退出后,子进程收到sighub

在bash shell里可以通过trap命令捕获发往shell的信号,如果docker的主进程是shell进程的话,可以通过trap命令实现SIGTERM信号的捕获和处理:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
term_func(){      echo “receiving SIGTERM”      kill -s SIGTERM  $1}pid=trap “ term_func $pid” TERMYour command & pid = $!wait

wait 命令的意思是等待所有子进程退出。放在这里是因为,trap命令只能等前台运行的命令结束后才能处理信号,但是wait命令会在收到信号后立即退出,所以将命令后台化以后加wait,可以保证脚本对信号的即时响应。关于shell里通过trap命令处理信号的详细使用方式见《shell trap信号处理》《Sending and Trapping Signals》

Docker kill为何会阻塞

一、容器主/子进程处于D状态

进程D状态表示进程处于不可中断睡眠状态,一般都是在等待IO资源。当然有些时候如果系统IO出现问题,那么将有大量的进程处于D状态。在这种状态,信号是无法将进程唤醒;只有等待进程自己从D状态中返回。而且在常规内核中,如果某个进程一直处于D状态,那么理论上除了重启系统那么没有什么方法或手段将它从D中接回。

从上面解释Docker kill第二步中可以看到一旦容器中主进程或者子进程处于D状态,那么Docker将等待,一直等到所有容器主进程和其子进程都退出后才返回,那么此时Docker kill就卡住了。

二、问题解释

当出现问题时刻,宿主机上发现大量的stress进程(实际是容器的进程)处于D状态,而系统响应变慢。问题可以这样解释:

1.Docker kill通过containerd间接向容器主进程发送SIGKill信号以后,由于系统响应慢,容器内部子进程(stress)处于D状态,那么在超时时间内containerd没有上报容器退出。Docker kill走到了直接发送Sigkill阶段

2.在此阶段前,容器内部主进程退出了,所以系统调用kill 发送SIGKILL很快就返回进程不存在了。引擎认为自己把容器杀死了,Docker kill成功返回了。

3.在一定时间后容器子进程从D状态中恢复,它们退出了,containerd上报容器退出,引擎清理资源,此时Docker ps看到容器才是退出状态

三、在docker pidnamespace共享特性下容器对信号的响应

在k8s的pod下常见的场景,pause容器和其他容器共享pid namespace(pause容器pidnamespace共享给相同pod下其他容器使用)。pause容器退出后,其他容器也会退出(pause容器如果收到SIGTERM并退出了,那么其他容器也会退出);直接给其他容器发送SIGTERM信号,pause容器不会收到SIGTERM。

总结

  • 容器主进程最好需要自己处理SIGTERM信号,因为这是你优雅退出的机会。如果你不处理,那么在Docker stop里你会收到Kill,你未保存的数据就会直接丢失掉。
  • Docker stop和Docker kill返回并不意味着容器真正退出成功了,必须通过docker ps查看。
  • 对于通过restful与docker 引擎链接的客户端,需要在docker stop和kill restful请求链接上加上超时。对于docker cli用户,需要有另外的机制监控Docker stop或Docker kill命令超时卡死
  • 处于D状态一致卡死的进程,内核无法杀死,docker系统也救不了它。只有重启系统才能清除。
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-07-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 质问 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
docker stop 或者 docker kill 不能停止容器
这几天在生产环境发现有几个容器一直不能正常的stop,或者rm 掉,而且查看docker daemon 日志里面会出现很多 msg="Container 5054f failed to exit within 10 seconds of<br/>signal 15 - using the force" 这样的报错,使用的命令为journalctl -xe -u docker 然后在短暂的时间内 docker ps查看到的容器还在运行中,过了一会没有了我们在创建的时候会提示这个容器已经存在(如果建立同样名称的容器)
张琳兮
2020/05/29
7.8K0
K8s Pod优雅关闭,没你想象的那么简单!
更新部署服务时,旧的 Pod 会终止,新 Pod 上位。如果在这个部署过程中老 Pod 有一个很长的操作,我们想在这个操作成功完成后杀死这个 pod(优雅关闭),如果无法做到的话,被杀死的 pod 可能会丢失一定的流量,或者外界无法感知到该 Pod 被杀死。特别是,如果我们有一个接收大量流量的 API,错误率在部署过程中会显著增加。
用户5166556
2023/03/18
2.7K0
K8s Pod优雅关闭,没你想象的那么简单!
深入理解docker容器与镜像
镜像(Image)就是一堆只读层(read-only layer)的统一视角,也许这个定义有些难以理解,下面的这张图能够帮助读者理解镜像的定义。
传说之下的花儿
2023/09/18
1K0
深入理解docker容器与镜像
容器应用优雅关闭的终极大招
优雅关闭:在关闭前,执行正常的关闭过程,释放连接和资源,如我们操作系统执行 shutdown。
米开朗基杨
2021/08/10
2.9K0
Docker核心技术之容器详解
容器(Container):容器是一种轻量级、可移植、并将应用程序进行的打包的技术,使应用程序可以在几乎任何地方以相同的方式运行 Docker将镜像文件运行起来后,产生的对象就是容器。容器相当于是镜像运行起来的一个实例。 容器具备一定的生命周期。 另外,可以借助docker ps命令查看运行的容器,如同在linux上利用ps命令查看运行着的进程那样。
Lansonli
2021/10/09
2.3K0
什么?终止一个容器竟然用了 10 秒钟,这不能忍!
作为一名系统重启工程师(SRE),你可能经常需要重启容器,毕竟 Kubernetes 的优势就是快速弹性伸缩和故障恢复,遇到问题先重启容器再说,几秒钟即可恢复,实在不行再重启系统,这就是系统重启工程师的杀手锏。然而现实并没有理论上那么美好,某些容器需要花费 10s 左右才能停止,这是为啥?有以下几种可能性:
米开朗基杨
2020/06/02
1K0
%99的人都不知道的Docker技巧:优雅的终止容器
如上的各种场景中,都要求打包在容器中的应用程序能够被优雅的终止(也即gracefully shutdown),这种gracefully shutdown的方式,允许程序在容器被停止的时候,有一定时间做一些后续处理操作,这也是我们需要进一步探讨的话题。
心莱科技雪雁
2019/10/24
1K0
Docker Graceful Shutdown
实现org.springframework.context.SmartLifecycle接口, 实现getPhase/start/stop/isRunning方法, 通过getPhase方法定义优先级
code-x
2023/07/10
3200
面试官:能在容器里面通过 kill -9 杀死容器吗?问倒一大片。。。
kill命令默认将信号(signal)15发给进程,让进程优雅地退出,释放资源。而kill -9则是强制终止进程,相当于发送信号9,不管进程是否想要退出,都会被迫停止运行。
民工哥
2023/12/12
6730
面试官:能在容器里面通过 kill -9 杀死容器吗?问倒一大片。。。
Unix系统进程对SIGTERM、SIGUSR1和SIGUSR2信号处理
好久没更新博客了,写篇文章除除草。这篇文章主要通过简单的例子说明一下Unix/Linux进程中如果捕捉和处理SIGTERM、SIGUSR1和SIGUSR2信号。
typecodes
2024/03/29
1.9K0
Unix系统进程对SIGTERM、SIGUSR1和SIGUSR2信号处理
Docker容器中进程管理工具
为了防止容器中直接使用ENTRYPOINT或CMD指令启动命令或应用程序产生PID为1的进程无法处理传递信号给子进程或者无法接管孤儿进程,进而导致产生大量的僵尸进程。对于没有能力处理以上两个进程问题的PID进程,建议使用dumb-int或tini这种第三方工具来充当1号进程。
YP小站
2021/11/26
1.3K0
Docker之容器操作
使用 docker [container] create 命令新建的容器处于停止状态,可以使用 docker [container] start 命令来启动它。
海盗船长
2021/12/07
5640
Docker之容器操作
kubernetes 实用技巧: 在 SHELL 中传递信号
在 Kubernetes 中,Pod 停止时 kubelet 会先给容器中的主进程发 SIGTERM 信号来通知进程进行 shutdown 以实现优雅停止,如果超时进程还未完全停止则会使用 SIGKILL 来强行终止。
imroc
2021/05/18
2.9K0
拿捏docker+k8s系列--docker容器
容器在 docker host 中实际上是一个进程,docker stop 命令本质上是向该进程发送一个 SIGTERM 信号。如果想快速停止容器,可使用docker kill 命令,其作用是向容器进程发送SIGKILL信号。
微客鸟窝
2022/05/24
6080
Docker核心技术
容器(Container):容器是一种轻量级、可移植、并将应用程序进行的打包的技术,使应用程序可以在几乎任何地方以相同的方式运行。
@小森
2024/03/15
1650
Docker核心技术
云原生时代,必备的Docker容器管理命令大揭秘!
在一个终端执行docker create,在另一个终端执行docker events。
Lion 莱恩呀
2025/05/07
630
云原生时代,必备的Docker容器管理命令大揭秘!
Docker镜像创建容器的几种方法
每个容器都是由镜像创建的应用程序的一个实例,并且一个主机系统可以运行多个容器,每个容器都是隔离的。接下来,我将介绍如何创建、使用和管理容器。
角落的白板报
2020/05/26
48K0
Docker镜像创建容器的几种方法
Kubernetes 运维遇到的问题记录(4)
Kubernetes 集群网络有很多种实现,有很大一部分都用到了 Linux 网桥:每个 Pod 的网卡都是 veth 设备,veth pair 的另一端连上宿主机上的网桥。由于网桥是虚拟的二层设备,同节点的 Pod 之间通信直接走二层转发,跨节点通信才会经过宿主机 eth0。
后端云
2023/02/10
1K0
Kubernetes 运维遇到的问题记录(4)
Linux 信号(Signal)
我们经常会使用 kill 命令杀掉运行中的进程,对多次杀不死的进程进一步用 kill -9 干掉它。你可能知道这是在用 kill 命令向进程发送信号,优雅或粗暴的让进程退出。我们能向进程发送很多类型的信号,其中一些常见的信号 SIGINT 、SIGQUIT、 SIGTERM 和 SIGKILL 都是通知进程退出,但它们有什么区别呢?很多人经常把它们搞混,这篇文章会让你了解 Linux 的信号机制,以及一些常见信号的作用。
mazhen
2023/11/24
1.5K0
Linux 信号(Signal)
一次 Docker 容器内大量僵尸进程排查分析
前段时间线上的一个使用 Google Puppeteer 生成图片的服务炸了,每个 docker 容器内都有几千个孤儿僵死进程没有回收,如下图所示。
挖坑的张师傅
2022/05/13
2.1K0
一次 Docker 容器内大量僵尸进程排查分析
相关推荐
docker stop 或者 docker kill 不能停止容器
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验