本文由Markdown语法编辑器编辑完成.
1.背景:
近日在给自己维护的一个类似PACS的容器服务上面,加一个healthcheck的机制。
因为这个类似PACS的容器服务,它需要负责不断地接收医院发送过来的图像,并且进行一些转发的工作。而我需要确保这个服务,是在正常工作的,至少它必须是在启动着的,可以正常地响应dicom的一些服务,比如echoscu。
因此,我就想到了给这个服务,加一个healthcheck的机制。然后容器启动后,healthcheck的机制,就会每隔一段时间,去和容器进行echoscu的通信。如果得到正常的响应,那么容器就是正常的; 否则,容器就属于unhealthy的状态,接下来再想办法,进行一些干预,确保服务能够正常稳定的工作。
2. 容器加healthcheck
这里假设我的服务名是: minPacs.
那么加了healthcheck后,在docker-compose.yml写法为:
version: '2.3'
services:
miniPacs:
image: hub.xxx.com/dev/miniPACS:1.0
environment:
- TZ=${TIME_ZONE}
- AETitle=MyMiniPACS
volumes:
- ./miniPACS/conf.yml:/usr/share/miniPACS/conf.yml
ports:
- -12345:11111
healthcheck:
# 每隔2min,向miniPACS发一个echoscu的请求,如果在返回的消息中包含:Received Echo Response (Success),则认为容器正常.否则重启容器.
# 如果shell指令返回0, 则表示正常;返回1,则表示异常.
test: |
CMD-SHELL
timeout 10s echoscu -v -aet TESTCALLING -aec MyMiniPACS 127.0.0.1 12345 | grep -i "Received Echo Response (Success)"
if [ $$? -eq 0 ]; then
exit 0
else
exit 1
fi
interval: 120s
retries: 3
start_period: 5s
restart: on-failure
根据上面增加了healthcheck后的yml文件,主要就是test后面的那段指令:
timeout 10s echoscu -v -aet TESTCALLING -aec MyMiniPACS 127.0.0.1 12345 | grep -i "Received Echo Response (Success)"
增加了这段逻辑后,当我再次启动服务后,发现容器始终都是不健康(unhealthy)的状态。我就非常的奇怪。
因为如果我单独在terminal中运行echoscu的指令时,是可以success的。
而且我grep的这个关键字符串 “Received Echo Response (Success)”, 也是存在的。
但是如果加上 grep后,却无法命中.
因为如果grep能命中的话,应该grep到的字符串,会被标红。但实际这里却未被标红。
后来通过查询资料了解到,原来是由于 echoscu的输出,其实是输出到了stderr (标准输出)里面,导致grep,无法定位到。
要想解决该问题,就是在规定输出的时候,把"标准错误"的输出,也重定向到"标准输出"中。这样grep的时候,便可以成功的grep到期待的关键字了。
也就是说,health check的那句指令,需要修改成:
CMD-SHELL
timeout 10s echoscu -v -aet TESTCALLING -aec MyMiniPACS 127.0.0.1 12345 2>&1 | grep -i "Received Echo Response (Success)"