Supervisor 是一个 C/S 架构的进程控制系统,完全由 Python 语言编写。它允许用户监视和控制类 Unix 系统上的一个或多个进程。
在 Linux 系统中,一般可以使用 service <service-name> start|stop|restart
或者 systemctl start|stop|restart <service-name>
等命令启动或停止某个服务的进程实例。
实际上,service 和 systemctl 命令都是通过调用 /etc/init.d/
目录下的启动脚本对服务进行控制。
相对而言,这类启动脚本在编写和维护上都需要耗费比较大的精力。而 Supervisor 只通过一个简单的 INI 格式的配置文件即能完成对一个或多个进程的集中管理,且能够控制进程在崩溃后自动重启。
同时,Supervisor 还支持对进程进行分组,并为组中的进程分配不同的优先级,使得它们可以按预先定义的顺序进行启动。
一、软件安装
Supervisor 支持 Linux、MacOS、Solaris 和 FreeBSD 等操作系统,直接使用对应的包管理命令安装即可。如 Ubuntu 系统:$ sudo apt-get install supervisor
Supervisor 完全由 Python 语言编写,因此可以使用 pip
命令安装,也支持安装到由 virtualenv
等工具构建的虚拟环境中。$ pip install supervisor
组件介绍
supervisord
supervisord 是 Supervisor 的服务端组件,负责控制子进程的生命周期、响应客户端组件的命令请求、重启崩溃的进程以及日志记录等工作。
supervisord 使用 Windows-INI
格式的配置文件。
supervisorctl
supervisorctl 是一个借助命令行进行交互式操作的客户端组件,它可以通过类似 Shell 的接口访问 supervisord 提供的功能。
Web Server
如 Supervisor 配置文件中的 [inet_http_server]
项被启用,则可以通过访问 http://localhost:9001 进入一个功能类似 supervisorctl 的 Web 交互界面。
XML-RPC 接口
Supervisor 的 HTTP 服务还提供了 XML-RPC 接口,参考 XML-RPC API Documentation
二、配置文件
Supervisor 的配置文件一般命名为 supervisord.conf
。它可以同时被 supervisord 和 supervisorctl 使用(通过 -c
选项指定)。
如执行上述两个命令时并未手动指定配置文件,则依次在以下位置查找名为 supervisord.conf 的配置文件:
$CWD/supervisord.conf
$CWD/etc/supervisord.conf
/etc/supervisord.conf
/etc/supervisor/supervisord.conf
../etc/supervisord.conf
../supervisord.conf
Section Settings
配置文件中的 [inet_http_server]
用于配置可供远程访问的 HTTP 服务,示例如下:1
2
3
4[inet_http_server]
port = 127.0.0.1:9001
username = user
password = 123
[supervisord]
用于配置 supervisord 进程的一些全局选项,示例如下:1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17[supervisord]
logfile = /tmp/supervisord.log
logfile_maxbytes = 50MB
logfile_backups=10
loglevel = info
pidfile = /tmp/supervisord.pid
nodaemon = false
minfds = 1024
minprocs = 200
umask = 022
user = chrism
identifier = supervisor
directory = /tmp
nocleanup = true
childlogdir = /tmp
strip_ansi = false
environment = KEY1="value1",KEY2="value2"
[supervisorctl]
用于控制交互式 Shell supervisorctl 的行为,示例如下:1
2
3
4
5[supervisorctl]
serverurl = unix:///tmp/supervisor.sock
username = chris
password = 123
prompt = mysupervisor
[program:x]
配置文件中需要至少包含一个 [program:x]
项用于指定某个由 Supervisor 控制的进程。示例如下:1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30[program:cat]
command=/bin/cat
process_name=%(program_name)s
numprocs=1
directory=/tmp
umask=022
priority=999
autostart=true
autorestart=unexpected
startsecs=10
startretries=3
exitcodes=0
stopsignal=TERM
stopwaitsecs=10
stopasgroup=false
killasgroup=false
user=chrism
redirect_stderr=false
stdout_logfile=/a/path
stdout_logfile_maxbytes=1MB
stdout_logfile_backups=10
stdout_capture_maxbytes=1MB
stdout_events_enabled=false
stderr_logfile=/a/path
stderr_logfile_maxbytes=1MB
stderr_logfile_backups=10
stderr_capture_maxbytes=1MB
stderr_events_enabled=false
environment=A="1",B="2"
serverurl=AUTO
[include]
可以用来引入其他位置的配置文件。示例如下:1
2[include]
files = /an/absolute/filename.conf /an/absolute/*.conf foo.conf config??.conf
三、实例演示
对于一个初始的 Django 项目,可以通过在项目目录下执行 python manage.py runserver
命令启动 Web 服务。这里使用 Supervisor 控制服务进程。
首先在项目目录下创建 supervisord.conf
配置文件。该文件不需要手动创建,可以直接通过 echo_supervisord_conf
命令获取示例配置并定向到 supervisord.conf
文件中,命令如下:$ echo_supervisord_conf > supervisord.conf
该示例配置中并不包含任何 [program:x]
项,需要自行添加。这里在文件末尾添加如下两行内容:1
2[include]
files = ./django_server.ini
即为了清晰起见,这里不把 Supervisor 控制的进程包含在主配置文件中,而是放置在当前目录下的 django_server.ini
文件中,再通过主配置文件中的 [include]
将其导入。django_server.ini
文件内容如下:1
2
3
4
5
6
7
8
9
10
11
12
13[program:django_server]
command=python manage.py runserver 0000:8000 ;程序启动命令
process_name=%(program_name)s ;进程名称
directory=/home/starky/project/django/test_project ;启动目录
autostart=true ;自动启动
autorestart=unexpected ;异常退出后自动重启
startsecs=10 ;程序启动 10 秒后未异常退出,则正常启动
startretries=3 ;自动重启尝试次数
user=starky ;启动该进程的用户
redirect_stderr=true ;stderr 重定向至 stdout 。默认 false
stdout_logfile_maxbytes=20MB ;stdout 日志大小,默认 50MB
stdout_log_backups=10 ;stdout 日志文件备份数量
stdout_logfile=./logs/django_server.log ;stdout 日志路径。目录不存在时需手动创建
配置完成后,运行以下命令启动 supervisord 程序:$ supervisord -c supervisord.conf
运行 supervisorctl
命令进入交互式 Shell ,可以看到 django_server.ini
中配置的 django_server 程序已经启动成功:1
2
3$ supervisorctl
django_server RUNNING pid 6210, uptime 0:00:15
supervisor>
Web Server
出于安全上的考虑,Supervisor 提供的 Web Server 默认是关闭的,可以通过修改主配置文件 supervisord.conf
进行启用。删除以下内容前的注释即可:1
2
3
4[inet_http_server] ; inet (TCP) server disabled by default
port=0.0.0.0:9001 ; ip_address:port specifier, *:port for all iface
username=user ; default is no username (open server)
password=123 ; default is no password (open server)
配置完成后,首先使用 pkill -9 supervisord
命令退出 supervisord 程序,再使用 supervisord -c supervisord.conf
命令重新启动。
此时通过浏览器访问 http://127.0.0.1:9001/,输入用户名密码后即可进入 Web 控制台界面:
supervisorctl
supervisorctl 是一个交互式的 Shell ,可以通过它访问 supervisord 提供的部分功能(如启动和停止某个进程、查看日志等)。它支持的基本命令如下:1
2
3
4
5
6
7
8$ supervisorctl
django_server RUNNING pid 8661, uptime 0:14:11
supervisor> help
default commands (type help <topic>):
=====================================
add exit open reload restart start tail
avail fg pid remove shutdown status update
clear maintail quit reread signal stop version
输入 help <topic>
可以查看对应命令的帮助信息。
常用命令的使用方法如下:
help
: Print a list of available actionshelp <action>
: Print help foradd <name> [...]
: Activates any updates in config for process/groupremove <name> [...]
: Removes process/group from active configupdate
: Reload config and add/remove as necessary, and will restart affected programsupdate all
: Reload config and add/remove as necessary, and will restart affected programsupdate <gname> [...]
: Update specific groups, and will restart affected programsclear <name>
: Clear a process’ log files.clear <name> <name>
: Clear multiple process’ log filesclear all
: Clear all process’ log filesfg <process>
: Connect to a process in foreground mode Press Ctrl+C to exit foregroundpid
: Get the PID of supervisord.pid <name>
: Get the PID of a single child process by name.pid all
: Get the PID of every child process, one per line.reload
: Restarts the remote supervisordreread
: Reload the daemon’s configuration files, without add/remove (no restarts)start | stop | restart <name>
: Start / Stop / Restart a processstart | stop | restart <gname>:*
: Start / Stop / Restart all processes in a group.start | stop | restart <name> <name>
: Start / Stop / Restart multiple processes or groupsstart | stop | restart all
: Start / Stop / Restart all processes. Note: restart does not reread config files.status
: Get all process status info.status <name>
: Get status on a single process by name.status <name> <name>
: Get status on multiple named processes.tail <name> [stdout|stderr] (default stdout)
: Output the last part of process logstail -f <name>
: Continuous tail of named process stdout Ctrl-C to exittail -100 <name>
: last 100 bytes of process stdout