python进程监控 supervisor_使用Python的Supervisor进行进程监控以及自动启动
做服務(wù)器端開發(fā)的同學(xué)應(yīng)該都對進(jìn)程監(jiān)控不會陌生,最近恰好要更換 uwsgi 為 gunicorn,而gunicorn又恰好有這么一章講進(jìn)程監(jiān)控,所以多研究了下。
結(jié)合之前在騰訊工作的經(jīng)驗(yàn),也會講講騰訊的服務(wù)器監(jiān)控是怎么做的。同時(shí)也會講下小團(tuán)隊(duì)又該怎么敏捷的解決。
下面按照監(jiān)控的方法依次介紹。
一、按照進(jìn)程名監(jiān)控
在騰訊內(nèi)部所有server都是要打包發(fā)布的,而在打包過程中是需要填寫要監(jiān)控的進(jìn)程名,然后在crontab中定時(shí)通過ps查詢進(jìn)程是否存在。
這種方法是比較簡單的方法,但是考慮到很多進(jìn)程會在啟動之后改名,以及進(jìn)程名存在各種特殊字符,多個(gè)進(jìn)程同時(shí)存在的問題,實(shí)際操作起來并不是很舒服。
舉個(gè)簡單的例子,gunicorn啟動之后的進(jìn)程名類似這樣 master: [wsgi:app],其中的方括號在grep時(shí)要記得轉(zhuǎn)義,否則就會出問題。
不過不管怎么說,這種方法在很多其他方式用不了的時(shí)候反而是最簡單的方法。
下面是用python的實(shí)現(xiàn):
def monitor_process(key_word, cmd):
p1 = subprocess.Popen(['ps', '-ef'], stdout=subprocess.PIPE)
p2 = subprocess.Popen(['grep', key_word], stdin=p1.stdout, stdout=subprocess.PIPE)
p3 = subprocess.Popen(['grep', '-v', 'grep'], stdin=p2.stdout, stdout=subprocess.PIPE)
lines = p3.stdout.readlines()
if len(lines) > 0:
return
sys.stderr.write('process[%s] is lost, run [%s]\n' % (key_word, cmd))
subprocess.call(cmd, shell=True)
二、按照端口監(jiān)控
這種方式之前在騰訊打包的時(shí)候也有用,但是可能是進(jìn)程名更直觀的原因吧,貌似一直沒怎么用起來。
不過現(xiàn)在自己在做包部署的時(shí)候,反而覺得端口監(jiān)控是個(gè)最靠譜的事情了。這個(gè)也沒什么好多說的,直接上剛寫完的python代碼:
def monitor_port(protocol, port, cmd):
address = ('127.0.0.1', port)
socket_type = socket.SOCK_STREAM if protocol == 'tcp' else socket.SOCK_DGRAM
client = socket.socket(socket.AF_INET, socket_type)
try:
client.bind(address)
except Exception, e:
pass
else:
sys.stderr.write('port[%s-%s] is lost, run [%s]\n' % (protocol, port, cmd))
subprocess.call(cmd, shell=True)
finally:
client.close()
有的朋友可能說對于tcp端口檢查,其實(shí)以client的方式來connect()看是否成功會不會更好?其實(shí)我覺得這種方式也挺好的,并且對于不同的協(xié)議可以再深入處理一下,比如對http協(xié)議可以用urllib2.urlopen確保返回正確的包才算正常。不過如果這么做的話,就有點(diǎn)偏黑盒監(jiān)控 了,比如監(jiān)控寶、阿里云監(jiān)控之類的服務(wù)了。
三、通過監(jiān)控server啟動進(jìn)程,并以監(jiān)控子進(jìn)程的方式監(jiān)控
這個(gè)也是在gunicorn頁面上看到的,說起來gunicorn很不厚道的把gaffer放到第一個(gè),讓我還以為是個(gè)很成熟的產(chǎn)品,結(jié)果發(fā)現(xiàn)連啟動都是個(gè)問題。
相反排在后面的supervisor反而相當(dāng)?shù)暮糜?#xff0c;下面是截圖:
supervisor可以很方便的管理進(jìn)程,包括重啟,停止等等,而且提供了web界面和用戶驗(yàn)證,可以很方便的在線管理。
但是有好處就有壞處,用了supervisor之后,就不能自己隨便的去自己重啟服務(wù)了,否則會影響supervisor的監(jiān)控,這對我這種喜歡自己執(zhí)行 xx.sh restart 的人實(shí)在有點(diǎn)太痛苦了。當(dāng)然,其實(shí)要是習(xí)慣了去supervisorctl 里面start/stop/reload 之后也就還好了。
用supervisor配置gunicorn的配置項(xiàng)如下:
[program:yuanzhaopin]
environment=PYTHON_EGG_CACHE=/tmp/.python-eggs/,PYTHONPATH=/data/release/yuanzhaopin
command=/usr/local/bin/gunicorn --debug --log-level debug --log-file /tmp/g.log wsgi:app
user=zny2008
autorestart=true
redirect_stderr=true
ok,目前自己常用的就是這幾種模式了,大家如果有其他選擇歡迎留言討論。
完整代碼如下:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
#*/1 * * * * python /xxx/monitor.py >> /xxx/logs/monitor.log 2>&1? &
import sys
import subprocess
import os.path as op
import socket
def this_abs_path(script_name):
return op.abspath(op.join(op.dirname(__file__), script_name))
def monitor_process(key_word, cmd):
p1 = subprocess.Popen(['ps', '-ef'], stdout=subprocess.PIPE)
p2 = subprocess.Popen(['grep', key_word], stdin=p1.stdout, stdout=subprocess.PIPE)
p3 = subprocess.Popen(['grep', '-v', 'grep'], stdin=p2.stdout, stdout=subprocess.PIPE)
lines = p3.stdout.readlines()
if len(lines) > 0:
return
sys.stderr.write('process[%s] is lost, run [%s]\n' % (key_word, cmd))
subprocess.call(cmd, shell=True)
def monitor_port(protocol, port, cmd):
address = ('127.0.0.1', port)
socket_type = socket.SOCK_STREAM if protocol == 'tcp' else socket.SOCK_DGRAM
client = socket.socket(socket.AF_INET, socket_type)
try:
client.bind(address)
except Exception, e:
pass
else:
sys.stderr.write('port[%s-%s] is lost, run [%s]\n' % (protocol, port, cmd))
subprocess.call(cmd, shell=True)
finally:
client.close()
#=============================================================================
def yuanzhaopin():
cmd = '%s start' % this_abs_path('gun.sh')
#monitor_process('\[yuanzhaopin\]', cmd)
monitor_port('tcp', 8635, cmd)
def main():
yuanzhaopin()
if __name__ == '__main__':
main()
總結(jié)
以上是生活随笔為你收集整理的python进程监控 supervisor_使用Python的Supervisor进行进程监控以及自动启动的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python methodtype_Py
- 下一篇: Homework2-project re