常见的502错误排查思路

1.配置错误

因为nginx找不到php-fpm了,所以报错,一般是fastcgi_pass后面的路径配置错误了,后面可以是socket或者是ip:port

2.资源耗尽
lnmp架构在处理php时,nginx直接调取后端的php-fpm服务,如果nginx的请求量偏高,我们又没有给php-fpm配置足够的子进程,那么php-fpm就会资源耗尽,一旦资源耗尽nginx找不到php-fpm就会出现502错误,

解决办法是去调整php-fpm.conf中的pm.max_children数值,使其增加,但是也不能无限增加,毕竟资源有限。
一般4G内存机器如果跑php-fpm和nginx,不跑mysql可以设置为150,8G为300以此类推。

3.通过错误日志排查

除了上面的两种错误还有其他的原因,很少有,我们可以借助nginx的错误日志来进行排查:

less /usr/local/nginx/logs/nginx_error.log

我们也可以给日志定义级别:

vim /usr/local/nginx/conf/nginx.conf

找到error_log,默认是crit最严谨的就行,也可以改成debug显示的信息最全面,但是很容易撑爆我们的磁盘。

首先我们需要让浏览器进行访问,配置一个nginx虚拟主机:

[root@wqslinux ~]# vim/usr/local/nginx/conf/vhosts/111.conf

server
{
   listen 80;
   server_name www.111.com;       //域名地址
   index index.html index.htm index.php;
   root /data/www/;

   location ~ \.php$ {
       include fastcgi_params;
       fastcgi_pass unix:/tmp/www.sock;  //修改sock
      #fastcgi_pass 127.0.0.1:9000;
       fastcgi_index index.php;
       fastcgi_param SCRIPT_FILENAME /data/www$fastcgi_script_name;
    }

}

检查语法是否正常:

/usr/local/nginx/sbin/nginx -t

重新加载配置文件:

/usr/local/nginx/sbin/nginx -s reload
或者使用:
/etc/init.d/nginx reload

检查nginx是那个用户跑的:

ps aux |grep nginx

# 返回如下信息
root      1238  0.0  0.1 122924  2136 ?        Ss   13:29   0:00 nginx: master process /usr/sbin/nginx
nobody    1239  0.0  0.1 123324  3176 ?        S    13:29   0:00 nginx: worker process
nobody    1240  0.0  0.1 123324  3176 ?        S    13:29   0:00 nginx: worker process

编辑php-fpm配置文件,我们要在这个php-fpm文件里面设置nginx的用户和用户组权限,这样才不会显示502:

vim /usr/local/php-fpm/etc/php-fpm.d/www.conf

# 配置内容大致如下
[www]
listen = /tmp/www.sock
user = php-fpm
group = php-fpm
# 定义用户
listen.owner = nobody
# 定义用户组
listen.group = nobody
pm = dynamic
pm.max_children = 50
pm.start_servers = 20
pm.min_spare_servers = 5
pm.max_spare_servers = 35
pm.max_requests = 500
rlimit_files = 1024

配置完之后需要重启php-fpm:

/etc/init.d/php-fpm restart

注:
版本高于5.4(含5.4) 默认监听的socket文件权限是所有者只读,属组和其他用户没有任何权限。所以,nginx的启动用户(咱们配置的是nobody)就没有办法去读这个socket文件,最终导致502,这个问题可以在nginx的错误日志中发现。
解决办法很简单,上面给出的配置文件中就有避免这个问题的配置:

……省略一些配置……
listen.owner = nobody
listen.group = nobody
……省略一些配置……

这两个配置就是定义socket的属主和属组是谁。除了这个还有一种方法:

listen.mode = 777

这样nobody也可以有读取权限了。

标签: web, 排障

添加新评论