前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >业务量剧增后服务器常见返回码总结

业务量剧增后服务器常见返回码总结

作者头像
翎野君
发布2023-05-12 19:52:45
3990
发布2023-05-12 19:52:45
举报
文章被收录于专栏:翎野君

Nginx返回码 500(Internal Server Error  内部服务器错误)

服务器内部错误,也就是服务器遇到意外情况,而无法执行请求。发生错误,一般的几种情况:

  • Web项目中出现异常,项目应用中有Bug
  • 访问量大的时候,由于系统资源限制,而不能打开过多的文件句柄

定位思路:

1.查看access.log

代码语言:javascript
复制
[root@prod-nginx-01 ~]# cat /var/log/nginx/access.log | grep --color 'HTTP/1.1" 500'
183.131.0.1 - - [21/Apr/2018:17:40:11 +0800] "POST /checkupdate HTTP/1.1" 500 158 "-" "okhttp/3.6.0" "-" 10.016

2.判断是否是too many open files

  • 打开/etc/security/limits.conf
  • 修改 limits.conf文件,加上下面两句命令

  * soft nofile 65535    * hard nofile 65535

  • 打开/usr/local/nginx/conf/nginx.conf,在worker_processes的下面增加一行配置 worker_rlimit_nofile 65535;
  • 重新启动nginx
代码语言:javascript
复制
#查看系统默认的最大文件句柄数,系统默认是1024
[root@prod-nginx-01 ~]# ulimit -n
655350
#查看当前进程打开了多少句柄数,第一列是打开的进程数,第二列是进程ID
[root@prod-nginx-01 ~]# lsof -n|awk '{print $2}'|sort|uniq -c|sort -nr|more | head -5
   4010 2911
   3860 2912
   3774 2913
   3517 2910
    137 13209

Nginx返回码 499(client has closed connection 客户端主动关闭)

官方解释:

代码语言:javascript
复制
ngx_string(ngx_http_error_495_page), /* 495, https certificate error*/
ngx_string(ngx_http_error_496_page), /* 496, https no certificate */
ngx_string(ngx_http_error_497_page), /* 497, http to https */
ngx_string(ngx_http_error_404_page), /* 498, canceled */
ngx_null_string,                    /* 499, client has closed connection */

499,客户端关闭连接,这个状态码并不是http协议中定义的status code,而是nginx自己定义的一个状态码。

  • 由于服务器处理请求较多,客户端在有效时间内没有得到答复,主动关闭了连接。
  • 有人说把时间设置长一些或者使用proxy_ignore_client_abort on(让代理服务端不要主动关闭客户端的连接)。
  • 但是这样也有一定的风险,会拖垮服务器。发生这个错误,如果服务器CPU和内存不算太高,一般是数据库和程序的问题,数据库处理较慢或者程序线程较低。
  • 结合情况调整,比如读写分离或者程序线程数调高。

client发送请求后,如果在规定的时间内(假设超时时间为500ms)没有拿到nginx给的响应,则认为这次请求超时,会主动结束,这个时候nginx的access_log就会打印499状态码。

其实这个时候,server端有可能还在处理请求,只不过client断掉了连接,因此处理结果也无法返回给客户端。

499如果比较多的话,可能会引起服务雪崩。比如说,client一直在发起请求,客户端因为某些原因处理慢了,没有在规定时间内返回数据,client认为请求失败,中断这次请求,然后再重新发起请求。

这样不断的重复,服务端的请求越来越多,机器负载变大,请求处理越来越慢,没有办法响应任何请求。

我试图定位了一下我们几个项目中的499出现概率,目前统计的几个接口的出现频率。

代码语言:javascript
复制
interface_1 十万分之五
interface_2 万分之一
interface_3 千分之一
interface_4 千分之一
interface_5 千分之一

相较之下,与运维探讨得出目前的错误率还是可以接收的,可暂不处理。 另外为何0秒返回499 这个不是很好定位确认,网上也没有合理的实践经验,如果要定位需要在较低的概率中抓到出错的请求,具体分析。 结论:可先观察一段时间,如果一直较低概率出现,可暂不处理。

Http返回码 400(Bad Request 错误请求)

1、语义有误,当前请求无法被服务器理解。除非进行修改,否则客户端不应该重复提交这个请求。 

2、请求参数有误。

如将原本Post请求的json格式的body换成binary格式就会返回这个错误码及下面的返回结果。

代码语言:javascript
复制
{
    "timestamp": 1524322831388,
    "status": 400,
    "error": "Bad Request",
    "exception": "org.springframework.http.converter.HttpMessageNotReadableException",
    "message": "Required request body is missing: public com.test.http.model.common.Object com.test.http.controller.TestController.forTest(Object,javax.servlet.http.HttpServletRequest)",
    "path": "/interface"
}

Http返回码 405(Method Not Allowed 不被允许的请求方法)

请求行中指定的请求方法不能被用于请求相应的资源。

如原本Post的请求,你换成了Get的请求方式,就会返回这个错误码及下面的返回结果。

代码语言:javascript
复制
{
    "timestamp": 1524322516567,
    "status": 405,
    "error": "Method Not Allowed",
    "exception": "org.springframework.web.HttpRequestMethodNotSupportedException",
    "message": "Request method 'GET' not supported",
    "path": "/interface"
}

参考文章: https://www.cnblogs.com/kevingrace/p/7205623.html

https://blog.csdn.net/qq_35621350/article/details/71056970

https://www.linuxidc.com/Linux/2017-01/140055.htm

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018-04-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
云服务器
云服务器(Cloud Virtual Machine,CVM)提供安全可靠的弹性计算服务。 您可以实时扩展或缩减计算资源,适应变化的业务需求,并只需按实际使用的资源计费。使用 CVM 可以极大降低您的软硬件采购成本,简化 IT 运维工作。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档