Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >惊呆,这样操作 Nginx 并发数就能达到3w?

惊呆,这样操作 Nginx 并发数就能达到3w?

原创
作者头像
程序员白楠楠
修改于 2021-01-28 01:34:16
修改于 2021-01-28 01:34:16
3.1K00
代码可运行
举报
运行总次数:0
代码可运行

Nginx 以其高性能,稳定性,丰富的功能,简单的配置和低资源消耗而闻名。本文从底层原理分析 Nginx 为什么这么快!

Nginx 的进程模型

Nginx 服务器,正常运行过程中:

  • 多进程:一个 Master 进程、多个 Worker 进程。Java面试宝典PDF完整版
  • Master 进程:管理 Worker 进程。对外接口:接收外部的操作(信号);对内转发:根据外部的操作的不同,通过信号管理 Worker;监控:监控 Worker 进程的运行状态,Worker 进程异常终止后,自动重启 Worker 进程。
  • Worker 进程:所有 Worker 进程都是平等的。实际处理:网络请求,由 Worker 进程处理。Worker 进程数量在 nginx.conf 中配置,一般设置为核心数,充分利用 CPU 资源,同时,避免进程数量过多,避免进程竞争 CPU 资源,增加上下文切换的损耗。

思考:

  • 请求是连接到 Nginx,Master 进程负责处理和转发?
  • 如何选定哪个 Worker 进程处理请求?请求的处理结果,是否还要经过 Master 进程?

HTTP 连接建立和请求处理过程

HTTP 连接建立和请求处理过程如下:

  • Nginx 启动时,Master 进程,加载配置文件。
  • Master 进程,初始化监听的 Socket。
  • Master 进程,Fork 出多个 Worker 进程。
  • Worker 进程,竞争新的连接,获胜方通过三次握手,建立 Socket 连接,并处理请求。

Nginx 高性能、高并发

Nginx 为什么拥有高性能并且能够支撑高并发?

  • Nginx 采用多进程+异步非阻塞方式(IO 多路复用 Epoll)。
  • 请求的完整过程:建立连接→读取请求→解析请求→处理请求→响应请求。
  • 请求的完整过程对应到底层就是:读写 Socket 事件。

Nginx 的事件处理模型

Request:Nginx 中 HTTP 请求。

基本的 HTTP Web Server 工作模式:

  • 接收请求:逐行读取请求行和请求头,判断段有请求体后,读取请求体。
  • 处理请求。
  • 返回响应:根据处理结果,生成相应的 HTTP 请求(响应行、响应头、响应体)。

Nginx 也是这个套路,整体流程一致:

模块化体系结构

Nginx 的模块根据其功能基本上可以分为以下几种类型:

①event module:搭建了独立于操作系统的事件处理机制的框架,及提供了各具体事件的处理。包括 ngx_events_module,ngx_event_core_module 和 ngx_epoll_module 等。

Nginx 具体使用何种事件处理模块,这依赖于具体的操作系统和编译选项。

②phase handler:此类型的模块也被直接称为 handler 模块。主要负责处理客户端请求并产生待响应内容,比如 ngx_http_static_module 模块,负责客户端的静态页面请求处理并将对应的磁盘文件准备为响应内容输出。

③output filter:也称为 filter 模块,主要是负责对输出的内容进行处理,可以对输出进行修改。

例如,可以实现对输出的所有 html 页面增加预定义的 footbar 一类的工作,或者对输出的图片的 URL 进行替换之类的工作。

④upstream:upstream 模块实现反向代理的功能,将真正的请求转发到后端服务器上,并从后端服务器上读取响应,发回客户端。

upstream 模块是一种特殊的 handler,只不过响应内容不是真正由自己产生的,而是从后端服务器上读取的。

⑤load-balancer:负载均衡模块,实现特定的算法,在众多的后端服务器中,选择一个服务器出来作为某个请求的转发服务器。

常见问题剖析

Nginx vs Apache

Nginx:

  • IO 多路复用,Epoll(freebsd 上是 kqueue)
  • 高性能
  • 高并发
  • 占用系统资源少

Apache:

  • 阻塞+多进程/多线程
  • 更稳定,Bug 少
  • 模块更丰富

参考文章:

http://www.oschina.net/translate/nginx-vs-apache https://www.zhihu.com/question/19571087

Nginx 最大连接数

基础背景:

  • Nginx 是多进程模型,Worker 进程用于处理请求。
  • 单个进程的连接数(文件描述符 fd),有上限(nofile):ulimit -n。
  • Nginx 上配置单个 Worker 进程的最大连接数:worker_connections 上限为 nofile。
  • Nginx 上配置 Worker 进程的数量:worker_processes。

因此,Nginx 的最大连接数:

  • Nginx 的最大连接数:Worker 进程数量 x 单个 Worker 进程的最大连接数。
  • 上面是 Nginx 作为通用服务器时,最大的连接数。
  • Nginx 作为反向代理服务器时,能够服务的最大连接数:(Worker 进程数量 x 单个 Worker 进程的最大连接数)/ 2。
  • Nginx 反向代理时,会建立 Client 的连接和后端 Web Server 的连接,占用 2 个连接。

思考:

  • 每打开一个 Socket 占用一个 fd?
  • 为什么,一个进程能够打开的 fd 数量有限制?

HTTP 请求和响应

HTTP 请求:

  • 请求行:method、uri、http version
  • 请求头
  • 请求体

HTTP 响应:

  • 响应行:http version、status code
  • 响应头
  • 响应体

IO 模型

处理多个请求时,可以采用:IO 多路复用或者阻塞 IO+多线程:

  • IO 多路复用:一个线程,跟踪多个 Socket 状态,哪个就绪,就读写哪个。
  • 阻塞 IO+多线程:每一个请求,新建一个服务线程。

IO 多路复用和多线程的适用场景?

  • IO 多路复用:单个连接的请求处理速度没有优势。
  • 大并发量:只使用一个线程,处理大量的并发请求,降低上下文环境切换损耗,也不需要考虑并发问题,相对可以处理更多的请求。
  • 消耗更少的系统资源(不需要线程调度开销)。
  • 适用于长连接的情况(多线程模式长连接容易造成线程过多,造成频繁调度)。
  • 阻塞 IO +多线程:实现简单,可以不依赖系统调用。
  • 每个线程,都需要时间和空间。
  • 线程数量增长时,线程调度开销指数增长。

select/poll 和 epoll 比较如下:

详细内容,参考:

https://www.cnblogs.com/wiessharling/p/4106295.html

select/poll 系统调用:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
// select 系统调用
int select(int maxfdp,fd_set *readfds,fd_set *writefds,fd_set *errorfds,struct timeval *timeout); 
// poll 系统调用
int poll(struct pollfd fds[], nfds_t nfds, int timeout)

select:

  • 查询 fd_set 中,是否有就绪的 fd,可以设定一个超时时间,当有 fd (File descripter) 就绪或超时返回。
  • fd_set 是一个位集合,大小是在编译内核时的常量,默认大小为 1024。
  • 特点:连接数限制,fd_set 可表示的 fd 数量太小了;线性扫描:判断 fd 是否就绪,需要遍历一边 fd_set;数据复制:用户空间和内核空间,复制连接就绪状态信息。

poll:

  • 解决了连接数限制:poll 中将 select 中的 fd_set 替换成了一个 pollfd 数组,解决 fd 数量过小的问题。
  • 数据复制:用户空间和内核空间,复制连接就绪状态信息。

epoll,event 事件驱动:

  • 事件机制:避免线性扫描,为每个 fd,注册一个监听事件,fd 变更为就绪时,将 fd 添加到就绪链表。
  • fd 数量:无限制(OS 级别的限制,单个进程能打开多少个 fd)。

select,poll,epoll:

  • I/O 多路复用的机制。
  • I/O 多路复用就通过一种机制,可以监视多个描述符,一旦某个描述符就绪(一般是读就绪或者写就绪),能够通知程序进行相应的读写操作;监视多个文件描述符。
  • 但 select,poll,epoll 本质上都是同步 I/O:用户进程负责读写(从内核空间拷贝到用户空间),读写过程中,用户进程是阻塞的;异步 IO,无需用户进程负责读写,异步 IO,会负责从内核空间拷贝到用户空间。

Nginx 的并发处理能力

关于 Nginx 的并发处理能力:并发连接数,一般优化后,峰值能保持在 1~3w 左右。(内存和 CPU 核心数不同,会有进一步优化空间)。Java面试宝典PDF完整版

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
python3--IO模型,阻塞,非阻塞,多路复用,异步,selectors模块
结论:协程任务开启,并不一定会执行,它需要I/O(阻塞)才能执行,上面代码的time.sleep(1)模拟了I/O(阻塞)
py3study
2018/08/02
1.2K0
Nginx为什么快到根本停不下来?
image.png 基本原理 Nginx 的进程模型 Nginx 服务器,正常运行过程中: 多进程:一个 Master 进程、多个 Worker 进
公众号_松华说
2020/02/22
7260
Nginx为什么快到根本停不下来?
分享 11 个常用的 Nginx 性能优化参数工作
工作上,需要配置 Nginx,要投入生产使用,做了一点优化工作,加上以前也经常折腾 Nginx,故记下一些优化工作。
业余草
2020/04/13
4.8K0
一道搜狗面试题:IO多路复用中select、poll、epoll之间的区别
它仅仅知道了,有I/O事件发生了,却并不知道是哪那几个流(可能有一个,多个,甚至全部),我们只能无差别轮询所有流,找出能读出数据,或者写入数据的流,对他们进行操作。所以select具有O(n)的无差别轮询复杂度,同时处理的流越多,无差别轮询时间就越长。
后端码匠
2020/07/21
1.6K0
一道搜狗面试题:IO多路复用中select、poll、epoll之间的区别
高并发 Nginx + lua是如何抗住的
提到高并发或者抗压力,有这种高qps经验的同学第一反应大都是Nginx + lua + Redis,网上也满天非那种高并发架构方案大都是这种,但是Nginx + lua 来做接入层到底是怎么抗住压力的呢?
邹志全
2019/07/31
1.4K1
《笨开发学习操作系统》7网络
你是否曾经有想过这个问题,我们的一台 web 服务器最多能连接多少个客户端,或者说是服务多少个用户?是不是说,无论用户数量有多少,只要 CPU 和内存足够,就能支持?
LinkinStar
2022/09/01
2790
Redis为什么这么快之多路复用
当别人问我们Redis这么快的时候,很多小白都只会简简单单的回答,因为Redis它是基于内存存储的,使用内存存储数据,可以避免频繁的进行写盘操作,大大降低响应时间。这个确实是一个原因,但回答的还是不够面。起码在这里还得回答上高效的数据结构以及IO网络多路复用的设计架构。
一个风轻云淡
2023/09/15
4250
彻底理解 IO多路复用
https://github.com/caijinlin/learning-pratice/tree/master/linux/io
范蠡
2020/08/18
1.5K0
Redis之Redis为什么这么快解读
当别人问我们Redis这么快的时候,很多小白都只会简简单单的回答,因为Redis它是基于内存存储的,使用内存存储数据,可以避免频繁的进行写盘操作,大大降低响应时间。这个确实是一个原因,但回答的还是不够面。起码在这里还得回答上高效的数据结构以及IO网络多路复用的设计架构。
一个风轻云淡
2023/10/15
2790
Redis之Redis为什么这么快解读
超详细的I/O多路复用概念、常用I/O模型、系统调用等介绍
I/O多路复用,I/O就是指的我们网络I/O,多路指多个TCP连接(或多个Channel),复用指复用一个或少量线程。串起来理解就是很多个网络I/O复用一个或少量的线程来处理这些连接。
lyb-geek
2021/09/23
2.1K0
Nginx 工作原理简介
在了解Nginx工作原理之前,我们先来了解下几个基本的概念 以及常见的I/O模型。
授客
2023/12/18
1.2K0
Nginx 工作原理简介
Nginx由浅入深
IO复用是串行的a有问题处理a的,但是a的问题要处理10个小时b就得等待10个小时
萧晚歌
2021/05/26
5480
Nginx由浅入深
细谈Select,Poll,Epoll阻塞 io 模型 blocking IO非阻塞 io 模型 nonblocking IOio多路复用模型 IO multiplexing细谈 io 多路复用技术
而根据这两个阶段而不同的操作方法,就会产生多种io模型,本文只讨论select,poll,epoll,所以只引出三种io模型。
desperate633
2018/08/22
8020
细谈Select,Poll,Epoll阻塞 io 模型 blocking IO非阻塞 io 模型 nonblocking IOio多路复用模型 IO multiplexing细谈 io 多路复用技术
搞懂I/O多路复用及其技术
高性能是每个程序员的追求,无论写一行代码还是做一个系统,都希望能够达到高性能的效果。高性能架构设计主要集中在两方面:
BUG弄潮儿
2021/01/05
7090
Redis原理篇之网络模型
此时,用户应用程序也同样需要占用这些资源,如果不加以限制,那么会和操作系统争抢资源,导致冲突。
大忽悠爱学习
2022/05/30
1.3K0
Redis原理篇之网络模型
面试系列之-Redis高性能io模型
传统的IO模型了处理一个Get请求,需要监听客户端请求(bind/listen),和客户端建立连接(accept),从 socket中读取请求(recv),解析客户端发送请求(parse),根据请求类型读取键值数据(get),最后给客户端返回结果即向 socket中写回数据(send);
用户4283147
2023/08/21
3980
面试系列之-Redis高性能io模型
从Nginx、Apache工作原理看为什么Nginx比Apache高效!
Nginx才短短几年,就拿下了Web服务器大壁江山,众所周知,Nginx在处理大并发静态请求方面,效率明显高于Httpd,甚至能轻松解决C10K问题。
Java后端技术
2018/08/09
9510
【NGINX入门】14.Nginx原理深度解析
Web 服务器主要为用户提供服务,必须以某种方式,工作在某个套接字上,一般Web服务器在处理用户请求时,一般有如下三种方式:
辉哥
2021/02/05
2.3K0
【NGINX入门】14.Nginx原理深度解析
IO模型梳理-从操作系统到应用层
IO模型是编程语言和软件开发中重要的知识。本篇从IO模型这个切入点横向梳理了从操作系统到应用层IO模型相关知识。考虑到技术本身具有横向迁移的特点,也可以帮助大家在宏观与微观,具体与细节,底层与应用多角度串联技术,本篇是第一篇从IO模型说起。
春哥大魔王
2019/08/06
1.3K0
【云原生进阶之PaaS中间件】第一章Redis-2.2Redis IO模型
linux系统也是一种应用,它是基于计算机硬件的一种操作系统软件。当我们接收一次网络传输,计算机硬件的网卡会从网络中将读到的字节流写到linux的buffer缓冲区内存中,然后用户空间会调用linux对外暴露的接口,将linux中的buffer内存中的数据再读取到用户空间。这一次读操作就是一次IO。同样写也是这样的。
江中散人_Jun
2023/10/16
3350
【云原生进阶之PaaS中间件】第一章Redis-2.2Redis IO模型
推荐阅读
相关推荐
python3--IO模型,阻塞,非阻塞,多路复用,异步,selectors模块
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验