Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >操作系统能否支持百万连接?

操作系统能否支持百万连接?

作者头像
小小科
修改于 2019-10-28 10:02:00
修改于 2019-10-28 10:02:00
8620
举报
文章被收录于专栏:北京马哥教育北京马哥教育

下面来分别对这几个问题进行分析.

1. 操作系统能否支持百万连接?

对于绝大部分 Linux 操作系统, 默认情况下确实不支持 C1000K! 因为操作系统包含最大打开文件数(Max Open Files)限制, 分为系统全局的, 和进程级的限制.

全局限制

在 Linux 下执行:

cat /proc/sys/fs/file-nr

会打印出类似下面的一行输出:

5100 0 101747

第三个数字 101747 就是当前系统的全局最大打开文件数(Max Open Files), 可以看到, 只有 10 万, 所以, 在这台服务器上无法支持 C1000K. 很多系统的这个数值更小, 为了修改这个数值, 用 root 权限修改 /etc/sysctl.conf 文件:

fs.file-max = 1020000

net.ipv4.ip_conntrack_max = 1020000

net.ipv4.netfilter.ip_conntrack_max = 1020000

进程限制

执行:

ulimit -n

输出:

1024

说明当前 Linux 系统的每一个进程只能最多打开 1024 个文件. 为了支持 C1000K, 你同样需要修改这个限制.

临时修改

ulimit -n 1020000

不过, 如果你不是 root, 可能不能修改超过 1024, 会报错:

-bash: ulimit: open files: cannot modify limit: Operation not permitted

永久修改

编辑 /etc/security/limits.conf 文件, 加入如下行:

# /etc/security/limits.conf

work hard nofile 1020000

work soft nofile 1020000

第一列的 work 表示 work 用户, 你可以填 *, 或者 root. 然后保存退出, 重新登录服务器.

注意: Linux 内核源码中有一个常量(NR_OPEN in /usr/include/linux/fs.h), 限制了最大打开文件数, 如 RHEL 5 是 1048576(2^20), 所以, 要想支持 C1000K, 你可能还需要重新编译内核.

2. 操作系统维持百万连接需要多少内存?

解决了操作系统的参数限制, 接下来就要看看内存的占用情况. 首先, 是操作系统本身维护这些连接的内存占用. 对于 Linux 操作系统, socket(fd) 是一个整数, 所以, 猜想操作系统管理一百万个连接所占用的内存应该是 4M/8M, 再包括一些管理信息, 应该会是 100M 左右. 不过, 还有 socket 发送和接收缓冲区所占用的内存没有分析. 为此, 我写了最原始的 C 网络程序来验证:

服务器

#include

#include

#include

#include

#include

#include

#include

#include

#define MAX_PORTS 10

int main(int argc, char **argv){

struct sockaddr_in addr;

const char *ip = "0.0.0.0";

int opt = 1;

int bufsize;

socklen_t optlen;

int connections = 0;

int base_port = 7000;

if(argc > 2){

base_port = atoi(argv[1]);

}

int server_socks[MAX_PORTS];

for(int i=0; i maxfd){

maxfd = server_socks[i];

}

}

int ret = select(maxfd + 1, &readset, NULL, NULL, NULL);

if(ret < 0){

if(errno == EINTR){

continue;

}else{

printf("select error! %s\n", strerror(errno));

exit(0);

}

}

if(ret > 0){

for(int i=0; i

注意, 服务器监听了 10 个端口, 这是为了测试方便. 因为只有一台客户端测试机, 最多只能跟同一个 IP 端口创建 30000 多个连接, 所以服务器监听了 10 个端口, 这样一台测试机就可以和服务器之间创建 30 万个连接了.

客户端

#include

#include

#include

#include

#include

#include

#include

int main(int argc, char **argv){

if(argc <= 2){

printf("Usage: %s ip port\n", argv[0]);

exit(0);

}

struct sockaddr_in addr;

const char *ip = argv[1];

int base_port = atoi(argv[2]);

int opt = 1;

int bufsize;

socklen_t optlen;

int connections = 0;

bzero(&addr, sizeof(addr));

addr.sin_family = AF_INET;

inet_pton(AF_INET, ip, &addr.sin_addr);

char tmp_data[10];

int index = 0;

while(1){

if(++index >= 10){

index = 0;

}

int port = base_port + index;

printf("connect to %s:%d\n", ip, port);

addr.sin_port = htons((short)port);

int sock;

if((sock = socket(AF_INET, SOCK_STREAM, 0)) == -1){

goto sock_err;

}

if(connect(sock, (struct sockaddr *)&addr, sizeof(addr)) == -1){

goto sock_err;

}

connections ++;

printf("connections: %d, fd: %d\n", connections, sock);

if(connections % 10000 == 9999){

printf("press Enter to continue: ");

getchar();

}

usleep(1 * 1000);

/*

bufsize = 5000;

setsockopt(serv_sock, SOL_SOCKET, SO_SNDBUF, &bufsize, sizeof(bufsize));

setsockopt(serv_sock, SOL_SOCKET, SO_RCVBUF, &bufsize, sizeof(bufsize));

*/

}

return 0;

sock_err:

printf("error: %s\n", strerror(errno));

return 0;

}

我测试 10 万个连接, 这些连接是空闲的, 什么数据也不发送也不接收. 这时, 进程只占用了不到 1MB 的内存. 但是, 通过程序退出前后的 free 命令对比, 发现操作系统用了 200M(大致)内存来维护这 10 万个连接! 如果是百万连接的话, 操作系统本身就要占用 2GB 的内存! 也即 2KB 每连接.

可以修改

/proc/sys/net/ipv4/tcp_wmem

/proc/sys/net/ipv4/tcp_rmem

来控制 TCP 连接的发送和接收缓冲的大小(多谢 @egmkang).

3. 应用程序维持百万连接需要多少内存?

通过上面的测试代码, 可以发现, 应用程序维持百万个空闲的连接, 只会占用操作系统的内存, 通过 ps 命令查看可知, 应用程序本身几乎不占用内存.

4. 百万连接的吞吐量是否超过了网络限制?

假设百万连接中有 20% 是活跃的, 每个连接每秒传输 1KB 的数据, 那么需要的网络带宽是 0.2M x 1KB/s x 8 = 1.6Gbps, 要求服务器至少是万兆网卡(10Gbps).

总结

Linux 系统需要修改内核参数和系统配置, 才能支持 C1000K. C1000K 的应用要求服务器至少需要 2GB 内存, 如果应用本身还需要内存, 这个要求应该是至少 10GB 内存. 同时, 网卡应该至少是万兆网卡.

当然, 这仅仅是理论分析, 实际的应用需要更多的内存和 CPU 资源来处理业务数据.

参考:

* http://www.cyberciti.biz/faq/linux-increase-the-maximum-number-of-open-files/ * http://www.lognormal.com/blog/2012/09/27/linux-tcpip-tuning/

好啦,今天的分享到这里就结束了,如果想获得更多的技术性文章,可以访问马哥教育官网!

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
操作系统能否支持百万连接?
下面来分别对这几个问题进行分析. 1. 操作系统能否支持百万连接? 对于绝大部分 Linux 操作系统, 默认情况下确实不支持 C1000K! 因为操作系统包含最大打开文件数(Max Open Fil
小小科
2018/05/02
3K0
c++ 网络编程(四)TCP/IP LINUX/windows下 socket 基于I/O复用的服务器端代码 解决多进程服务端创建进程资源浪费问题
原文链接:https://www.cnblogs.com/DOMLX/p/9613861.html
徐飞机
2018/09/30
1.8K0
c++ 网络编程(四)TCP/IP LINUX/windows下  socket 基于I/O复用的服务器端代码    解决多进程服务端创建进程资源浪费问题
c++ 网络编程(二)TCP/IP linux 下多进程socket通信 多个客户端与单个服务端交互代码实现回声服务器
原文链接:https://www.cnblogs.com/DOMLX/p/9612820.html
徐飞机
2018/09/30
3.9K0
c++ 网络编程(二)TCP/IP  linux 下多进程socket通信 多个客户端与单个服务端交互代码实现回声服务器
基于UDP的服务器端/客户端
UDP程序中,调用sendto函数传输数据前完成对套接字的地址分配工作,因此调用bind函数。当然,bind函数不区分TCP和UDP。另外调用sendto函数时尚未分配地址信息,则在首次调用sendto函数时给相应套接字自动分配IP地址和端口。而且此时分配的地址一直保留到程序结束为止。因此也可用来与其他UDP套接字进行数据交换,当然IP用主机IP,端口号选尚未使用的任意端口号。综上所述,调用sendto函数时自动分配IP和端口号,因此UDP客户端中通常无需额外的地址分配过程。
玖柒的小窝
2021/12/15
2.8K0
第8章 基本UDP套接字编程
客户端: #include "../Gnet.h" void do_client(int udpfd, struct sockaddr* pserver_addr, socklen_t server_addr_len) { char buf[MAX_LINE]; int nread; while(fgets(buf, MAX_LINE, stdin) != NULL) { sendto(udpfd, buf, strlen(buf), 0, pserv
_gongluck
2018/03/09
8700
第8章 基本UDP套接字编程
c++ 网络编程(三)TCP/IP LINUX/windows 进程间的通信原理与实现代码 基于多进程的服务端实现
原文链接:https://www.cnblogs.com/DOMLX/p/9613027.html
徐飞机
2018/09/30
1.4K0
c++ 网络编程(三)TCP/IP  LINUX/windows  进程间的通信原理与实现代码  基于多进程的服务端实现
select的限制以及poll的使用
1.先说select在多路IO中的限制: 1)linux中每个程序能够打开的最多文件描述符是有限制的。默认是1024. 可以通过ulimit -n进行查看和修改:
xcywt
2022/05/09
1.1K0
select的限制以及poll的使用
进程间通讯(七).socket(1)
UNIX/Linux 是多任务的操作系统,通过多个进程分别处理不同事务来实现,如果多个进程要进行协同工作或者争用同一个资源时,互相之间的通讯就很有必要了
franket
2021/09/15
7160
【C++】基础:网络编程介绍与TCP&UDP示例
网络传输模型可以抽象为7个层:物理层、数据链路层、网络层、传输层、会话层、表示层、应用层。
DevFrank
2024/07/24
6200
【C++】基础:网络编程介绍与TCP&UDP示例
c语言UDP传输系统源码
/*加载库文件*/ #pragma comment( lib, "ws2_32.lib" ) /*加载头文件*/ #include <winsock2.h> #include <ws2tcpip.h> #include <stdio.h> #include <stdlib.h> // 来自公众号:c语言与cpp编程 /*定义多播常量*/ #define MCASTADDR "224.3.5.8" #define MCASTPORT 25000 #define BUFSIZE
C语言与CPP编程
2021/01/02
3.5K0
c++ 网络编程(七)TCP/IP LINUX下 socket编程 基于套接字的标准I/O函数使用 与 fopen,feof,fgets,fputs函数用法
原文链接:https://www.cnblogs.com/DOMLX/p/9614820.html
徐飞机
2018/09/30
1.6K0
C/C++ 实现正反向端口映射
通常服务器是放在内网中,内部局域网中,并且分配了私有IP地址,而如果想要在外部直接访问内部服务器则需要端口映射,端口映射也叫做端口转发,或者叫做虚拟服务器,在渗透时当我们拿到目标机器权限以后,目标机器实在内网环境中,如果想要外部直接访问内部的特定机器的特定端口,则需要使用映射来实现,常用的映射工具是LCX,或者自己实现。
王 瑞
2022/12/28
7240
UDP&TCP Linux网络应用编程详解
暂时想不出什么好的应用场景, 目前想到目标就是实现让两个设备通过网络传输数据, 比如开发板和Linux主机之间传数据, 以后就可以实现开发板通过网络上报数据或者主机通过网络控制开发板。
韦东山
2020/09/30
6K0
UDP&TCP Linux网络应用编程详解
TCP/IP网络编程-4~9章学习笔记
fputs、fgets指定到流的操作(文件流), 对应的直接输入输出还有 puts、gets,这里不再推荐使用puts、gets了, 他们之间也有区别
用户2825413
2019/07/16
5200
TCP/IP网络编程-4~9章学习笔记
epoll的使用实例
  在网络编程中通常需要处理很多个连接,可以用select和poll来处理多个连接。但是select都受进程能打开的最大文件描述符个数的限制。并且select和poll效率会随着监听fd的数目增多而下降。
xcywt
2022/05/09
8950
关于close和shutdown
我们知道TCP是全双工的,可以在接收数据的同时发送数据。 假设有主机A在和主机B通信,可以认为是在两者之间存在两个管道。就像这样: A ---------> B A <--------- B
xcywt
2022/05/09
1.5K0
[linux] C语言Linux系统编程-socket开发
4.将内存中字节的编号称为地址(Address)或指针(Pointer),一般认为变量名表示的是数据本身,而函数名、字符串名和数组名表示的是代码块或数据块的首地址
唯一Chat
2019/09/10
3.7K0
Linux网络编程一步一步学-异步通讯聊天程序select
/************关于本文档********************************************
阳光岛主
2019/02/19
8700
SOCKET网络编程 (通俗易懂入门篇)
struct sockaddr :很多网络编程函数的出现早于IPV4协议,为了向前兼容,现在sockaddr都退化成(void *)结构了。 传递一个地址给函数,然后由函数内部再强制类型转换为所需的地址类型。
看、未来
2020/08/25
1.3K0
SOCKET网络编程 (通俗易懂入门篇)
多路I/O转接服务器
多路IO转接服务器也叫做多任务IO服务器。该类服务器实现的主旨思想是,不再由应用程序自己监视客户端连接,取而代之由内核替应用程序监视文件。
mindtechnist
2024/08/08
2640
多路I/O转接服务器
推荐阅读
相关推荐
操作系统能否支持百万连接?
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档