1.1 openresty+lua+kafka方案
之前的项目基于nginx反向代理后转发到Tomcat的API接口进行业务处理,然后将json数据打入kafka中,但是随着业务的扩大,访问量越来越大,并发数也很高,导致程序遇到性能问题;
基于nginx的高性能特点,现在考虑使用一种openresty+lua+kafka,直接在nginx阶段将数据打入kafka中,来提高性能。
1.1.1 OpenResty运行原理
Nginx 采用的是 master-worker 模型,一个 master 进程管理多个 worker 进程,基本的事件处理都是放在 woker 中,master 负责一些全局初始化,以及对 worker 的管理。在OpenResty中,每个 woker 使用一个 LuaVM,当请求被分配到 woker 时,将在这个 LuaVM 里创建一个 coroutine(协程)。协程之间数据隔离,每个协程具有独立的全局变量_G。
协程和多线程下的线程类似:有自己的堆栈,自己的局部变量,有自己的指令指针,但是和其他协程程序共享全局变量等信息。线程和协程的主要不同在于:多处理器的情况下,概念上来说多线程是同时运行多个线程,而协程是通过代码来完成协程的切换,任何时刻只有一个协程程序在运行。并且这个在运行的协程只有明确被要求挂起时才会被挂起。
原理图如下:
1.1.2 OpenResty的优势
其是由Nginx核心加很多第三方模块组成,其最大的亮点是默认集成了Lua开发环境,使得Nginx可以作为一个Web Server使用。
借助于Nginx的事件驱动模型和非阻塞IO,可以实现高性能的Web应用程序。
而且OpenResty提供了大量组件如Mysql、Redis、Memcached等等,使在Nginx上开发Web应用更方便更简单。目前在京东如实时价格、秒杀、动态服务、单品页、列表页等都在使用Nginx+Lua架构,其他公司如淘宝、去哪儿网等。
1.2 方案实施
申请线上云主机,部署公司内部部署平台NDP;
配置openresty:
worker_processes 8;
pid /home/xxxx/nginx.pid;
events {
use epoll;
worker_connections 65535;
multi_accept on;
}
http {
lua_package_path "/home/xxxxxx/lib/?.lua;;";
include mime.types;
default_type application/octet-stream;
#access_log off;
keepalive_requests 8192;
keepalive_timeout 300s 300s;
server_names_hash_bucket_size 128;
client_header_buffer_size 32k;
large_client_header_buffers 4 32k;
client_max_body_size 1024m;
client_body_buffer_size 10m;
log_format main '$remote_addr$time_iso8601$request'
'$status$upstream_response_time$request_time'
'$http_user_agent$http_x_forwarded_for';
access_log off;
# access_log /home/xxxxxx/access.log main;
sendfile on;
#提高I/O性能
tcp_nodelay on;
proxy_buffering off;
#此请求不缓存
#add_header Expires "Fri, 01 Jan 1980 00:00:00 GMT";
#add_header Pragma "no-cache";
#add_header Cache-Control "no-cache, max-age=0, must-revalidate";
resolver xxxxx;
# healthcheck shared
# lua_shared_dict healthcheck 1m;
# 数据书籍服务汇总
include ./service_hub/*;
}
配置依赖lua依赖:
配置server服务:
server {
listen 8080;
#数据上报
# 默认读取 body
lua_need_request_body on;
location /xxxx {
# access_log /home/xxxx/risk_doubt.log main;
# 响应正常,内容为空
empty_gif;
content_by_lua_block{
-- 引入lua所有api
local topic = "xxxx"
local cjson = require "cjson"
local producer = require "resty.kafka.producer"
-- 定义kafka broker地址,ip需要和kafka的host.name配置一致
local broker_list = {
{ host = "xxx", port = 9092 },
{ host = "yyy", port = 9092 },
{ host = "zzz", port = 9092 }
}
-- 定义json便于日志数据整理收集
local data_json = {}
ngx.req.read_body()
local args = ngx.req.get_body_data()
-- 将ip传入json参数中
data_json["body"] = args
data_json["ip"] = ngx.var.remote_addr
-- 转换json为字符串
-- ngx.log(ngx.ERR, "args:", tostring(data_json))
local message = cjson.encode(data_json);
ngx.log(ngx.ERR, "args:", message)
-- 定义kafka异步生产者
local bp = producer:new(broker_list, { producer_type = "async" })
-- 发送日志消息,send第二个参数key,用于kafka路由控制:
-- key为nill(空)时,一段时间向同一partition写入数据
-- 指定key,按照key的hash写入到对应的partition
-- local ok, err = bp:send(topic, nil, message)
-- if not ok then
-- ngx.log(ngx.ERR, "kafka send err:", err)
-- return
-- end
}
}
}
1.3 压力测试:
线上被测云主机性能:8核,16G内存,400M网卡流量。
该次测试是在 1000并发量,1分钟16秒压测时间段内的数据:
@PostMapping(value = "/xxxx")
public Object test(String str, HttpServletRequest request) throws IOException
{
//logger.info("receive msg...");
return null;
}
同上的压测环境进行压测:
三、性能分析:
1、同样的压测环境,openresty的TPS性能确实要比单纯的Tomcat要好;
2、根据TPS的性能曲线可以看到,openresty的TPS曲线要比tomcat的更加稳定;
中间遇到的问题分析:
其实参考资料你会发现,测试结果中openresty的TPS数值比起网上很多数值要低不少,有不少网友的压测结果是10W+,为什么有这么大的差距呢,主要原因还是楼主所使用的线上云主机网卡流量有限制,只有400M,
导致了openresty的性能无法得到充分的发挥,后期项目中会考虑换用1G以上的网卡流量。