温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
好,那下面还有一个重要的问题啊,也就是说这个面试官几乎会逼问你的问题,那问你你目前他们公司这个生产这个数据的情况,那我要搭多少台卡夫卡集群。对吧,怎么算呢,怎么来算,我这个要买多少台这个卡发的服务器。这是如果你在开发的时候是必然要考虑的一个问题啊,那卡布尔机器的数量,一个计算公式等于二,这个相当于是一个N 2N加一,那这个N等于什么呢?峰值的生产速度,记住是生产的速度,它为啥不是消灭速度呢?他管的是不是就是你进来的数据我得能消费的掉,能那个写入到磁盘呢?那剩下的谁来消费,我跟他没啥多大关系吧,对不对,那你你要提高后一级的这个消费能力对吧?啊消费能力,所以说这块呢,是生产的速度啊,而且是峰值,如果峰值你都能扛得住的话。
01:04
那是不是整个就扛得住了峰值生产速度,那刚才我们的峰值生产速度多少?来看从哪来的?生产速度,这是压力测试的生产能力,生产能力这是多少?是不是显入速度是0.1兆每秒啊,啊是0.1兆每秒啊,这就是它的最大速度啊,这么多,当然你可以再乘一个倍数啊,再来一倍没问题,好,那这个呢,是生产速度乘以副本,它为啥要乘以一个副本啊?因为副本是不是需要这个服务器,服务器时间进行拷贝啊,来拷贝,那他肯定要占用一些时间,那你复制一份,其实就是额外的再来了一份啊,那所以说要剩一个副本,那这里面。啊,比如说这个峰值的生产速度是十兆每秒,那就是假如说啊,这已经很高了啊,刚才我们测的才0.1兆,那十兆的话乘以这个副本两个,啊,这两个一下两个居度,两个副本这才多少?20 20除以100得多少?不到一吧?啊不到一,那就约等于一,那就是二乘以一加一等于三台啊,稳稳的扣,甚至说为什么这个N多个企业,他们的卡法搭建的都是三台服务器的原因就在这。
02:31
啊,你像多大TCL内幕他们可以搭三台,而且他们每天的数据量是2亿条。啊两条啊,那像这个杨通数学,他们每天的数据条数据也是,呃,将近2亿条啊,不到2亿也是三台卡卡。啊就够了,就在这个啊,就在这儿行。那这里面我来看一看,呃,这个呢,就是先要预关,呃,先要预估一天大概有多少条数据,然后用卡卡自带的生产压测啊,测试出它的生产峰值,生产速度啊,一定是先测出它的生值这个生产速度之后再根据上面这个公式去计算出卡普卡的数量。
03:14
要先发啊,可以先感受一下,然后逐渐的往上增加这个二数量,然后呢,比如说我们这个设置的速度是十兆每秒啊,十兆每秒,那么峰值的业务速度呢,是50兆,那这里面就看你取哪个数值了啊,那正常情况下估算数量一定要取的是峰值,那峰值这里面就是50啊50,那50乘以这个二的话,正好是100,那也说像咱们这卡法集群它能扛得住的是。50兆每秒的数据。50兆零零很快啊啊,那卡卡数量就等于三台啊,就这么算,所以说通常情况下搭三台卡卡就够的,原因就在这。
我来说两句