自古帝王多短命,假如皇帝也懂负载均衡算法...

百家 作者:51CTO技术栈 2020-01-15 11:53:19

大家都知道古代皇帝各个都是后宫佳丽三千,而皇帝身上都天然的带着雨露均沾的精神,不想单独的宠爱一人!



图片来自 Pexels


弱水三千,又怎舍得只取一瓢饮?据传皇帝们晚上睡觉个个都怕冷,因此每晚都需要有人侍寝,那么这么多后宫,该翻谁牌子、怎么分配侍寝名额呢?


还别说,皇帝行房事竟还挺讲究的!早在《春秋》就有记载“晦阴惑疾,明谣心疾,以辟六气”。

九嫔以下,每九人中进御一人,八十一女御占九个晚上,世妇二十七人占三个晚上,九嫔占一个晚上,三夫人占一个晚上,以上共十四夜,皇后独占一个晚上,共十五夜。上半个月按上述安排进御,下半个月从十六日开始,由皇后起,再御九嫔、世妇、女御,与月亮由盛而衰相对应......


不同朝代的皇帝也有不同宠幸妃子的方法,著名的有羊车望幸、掷筛侍寝、蝶幸、翻牌悬灯等等。


不过在我看来,如果皇帝懂负载均衡算法的话,大可不必这么折腾,一套算法便可搞定终身侍寝大事!因此我们今天来介绍几种常用的负载均衡算法及代码实现!


先看下文章的大纲:

  • 轮询算法

  • 加权轮询算法

  • 随机算法

  • 加权随机算法

  • 源地址 hash 算法

  • 一致性 hash 算法


轮询算法


据史料记载,乾隆一生妃嫔就有 42 人,还不算大明湖畔的夏雨荷等在下江南时候留下的情。

假设在某个时期内,皇阿玛最宠幸的有令妃、娴妃、高贵妃、纯妃四位。那普通的轮询算法怎么去选择呢?

我们先定义一个妃子集合如下:
/**
?*?*所有妃子集合
?*/

public?static?final?List?PRINCESS_LIST?=?Arrays.asList("令妃",?"娴妃",?"高贵妃",?"纯妃");


然后从列表中轮询侍寝的妃子,用一个变量 index 去记录轮询的位置。

//?记录循环的位置
private?static?Integer?index?=?0;
public?static?void?main(String[]?args)?{
????for?(int?i?=?0;?i?10;?i++)?{
????????System.out.println(getPrincess());
????}
}
private?static?String?getPrincess()?{
????//?超过数组大小需要归零(每次获取前判断,防止配置变化导致索引越界)
????if?(index?>=?PrincessConfig.PRINCESS_LIST.size())?{
????????index?=?0;
????}
????String?princess?=?PrincessConfig.PRINCESS_LIST.get(index);
????index++;
????return?princess;
}


输出结果就不贴出来了。该算法的特点就是简单、简单、简单!但是也存在很大缺点!


如果皇帝更宠爱令妃,想让她侍寝的概率更高呢?那就需要用到下面的加权轮询算法!

加权轮询算法


加权轮询就是可以主观的给每个妃子设置一个喜好值(权重值),以控制被选中的概率,因此我们需要定义如下的配置:

/**
?*?*所有妃子集合
?*/

public?static?final?Map<String,?Integer>?PRINCESS_MAP?=?new?LinkedHashMap<String,?Integer>()?{
????{
????????put("令妃",?5);
????????put("娴妃",?1);
????????put("高贵妃",?3);
????????put("纯妃",?2);
????}
};


这里的配置就不再是简单的一个集合,每个妃子都对应了一个权重值,那轮询的时候怎么根据这个值去提高被选中的概率呢?


下面我们来讲三种比较常见的实现。


加权轮询实现一


我们的思路是把这个 map 的 key(妃子)根据权重值转存到一个 list 中,然后再去轮询这个 list,如果权重值为 5,那就在 list 中添加 5 条相同的记录!


然后我们去遍历这个 list,这样权重值越高,在 list 中出现的概率就越高,被轮询中的概率也就越高!

//?记录循环的位置
private?static?Integer?index?=?0;

public?static?void?main(String[]?args)?{
???for?(int?i?=?0;?i?11;?i++)?{
???????System.out.println(getPrincess1());
??}
}

private?static?String?getPrincess1()?{

???//?遍历map放入到list中
???List?princessList?=?new?ArrayList();
???for?(String?princess?:?PrincessConfig.PRINCESS_MAP.keySet())?{
???????int?weight?=?PrincessConfig.PRINCESS_MAP.get(princess);
???????//?根据权重值重复放入到一个list中
???????for?(int?i?=?0;?i????????????princessList.add(princess);
??????}
??}

???if?(index?>=?princessList.size())?{
???????index?=?0;
??}
???String?princess?=?princessList.get(index);

???index++;

???return?princess;
}


输出结果如下:

该加权轮询算法比较简单,比较容易实现。但是也有个问题,我们配置的权重值是 5、1、3、2,那我们是不是也可以配置成 50、10、30、20 呢?


那按照上面的方式,我们是不是就需要把同样的元素往 list 里面放几百个呢?这显然是比较不合理且耗内存的!


加权轮询实现二


基于上面的算法存在的问题,我们考虑用类似占比的方式来处理。


比如我们配置的权重值为 50、10、30、20,那在横坐标上表示就是 0_____50_60__80__110。


我们还是用一个 index 去记录轮询的位置,如果 index 在 0~50 之间就代表第一个妃子被选中,如果在 50~60 之间就代表第二个妃子被选中......


我们看具体代码实现:

//?记录循环的位置
private?static?Integer?indexInteger?=?0;

public?static?void?main(String[]?args)?{
???for?(int?i?=?0;?i?11;?i++)?{
???????System.out.println(getPrincess2());
??}
}

private?static?String?getPrincess2()?{
???//记录总权重值
???int?totalWeight?=?0;
???for?(String?princess?:?PrincessConfig.PRINCESS_MAP.keySet())?{
???????int?weight?=?PrincessConfig.PRINCESS_MAP.get(princess);
???????totalWeight?+=?weight;
??}

???//?归零
???if?(indexInteger?>=?totalWeight)?{
???????indexInteger?=?0;
??}

???int?index?=?indexInteger;
???String?result?=?null;
???for?(String?princess?:?PrincessConfig.PRINCESS_MAP.keySet())?{
???????int?weight?=?PrincessConfig.PRINCESS_MAP.get(princess);

???????//?落在当前区间?直接返回
???????if?(index?
???????????result?=?princess;
???????????break;
??????}

???????//?没有落在当前区间?继续循环
???????index?=?index?-?weight;

??}

???indexInteger++;
???return?result;
}


输出结果与上面的方法一毛一样:

该加权轮询算法略复杂于第一种,但是这两种实现都存在的共同问题是,按照我们目前的配置去轮询会连续 5 次令妃、再 1 次娴妃、再 3 次高贵妃......


连续 5 次!就算皇阿玛再喜欢令妃,怕是令妃也有点吃不消!用计算机术语说也就是负载不是很均衡!


加权轮询实现三(平滑加权轮询)


平滑加权轮询算法就是为了解决上面负载不均衡的情况的,该算法实现起来相对比较复杂!


每个妃子不仅有一个权重值(weight),还有一个会变化的动态权重值(dynamicWeight)来辅助计算。


动态权重值计算逻辑如下:
  • 动态权重值 dynamicWeight 初始为 0。

  • 每次获取轮询获取目标妃子时先设置 dynamicWeight=dynamicWeight+weight。

  • 然后找到所有妃子中动态权重值 dynamicWeight 最大的一个,则为本次轮询到的目标。

  • 将本次轮询到的目标的 dynamicWeight 设置为 dynamicWeight-totalWeight(总权重值)。


这样看可能会有点不是很明白,我们来做个推算,假设我们还是有如下配置(配置中只有妃子名称及对应的权重值):

/**
?*?*所有妃子集合
?*/

public?static?final?Map<String,?Integer>?PRINCESS_MAP?=?new?LinkedHashMap<String,?Integer>()?{
????{
????????put("令妃",?5);
????????put("娴妃",?1);
????????put("高贵妃",?3);
????????put("纯妃",?2);
????}
};


在上面的配置中总权重值 totalWeight=5+1+3+2 等于 11。

①按照上面算法的第一点,在第一次轮询目标之前她们的 dynamicWeight 都是0。


因此四位妃子的 weight 和 dynamicWeight 值如下:

②按照上面算法的第二点,在第一次轮询选中目标的时候 dynamicWeight=dynamicWeight+weight。

变化后四位妃子的 weight 和 dynamicWeight 值如下:

③按照上面算法的第三点,然后找最大的 dynamicWeight,也就是 5,因此第一次轮询选中的就是令妃。


④按照上面算法的第四点,令妃的 dynamicWeight 需要减去 totalWeight。


变化后四位妃子的 weight 和 dynamicWeight 值如下:

然后第二次轮询的时候又需要按照算法的第一点设置 dynamicWeight。


设置后四位妃子的 weight 和 dynamicWeight 值如下:

就这样一直按照算法处理下去,轮询完 11 次后,所有妃子的 dynamicWeight 又会全部变为 0......

如果大家依然还是有点模糊,我们只能上代码为敬了!我们需要先定义一个实体,来存放每个妃子及对应的 weight 及 dynamicWeight 属性:

/**
?*?*权重实体
?*?
?*?@author?sullivan
?*
?*/

public?class?PrincessWeight?{
????private?String?princess;
????private?Integer?weight;
????private?Integer?dynamicWeight;
????public?PrincessWeight(String?princess,?Integer?weight,?Integer?dynamicWeight)?{
????????super();
????????this.princess?=?princess;
????????this.weight?=?weight;
????????this.dynamicWeight?=?dynamicWeight;
????}
}


然后定义两个全局的对象存放对象:

//?每个妃子及对应的权重实体
private?static?Map<String,?PrincessWeight>?weightMap?=?new?HashMap<String,?PrincessWeight>();
//?总权重值
private?static?int?totalWeight?=?0;


再进行算法的实现:

private?static?String?getPrincess()?{????
????//?初始化妃子及对应的权重实体
????if?(weightMap.isEmpty())?{
????????//将配置初始化到map中去
????????for?(String?princess?:?PrincessConfig.PRINCESS_MAP.keySet())?{
????????????//?算法的第一点:初始dynamicWeight为0
????????????weightMap.put(princess,?new?PrincessWeight(princess,?PrincessConfig.PRINCESS_MAP.get(princess),?0));
????????????totalWeight?+=?PrincessConfig.PRINCESS_MAP.get(princess);
????????}
????}

????//?算法的第二点:设置currentWeight=设置weight+currentWeight
????for?(PrincessWeight?weight?:?weightMap.values())?{
????????weight.setDynamicWeight(weight.getWeight()?+?weight.getDynamicWeight());
????}

????//?算法的第三点:寻找最大的currentWeight
????PrincessWeight?maxPrincessWeight?=?null;
????for?(PrincessWeight?weight?:?weightMap.values())?{
????????if?(maxPrincessWeight?==?null?||?weight.getDynamicWeight()?>?maxPrincessWeight.getDynamicWeight())?{
????????????maxPrincessWeight?=?weight;
????????}
????}

????//?算法的第四点:最大的dynamicWeight = dynamicWeight-totalWeight
????maxPrincessWeight.setDynamicWeight(maxPrincessWeight.getDynamicWeight()?-?totalWeight);

????return?maxPrincessWeight.getPrincess();
}


最终输出如下:

这样经过 11 次轮询,令妃同样出现了 5 次,但是明显不会再像之前算法那样连续出现了,会均衡得多!!!如果还有不清楚的,可以去文末的 Github 地址上下载代码自己调试及理解!

随机算法


平滑加权轮询算法能很好的进行负载了!但是皇阿玛又说了,按照轮询算法,我自己都能够推出来每晚侍寝的妃子,不刺激不刺激。


皇帝嘛,总喜欢来些新鲜的刺激的我们也可以理解!还好我们有随机算法可以解决,每晚都是随机选一个,让皇帝无法提前推测,给皇帝足够的刺激感!


我们依然先定义一个妃子集合如下:

/**
?*?*所有妃子集合
?*/

public?static?final?List?PRINCESS_LIST?=?Arrays.asList("令妃",?"娴妃",?"高贵妃",?"纯妃");


然后利用随机函数去选择一个目标:

public?static?void?main(String[]?args)?{
????for?(int?i?=?0;?i?10;?i++)?{
????????System.out.println(getPrincess());
????}
}
/**
?*?*随机获取侍寝妃子
?*?@return
?*/

private?static?String?getPrincess()?{
????SecureRandom?rd?=?new?SecureRandom();
????int?index?=?rd.nextInt(PrincessConfig.PRINCESS_LIST.size());
????return?PrincessConfig.PRINCESS_LIST.get(index);
}


因为输出是随机的,所以这里就不贴出来了。如果明白了轮询算法,随机算法理解起来也就简单了,只是在轮询中用一个全局的 index 去保存每次循环的位置,而在随机中是每次去随机出来一个值。


加权随机算法


加权随机实现一


加权随机实现一与上面的加权轮询实现一的思路几乎一毛一样,这里就直接上代码了:

public?static?void?main(String[]?args)?{
????????for?(int?i?=?0;?i?10;?i++)?{
????????????System.out.println(getPrincess());
????????}
????}
private?static?String?getPrincess()?{
????List?princessList?=?new?ArrayList();
????for?(String?princess?:?PrincessConfig.PRINCESS_MAP.keySet())?{
????????int?weight?=?PrincessConfig.PRINCESS_MAP.get(princess);
????????for?(int?i?=?0;?i?????????????princessList.add(princess);
????????}
????}
????Random?rd?=?new?Random();
????int?index?=?rd.nextInt(princessList.size());
????return?princessList.get(index);
}


加权随机实现二


加权随机实现二与上面的加权轮询实现二的思路几乎一模一样,这里也就直接上代码了:

public?static?void?main(String[]?args)?{
????for?(int?i?=?0;?i?10;?i++)?{
????????System.out.println(getPrincess2());
????}
}

private?static?String?getPrincess2()?{

????List<String>?princessList?=?new?ArrayList<String>();
????int?totalWeight?=?0;
????for?(String?princess?:?PrincessConfig.PRINCESS_MAP.keySet())?{
????????int?weight?=?PrincessConfig.PRINCESS_MAP.get(princess);
????????totalWeight?+=?weight;
????????for?(int?i?=?0;?i?????????????princessList.add(princess);
????????}
????}

????Random?rd?=?new?Random();
????int?index?=?rd.nextInt(totalWeight);

????String?result?=?null;
????for?(String?princess?:?PrincessConfig.PRINCESS_MAP.keySet())?{
????????int?weight?=?PrincessConfig.PRINCESS_MAP.get(princess);

????????//?落在当前区间?直接返回
????????if?(index?
????????????result?=?princess;
????????????break;
????????}

????????//?没有落在当前区间?继续循环
????????index?=?index?-?weight;

????}
????return?result;
}

源地址 hash 算法


我们的工作中开发系统很常见的一个需求就是需要登录后才能访问,这就会涉及到 session!

如果我们没有做 session 共享,那登录后的 session 信息只会存在我们调用登录接口的那台服务器上!


按照前面的轮询算法或者随机算法,我们同一客户端的多次请求就会落在不同的服务器上,这样就会导致部分接口没权限访问!


因此我们需要同一个客户端多次的请求落在同一台服务器上,这里常见的一种做法是对源地址进行 hash!


到这里我们也得让我们的皇阿玛歇会儿了,回到我们正常的业务场景中。假如我们有服务器配置如下:

/**
?????*?*所有服务器集合
?????*/

????public?static?final?List?SERVER_IP_LIST?=?Arrays.asList(
????????"192.168.1.10",?
????????"192.168.2.20",?
????????"192.168.3.30",?
????????"192.168.4.40");


客户端访问的 ip 我也模拟了一个集合:

????/**
?????*?*客户端ip
?????*/

????public?static?final?List?CLIENT_IP_LIST?=?Arrays.asList(
????????"113.88.97.173",?
????????"106.11.154.33",?
????????"207.46.13.149",
????????"42.156.137.120",?
????????"203.208.60.0",?
????????"119.39.47.182",?
????????"171.34.179.4",?
????????"111.175.58.52",?
????????"124.235.138.199",
????????"175.184.166.184");


源地址 hash 算法的思路就是对客户端的 ip 进行 hash,然后用 hash 值与服务器的数量进行取模,得到需要访问的服务器的 ip。只要客户端 ip 不变,那 hash 后的值就是固定的!

实现如下:

public?static?void?main(String[]?args)?{
????????for?(String?clientIp?:?CLIENT_IP_LIST)?{
????????????int?index?=?Math.abs(getHash(clientIp))?%?PrincessConfig.SERVER_IP_LIST.size();
????????????String?serverIp?=?PrincessConfig.SERVER_IP_LIST.get(index);
????????????System.out.println(clientIp?+?"请求的服务器ip为"?+?serverIp);
????????}
????}


最终输出如下:

这样不管执行多少次,相同的客户端 ip 请求得到的服务器地址都是一样的!


这种实现很简单,但也很脆弱!因为我们服务器的数量是可能变化的,今天下线一台机器明天增加一台机器是很常见的!


服务器数量一旦变化,那源地址 hash 之后取模的值可能就变化了,获取到的服务器的 ip 自然就也会发生变化!


比如我们服务器去掉一台 192.168.4.10 的机器再看下输出结果:

对比输出结果我们就能看到,影响几乎是全局的!那我们能不能有一种方案就算是服务器数量变化,也能减少受影响的客户端呢?这就需要用到下面的一致性 hash 算法!


一致性 hash 算法


加权轮询算法实现二中我们讲到过把权重值转化为横坐标展示,我们这里是不是也可以用同样的思路呢?


客户端 ip 进行 hash 后不就是一个 int32 的数字嘛,那我们就可以把一个 int32 的数字分为几个段,让每个服务器负责一个段的请求!

下面为了直观我们把服务器 192.168.2.10、192.168.2.20、192.168.2.30、192.168.2.40 分别用 IP1、IP2、IP3、IP4 表示,如上图:
  • 如果客户端 ip 进行 hash 后的值在 0~536870911 之间,那就交给 IP2 服务器处理。

  • 如果客户端 ip 进行 hash 后的值在 536870911~1073741822 之间,那就交给 IP3 服务器处理。

  • 如果客户端 ip 进行 hash 后的值在 1073741822~1610612733 之间,那就交给 IP4 服务器处理。

  • 如果客户端 ip 进行 hash 后的值大于 1610612733 之间,那就交给 IP1 服务器处理。


但是专业一点的表示都会把这个横坐标掰弯,形成一个环,就叫所谓的 hash 环,如下图:

这样看就更直观了!如果有天 IP4 这台服务器宕机,那原来需要到 IP4 的请求就会全部转移到 IP1 服务器进行处理。


这样对部分客户端的请求依然会有影响,但至少影响也只是局部的,如下图:

这样就可以了吗?我们思考两个问题:
  • 每个服务器在 hash 环上的位置是我们人为的均匀的分配的,这样经常需要扩容缩容的时候会不会比较难以维护呢?

  • IP4 宕机,原本会到 IP4 的请求全部转移到 IP1,那会不会导致 IP1 的流量不均衡?能不能有一个更均衡一点的方案让原本到 IP4 的流量均衡的转移到 IP1、IP2、IP3 呢?


解决问题 1 的方案就是不再人为分配结点所在的位置,而是根据服务器的 ip 计算出 hash 值,再看 hash 值落在环上的哪个位置!

这样存在的一个问题是每个集群的服务器 ip 都会不同,因此计算后落在环上的位置可能就是不可控的。


如上面四台服务器计算后所在的位置可能会如下图所示:

很明显,这种情况是极为不均匀的,会造成数据的倾斜!上面问题 2 的问题其实也是宕机导致的数据倾斜!


环的左上部分那么空,我们是不是可以把现在的 4 台服务器再根据其他的规则在左上方生成一些结点呢?这样是不是请求就会稍微均匀一点呢?


这就是所谓的虚拟结点!虚拟结点就是同一个服务器 ip 会根据某个规则生成多个 hashcode,这样在环上就存在多个结点了。


如下图所示:

这里只是模拟了每台服务器有两个虚拟结点,实际在开发中会更多!这样就算 IP4 机器挂掉,请求也不会全部压到某一台服务器上去!


讲了这么多,但实现起来也不难,下面就该上代码了(服务器配置及请求的客户端 ip 与源地址 hash 算法部分的一致,这里就不贴对应的代码了,直接上算法逻辑):

//虚拟结点数量100
private?static?final?Integer?VIRTUAL_NODES?=?100;

public?static?void?main(String[]?args)?{

????//?遍历服务器ip,生成对应的虚拟结点
????TreeMapString>?nodeMap?=?new?TreeMapString>();
????for?(String?serverIp?:?PrincessConfig.SERVER_IP_LIST)?{
????????for?(int?i?=?0;?i?????????????nodeMap.put(getHash(serverIp?+?"VN"?+?i),?serverIp);
????????}
????}

????for?(String?clientIp?:?CLIENT_IP_LIST)?{
????????//这里利用的TreeMap的特性,不清楚的可以去自己去了解一下tailMap方法的作用
????????SortedMapString>?subMap?=?nodeMap.tailMap(getHash(clientIp));
????????Integer?firstKey?=?null;
????????try?{
????????????firstKey?=?subMap.firstKey();
????????}?catch?(Exception?e)?{
????????}

????????if?(firstKey?==?null)?{
????????????firstKey?=?nodeMap.firstKey();
????????}
????????System.out.println("请求的服务器ip为"?+?nodeMap.get(firstKey));
????}
}


到此,几种常用的负载均衡算法及代码实现都已介绍完毕!还有不清楚可以去同性交友网下载示例代码自己调试:

https://github.com/sujing910206/load-balance


作者:苏静

简介:有过多年大型互联网项目的开发经验,对高并发、分布式、以及微服务技术有深入的研究及相关实践经验。经历过自学,热衷于技术研究与分享!格言:始终保持虚心学习的态度!?

编辑:陶家龙、孙淑娟

征稿:有投稿、寻求报道意向技术人请联络 editor@51cto.com

精彩文章推荐:

一杯茶的时间,上手Zabbix

腾讯万亿级日志量下,ES如何做到秒级响应?

三次握手+四次挥手,一文搞定所有!

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

图库
公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接