Nginx 部署负载均衡服务全解析-编程学习网

一什么是负载均衡

负载均衡（Load Balancing）是一种计算机网络技术，用于将网络流量或请求分发到多个服务器上，以优化资源使用、最大化吞吐量、最小化响应时间，并避免任何单一点过载。负载均衡的目的是确保我们的 Web 应用的高可用性和可靠性，同时提高用户体验。

图片

一般来说，我们可能会在如下场景中用到负载均衡：

服务器负载均衡：在多个服务器之间分配网络流量，以防止任何单个服务器因请求过多而性能下降。
数据中心负载均衡：在数据中心的不同位置或不同数据中心之间分配流量，以优化资源利用和提高可靠性。
云服务负载均衡：在云环境中，负载均衡可以跨多个虚拟机或容器服务分配流量。

虽然我们平时做负载均衡基本上都是 Nginx，但是考虑到文章内容的完整性，松哥还是和大家说一说负载均衡这事可以在不同的网络层面实行，比如：

DNS 负载均衡：通过 DNS 服务将域名解析成不同的 IP 地址，将流量分散到不同的服务器上。
硬件负载均衡：使用专门的硬件设备（如 F5 BIG-IP）来分配流量。
软件负载均衡：使用软件解决方案（如 Nginx、HAProxy）来实现负载均衡。
应用层负载均衡：在应用层（如 HTTP/HTTPS）分配请求到不同的服务器。
传输层负载均衡：在传输层（如 TCP/UDP）分配连接到不同的服务器。

二常见负载均衡算法

无论你使用哪种工具，在哪进行负载均衡，常见的负载均衡算法主要是下面这几种：

轮询（Round Robin）：将请求轮流分配给每台服务器。
最少连接（Least Connections）：将请求分配给当前连接数最少的服务器。
加权轮询（Weighted Round Robin）：根据服务器的性能权重来分配请求。
加权最少连接（Weighted Least Connections）：根据服务器的性能权重和当前连接数来分配请求。
IP 哈希（IP Hash）：根据客户端 IP 地址的哈希值来分配请求，以保证来自同一 IP 的请求总是被分配到同一台服务器上。

三 Nginx 配置

3.1 轮询（Round Robin）

轮询是 Nginx 默认的负载均衡策略，它将客户端的请求按顺序轮流分配到后端服务器上。如果后端服务器宕机，Nginx 会自动将其剔除出队列，直到该服务器恢复正常。

举个栗子：

upstream backend {  
    server backend1.example.com;  
    server backend2.example.com;  
    server backend3.example.com;  
}  
  
server {  
    ...  
    location / {  
        proxy_pass http://backend;  
    }  
    ...  
}

在上面的配置中，Nginx 会将请求依次分配给 backend1、backend2 和 backend3，循环往复。

3.2 加权轮询

加权轮询策略允许你为后端服务器分配不同的权重，权重越高的服务器将接收更多的请求。这可以根据服务器的硬件配置、处理能力等因素进行灵活配置。

http {  
    upstream myapp1 {  # 定义一个名为myapp1的服务器组  
        server backend1.example.com weight=5;  # 添加一个服务器，并设置权重为5  
        server backend2.example.com;  # 添加另一个服务器，权重默认为1  
        server backend3.example.com down;  # 将此服务器标记为down，不参与负载均衡  
        server backup1.example.com backup;  # 将此服务器作为备份服务器  
    }  
  
    server {  
        listen 80;  # 监听80端口  
  
        location / {  # 匹配所有请求  
            proxy_pass http://myapp1;  # 将请求转发到myapp1服务器组  
            proxy_set_header Host $host;  # 设置请求头中的Host字段为原始请求的Host  
            proxy_set_header X-Real-IP $remote_addr;  # 设置请求头中的X-Real-IP字段为客户端的真实IP地址  
            proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;  # 设置请求头中的X-Forwarded-For字段，以记录原始请求和代理链的IP地址  
            proxy_set_header X-Forwarded-Proto $scheme;  # 设置请求头中的X-Forwarded-Proto字段为原始请求的协议（http或https）  
        }  
    }  
}

上面的负载均衡策略是权重，除了权重之外，还有轮询以及 ip_hash 等。

3.3 IP 哈希（IP Hash）

IP 哈希策略根据客户端的 IP 地址进行哈希运算，将相同的请求分配给同一个后端服务器。

这种策略适用于需要保持会话（Session）的场景，因为同一个客户端的请求会被发送到同一个服务器，从而避免了会话信息的丢失。

upstream backend {  
    ip_hash;  
    server backend1.example.com;  
    server backend2.example.com;  
    server backend3.example.com;  
}  
  
server {  
    ...  
    location / {  
        proxy_pass http://backend;  
    }  
    ...  
}

在上面的配置中，Nginx 会根据客户端的 IP 地址进行哈希运算，然后将请求分配到对应的后端服务器。

3.4 最少连接（Least Connections）

最少连接策略将新的请求分配给当前连接数最少的后端服务器。这种策略可以确保每个后端服务器的负载相对均衡，避免某个服务器过载而其他服务器空闲的情况。

注意：Nginx 原生的 Stream 模块支持最少连接，但在 HTTP 模块中通常需要借助第三方插件或脚本实现。

对于 HTTP 模块，可以通过第三方插件如 ngx_http_upstream_fair_module 或编写 Lua 脚本来实现类似的功能。

但在 Stream 模块中，可以直接配置，下面是一个 Stream 中配置的例子：

upstream backend {  
    least_conn;  
    server backend1.example.com;  
    server backend2.example.com;  
    server backend3.example.com;  
}  
  
stream {  
    server {  
        listen 12345;  
        proxy_pass backend;  
    }  
}

3.5 健康检查

在 Nginx 中配置负载均衡的健康检查，可以通过主动健康检查（Active Health Checks）和被动健康检查（Passive Health Checks）两种方式来实现。

主动健康检查

主动健康检查是定期向上游服务器发送请求以检查其健康状况，如果上游服务器未能正确响应，Nginx 将认为该服务器不健康，并停止向其发送流量，直到服务器恢复健康。

配置方式如下：

http {
    upstream backend {
        server backend1.example.com;
        server backend2.example.com;
        check interval=3000 rise=2 fall=5 timeout=1000 type=http;
        check_http_send "HEAD /health HTTP/1.1\r\nHost: localhost\r\nConnection: close\r\n\r\n";
        check_http_expect_alive http_2xx http_3xx;
    }
    server {
        location / {
            proxy_pass http://backend;
        }
    }
}

在这个配置中，Nginx 将每隔 3 秒（interval=3000）向 /health 端点发送一个 HEAD 请求。如果服务器连续两次返回 2xx 或 3xx 的 HTTP 状态码（rise=2），则认为服务器是健康的。如果服务器连续五次未能正确响应（fall=5），则认为服务器不健康。

被动健康检查

被动健康检查基于实时流量分析，Nginx 根据后端服务器的响应来判断其健康状况。如果服务器返回特定的错误状态码，Nginx 将认为该服务器不健康，并在一段时间内不再将请求发送到该服务器。

配置方式如下：

http {
    upstream backend {
        server backend1.example.com;
        server backend2.example.com max_fails=2 fail_timeout=30s;
    }
    server {
        listen 80;
        location / {
            proxy_pass backend;
            proxy_next_upstream error timeout http_500 http_502 http_503 http_504;
        }
    }
}

在这个配置中，如果后端服务器在 30 秒内连续两次（max_fails=2）未能正确响应，它将被临时从服务器池中移除。proxy_next_upstream 指令指定了哪些错误应该触发使用不同的服务器进行重试。

文章详情

Nginx 部署负载均衡服务全解析