1. 概述

API 限速的主要目的是控制对 API 的访问频率和数据使用量,以保护 API 和后端服务的稳定性和可靠性。

当接收到大量请求时,可能导致服务器过载或响应时间变慢,限制 API 的访问速率可以避免这种情况的发生。此外,API 限速还可以保护 API 免受恶意攻击,如 DDoS 攻击和暴力攻击。

另一个原因是,API 提供者可能想要限制 API 的数据使用量,以确保他们的 API 不被滥用或过度使用。可以通过限制每个用户可以请求的数据量,达到该目的,以便 API 提供者可以控制服务的成本和资源使用率。

综上所述,API 限速是一种有效的措施,可以确保 API 的稳定性和可靠性,防止 API 被恶意攻击和滥用。

Nginx 是当前非常受欢迎的 Web 服务器和反向代理服务器。在高并发、高负载的 Web 场景中,Nginx 的高性能、稳定性和可扩展性优势得到了广泛认可,因此 Nginx 在这些场景下往往是最佳选择。Nginx 也支持 HTTP、HTTPS、SMTP、POP3 等多种协议,以及负载均衡、缓存、反向代理、安全控制等多种功能,使得它可以适用于各种不同的 Web 代理场景。

下文讲述如何通过 Nginx 实现 API 限速。


2. ngx_http_map_module 模块

ngx_http_map_module 模块创建值依赖其它变量的值的变量。

2.1. 示例配置

2.2. 指令

2.2.1. map

创建新变量,其值依赖在第一个参数中指定的一个或多个源变量的值。

map 块内部的参数指定源值和结果值之间的映射。

源值被指定为字符串或正则表达式。

正则表达式应该以 “~” 符号(用于大小写敏感的匹配)或 “~*” 符号(用于大小写不敏感的匹配)开头。正则表达式可以包含命名或位置捕获,可以在其它指令以及结果变量中使用。

如果源值匹配下面描述的特殊参数的名称之一,那么它应该以 “\” 符号开头。

结果值可以包含文本、变量,及其组合。

也支持下面的特殊参数:

如果源值与指定的多个变种匹配,比如与掩码和正则表达式都匹配,那么将按照如下优先级顺序,选择第一个匹配的变种:


3. ngx_http_geo_module 模块

ngx_http_geo_module 模块创建值依赖客户端 IP 地址的变量。

3.1. 示例配置

3.2. 指令

3.2.1. geo

描述指定变量的值与客户端 IP 地址的依赖关系。默认情况下,从 $remote_addr 变量获取地址,但是也可以从其它变量获取,比如:

如果变量的值不表示有效的 IP 地址,那么使用地址 “255.255.255.255”。

可以使用 CIDR 表示法中的前缀(包括单独的地址)或范围来指定地址。

也支持以下特殊参数:

比如:

conf/geo.conf 文件可能包含如下行:

最具体匹配的值被使用。比如,对于地址 127.0.0.1,将选择值 “RU”,而非 “US”。

带范围的示例:


4. ngx_http_limit_conn_module 模块

ngx_http_limit_conn_module 模块用于按照定义的键,限制连接数量,特别是来自单个 IP 地址的连接数量。

并非所有连接都被计数。只有拥有正在被服务端处理的请求,并且全部请求头已被读取的连接才被计数。

4.1. 示例配置

4.2. 指令

4.2.1. limit_conn <zone> <number>

设置共享内存区域,以及对于给定的键值,允许的最大连接数量。当超过该限制时,服务端回复请求时,将返回错误。比如,指令:

每个 IP 地址同一时间仅允许一个连接。

可以有多个 limit_conn 指令。比如,以下配置将限制每个客户端 IP 到服务端的连接数,同时限制到虚拟主机的总连接数:

当且仅当当前层级未定义 limit_conn 指令时,从前面的配置层级继承这些指令。

4.2.2. limit_conn_zone <key> zone=<name>:<size>

设置共享内存区域的参数,它将为多个键保存状态。特别是包含当前连接数的状态。key 可以包含文本、变量,及其组合。不计算具有空键值的请求。

使用示例:

在这里,客户端 IP 地址用作键。注意,这里使用 $binary_remote_addr 变量代替 $remote_addr$remote_addr 变量的大小可以从 7 到 15 个字节不等。存储的状态在 32 位平台上,占用 32 或 64 字节的内存,在 64 位平台上,始终占用 64 字节的内存。$binary_remote_addr 变量的大小对于 IPv4 地址始终是 4 字节,对于 IPv6 地址始终是 16 字节。存储的状态在 32 位平台上,使用占用 32 或 64 字节,在 64 位平台上,占用 64 字节。1M 区域可以保存大约 3.2 万 32 字节状态,或大约 1.6 万 64 字节状态。如果区域存储被耗尽,那么服务端将对后续所有请求返回错误。

4.3. 内嵌变量

4.3.1. $limit_conn_status

保存限制连接数的结果:PASSED、REJECTED 或 REJECTED_DRY_RUN。


5. ngx_http_limit_req_module 模块

ngx_http_limit_req_module 模块用于按照定义的键,限制请求处理速率,特别是来自单个 IP 地址的请求处理速率。该模块使用“漏桶”方法进行限制。

5.1. 配置示例

5.2. 指令

5.2.1. limit_req zone=<name> [burst=<number>] [nodelay | delay=<number>]

设置共享内存区域,以及请求的最大突发大小。如果请求速率超过为区域配置的速率,那么延迟处理它们,以便以定义的速率处理请求。过多的请求将被延迟,直到它们的数量超过最大突发大小,此时将以错误终止请求。默认情况下,最大突发大小等于零。比如,指令:

平均情况下每秒钟最多允许 1 个请求,突发请求不超过 5 个。

当请求正被限制时,如果不希望延迟处理,那么应该使用参数 nodelay

delay 参数指定超过限制的请求被延迟的阈值。默认是 0,即所有超限请求都被延迟。

可以有多个 limit_req 指令。比如,以下配置将限制来自于单个 IP 地址的请求处理速率,同时按虚拟主机限制请求处理速率:

当且仅当当前层级中未定义 limit_req 指令时,从前面的配置层级继承这些指令。

5.2.2. limit_req_zone <key> zone=<name>:<size> rate=<rate> [sync]

为共享内存区域设置参数,它将为多个键保存状态。特别是存储超限请求的当前数量的状态。key 可以包含文本、变量,及其组合。不计算具有空键值的请求。

使用示例:

在这里,状态被保存在 10M 的区域 “one” 中,该区域的平均请求处理速率不能超过每秒 1 个请求。

客户端 IP 地址用作键。注意,这里使用 $binary_remote_addr 代替 $remote_addr$binary_remote_addr 变量的大小对于 IPv4 地址始终是 4 字节,对于 IPv6 地址是 16 字节。存储的状态在 32 位平台上始终占用 64 字节,在 64 位平台上占用 128 字节。1M 的区域可以存储大约 1.6 万 64 字节状态,或大约 8 千 128 字节状态。

如果区域存储被耗尽,那么将删除最近最少使用的状态。在无法创建新状态后,将以错误终止请求。

用每秒请求数(r/s)指定速率。如果希望使用每秒少于 1 个请求的速率,那么用每分钟请求数(r/m)指定速率。比如,每秒半个请求上 30r/m。

5.3. 内嵌变量

5.3.1. $limit_req_status

保存限制请求处理速率的结果:PASSED、DELAYED、REJECTED、DELAYED_DRY_RUN 或 REJECTED_DRY_RUN。


6. ngx_http_core_module 模块

6.1. 指令

6.1.1. limit_rate <rate>

限制向客户端传输响应的速率。用每秒字节数指定 rate。0 值禁用速率限制。针对每个请求设置该限制,因此如果客户端并发地打开两个连接,那么总速率将为指定的限制的两倍。

参数值可以包含变量。在根据特定条件限制速率的场景下,这可能很有用:

也可以在 $limit_rate 变量中设置速率限制。但不建议使用该方法:

也可以在代理服务响应的 “X-Accel-Limit-Rate” 头字段中设置速率限制。可以使用 proxy_ignore_headersfastcgi_ignore_headersuwsgi_ignore_headersscgi_ignore_headers 指令禁用该功能。

6.1.2. limit_rate_after <size>

设置初始数量,之后向客户端继续传输响应将被限速速率。参数值可以包含变量。

示例:


7. 示例

7.1. 示例 1

目标:

如果客户端 IP 不地址在白名单中,那么按照客户端 IP 所在的网段限制连接数,以及每个连接的请求速率。

示例配置: