Netty——连接超时与断开重连

原创已于 2025-04-04 22:09:15 修改 · 1.3k 阅读

18 ·

CC 4.0 BY-SA版权

文章标签：

#netty #java

于 2025-04-04 22:07:49 首次发布

Java 面试同时被 2 个专栏收录

23 篇文章

订阅专栏

Netty

12 篇文章

订阅专栏

文章目录

1. 处理连接超时和断开重连的原因
2. 处理连接超时和断开重连的方法
3. 代码
4. 总结

1. 处理连接超时和断开重连的原因

在网络编程中，处理 连接超时 和 断开重连 是非常必要的，主要有以下几点原因：

应对网络不稳定的情景：网络中存在拥塞、信号干扰等问题，会导致连接超时或断开。若不处理，程序可能等待或中断，浪费资源、影响业务。
保证系统可用性：服务器负载过高或故障恢复时，可能无法及时响应连接请求或使连接断开。处理这些情况能 提高连接成功率，让系统尽快恢复运行。
提升用户体验：可避免用户长时间等待，保证业务连续性，避免因连接问题影响实时应用，增强用户对应用的好感。

2. 处理连接超时和断开重连的方法

2.1 处理连接超时

处理连接超时共有以下两步：

2.1.1 步骤一：配置连接超时时间

在客户端 Bootstrap 中配置连接超时参数，若超时则触发异常。

// 5s 连接超时
option(ChannelOption.CONNECT_TIMEOUT_MILLIS, 5000)

2.1.2 步骤二：监听连接结果

给连接操作添加监听器，这个监听器负责 处理连接失败并触发重连。

bootstrap.connect(/* host */, /* port */)
	.addListener((ChannelFutureListener) f -> {
	    if (!f.isSuccess()) {
	        System.out.println("连接失败，尝试重连...");
	        // 触发重连逻辑，之后的代码会展示
	    }
	});

注：重连只是处理连接超时的一种手段，还可以通过提示用户“网络卡顿，无法连接到服务器”的方式来处理连接超时。

2.2 处理断开重连

处理断开重连也有关键的两步：

2.2.1 步骤一：监听连接断开事件

在 ChannelHandler 中监听 channelInactive 事件，触发重连。

@Override
public void channelInactive(ChannelHandlerContext ctx) {
	System.out.println("连接断开，启动重连");
	// 触发重连逻辑，之后的代码会展示
    ctx.fireChannelInactive();
}

2.2.2 步骤二：实现重连逻辑

使用 指数退避策略 调度重连，避免频繁尝试。

/**
 * 执行重连操作
 */
public static void reconnect() {
	// retries 表示当前重连次数，是一个私有成员字段，MAX_RETRIES 表示最大重连次数，是一个私有静态常量
    if (retries >= MAX_RETRIES) {
        System.out.println("重连次数已达上限，放弃连接");
        return;
    }

    // 下一次重试前需要等待的最大时间为 2 的 retries 次方 和 30 中的较小值
    int maxRetryDelay = Math.min(30, 1 << retries++);
    // 下一次重试前需要等待的时间为 [1, 最大等待时间) 区间中的一个随机值
    int retryDelay = maxRetryDelay == 1 ? 1 : ThreadLocalRandom.current().nextInt(1, maxRetryDelay);
    System.out.println("第" + retries + "次重试，等待" + retryDelay + "秒");
    Bootstrap bootstrap = TimeoutClient.getBootstrap();
    bootstrap.config().group().schedule(() -> {
        bootstrap.connect(TimeoutClient.HOST, TimeoutClient.PORT)
                .addListener(TIMEOUT_RECONNECT_LISTENER);
    }, retryDelay, TimeUnit.SECONDS);
}

指数退避策略

1. 指数退避策略的概念

指数退避策略 (Exponential Backoff) 是一种在重试机制中常用的算法，用于 处理因资源竞争、网络故障等原因导致的操作失败。其核心思想是 在每次操作失败后，等待一段随机的时间再进行下一次尝试，并且这个等待时间会随着失败次数的增加而呈指数级增长。

一般而言，指数退避策略的等待时间计算公式可以表示为： $\times 2^n \times random$ 。其中：

$T$ 是 下一次重试前需要等待的时间。
$ba se$ 是 初始的基本等待时间。
$n$ 是 当前重连的次数。
$r an d o m$ 是 一个介于 0 到 1 之间的随机数，引入随机数是为了 避免多个客户端在同一时刻重试，从而减少冲突的可能性。

2. 使用指数退避策略的原因

减少资源竞争：在生产环境中，多个客户端可能会同时尝试访问同一个资源。如果没有退避策略，这些客户端会在失败后立刻再次尝试，这会导致资源竞争加剧，使得更多的请求失败。而指数退避策略通过让客户端在失败后等待不同的时间再重试，分散了重试的时间点，降低了资源竞争的概率，提高了资源的利用率。类似于 Redis 缓存雪崩 问题的 随机过期时间 解决方案。
应对临时故障：许多操作失败可能是由于临时的网络波动、服务器过载等原因引起的，这些问题通常会在短时间内自行解决。指数退避策略让客户端在每次失败后等待更长的时间再重试，给系统留出更多的时间来恢复正常，从而提高了重试成功的概率。
节省系统资源：频繁的重试操作会消耗客户端和服务器的系统资源。使用指数退避策略可以 减少不必要的重试次数，降低系统资源的消耗，提高系统的性能和效率。

2.2.3 可选步骤：使用心跳监测机制

客户端与服务器之间，可以使用心跳监测机制，从而判断它们之间建立的连接是否存活。如果存活，则无需任何操作；否则不存活，需要断开连接，并进行重连操作。使用心跳监测机制的方法可以参考 Netty——心跳监测机制。

3. 代码

3.1 客户端 TimeoutClient

/**
 * 有超时重连机制的客户端
 */
public class TimeoutClient {

    public static final String HOST = "127.0.0.1";
    public static final int PORT = 8888;

    private static Bootstrap bootstrap;

    public static Bootstrap getBootstrap() {
        return bootstrap;
    }

    public static void main(String[] args) {
        final EventLoopGroup group = new NioEventLoopGroup();

        bootstrap = new Bootstrap()
                .group(group)
                .channel(NioSocketChannel.class)
                // 5s 连接超时
                .option(ChannelOption.CONNECT_TIMEOUT_MILLIS, 5000)
                .handler(new ChannelInitializer<SocketChannel>() {
                    @Override
                    protected void initChannel(SocketChannel ch) throws Exception {
                        ch.pipeline()
                                .addLast(new MsgDecoder())
                                .addLast(new MsgEncoder())
                                .addLast(new TimeoutHandler());
                    }
                });

        Runtime.getRuntime().addShutdownHook(new Thread(group::shutdownGracefully));

        bootstrap.connect(HOST, PORT).addListener(TimeoutHandler.TIMEOUT_RECONNECT_LISTENER);
    }
}

3.2 客户端的重连处理器 TimeoutHandler

/**
 * 客户端的重连处理器
 */
public class TimeoutHandler extends ChannelInboundHandlerAdapter {

    /**
     * 最大重连次数
     */
    private static final int MAX_RETRIES = 5;

    /**
     * 当前重连次数
     */
    private static int retries = 0;

    /**
     * 连接超时后进行重连的事件监听器
     */
    public static final ChannelFutureListener TIMEOUT_RECONNECT_LISTENER = f -> {
        if (!f.isSuccess()) {
            System.out.println("连接失败，尝试重连...");
            reconnect();
        }
    };

    /**
     * 执行重连操作
     */
    public static void reconnect() {
        if (retries >= MAX_RETRIES) {
            System.out.println("重连次数已达上限，放弃连接");
            return;
        }

        // 下一次重试前需要等待的最大时间为 2 的 retries 次方 和 30 中的较小值
        int maxRetryDelay = Math.min(30, 1 << retries++);
        // 下一次重试前需要等待的时间为 [1, 最大等待时间) 区间中的一个随机值
        int retryDelay = maxRetryDelay == 1 ? 1 : ThreadLocalRandom.current().nextInt(1, maxRetryDelay);
        System.out.println("第" + retries + "次重试，等待" + retryDelay + "秒");
        Bootstrap bootstrap = TimeoutClient.getBootstrap();
        bootstrap.config().group().schedule(() -> {
            bootstrap.connect(TimeoutClient.HOST, TimeoutClient.PORT)
                    .addListener(TIMEOUT_RECONNECT_LISTENER);
        }, retryDelay, TimeUnit.SECONDS);
    }

    @Override
    public void channelInactive(ChannelHandlerContext ctx) throws Exception {
        System.out.println("连接断开，启动重连");
        reconnect();
        ctx.fireChannelInactive();
    }
}

3.3 服务器

服务器代码可以参考 Netty——心跳监测机制中实现的 HeartbeatServer。

3.4 测试方法

测试断开重连的处理：启动服务器和客户端。对于以上实现的客户端，在与该服务器建立连接后不会主动发送数据，如果超过 3s，该服务器会判定客户端宕机，断开连接，然后就会在客户端中触发 channelInactive 事件，从而触发断开重连机制。
测试连接超时的处理：不要启动服务器，只启动客户端，就可以看到客户端重试连接最多 5 次。在这 5 次之内，如果启动服务器，则可以正常建立连接。