这篇文章将为大家详细讲解有关Go语言中怎么开启TCPkeepalive,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。
TCP-keepalive — 一个轻量级的 ping
TCP keepalive发送没有(或者几乎没有)包体负载的 TCP 报文给对端,并且对端会回复 keepaliveACK确认包。它不是 TCP 标准的一部分(尽管在RFC1122
在它的大部分实现中,简单来说,有三个主要参数:
Idle time(空闲时间) - 接收一个包后,等待多长时间发出一个 ping 包。Retry interval(重试间隔时间) - 如果发送了一个 ping,但是没有收到对端回复的ACK,在重试间隔时间之后重新发送 ping。Ping amount(重试次数) - 重试次数(没有收到对端ACK)达到多少次后,我们认为这个连接不存活了。
举个例子,空闲时间是 30 秒,重试间隔时间是 5 秒,重试次数为 3。以下是它的工作方式:
服务端收到客户端的一包应用层数据。然后客户端不再发送任何数据。服务端等待 30 秒。然后发送一个 ping 给客户端。如果服务端收到了ACK,则服务端等待另一个 30 秒,再次发送 ping;如果在这 30 秒内服务端收到了数据,则 30 秒的定时器被重置。
如果服务端没有收到ACK,等待 5 秒后再次发送 ping。如果再过 5 秒还是没有收到回复?发送最后一个 ping 并等待最后一个 5 秒(是的,在最后一个 ping 也需要等待重试间隔时间)。然后我们认为这个连接超时了并且在服务端断开它。
默认值
据说 Window 系统在发送 keepalive ping 之前默认等待 2 小时。Linux 下获取默认值十分简单,就像此处 3.1.1 节
# Idle timecat /proc/sys/net/ipv4/tcp_keepalive_time# Retry intervalcat /proc/sys/net/ipv4/tcp_keepalive_intvl# Ping amountcat /proc/sys/net/ipv4/tcp_keepalive_probes
在 Go 语言中如何设置?
由于我最近使用 Go 语言比较多,我需要在 Go 语言中运用 TCP keepalive。
讨论开始之前需要说明,以下内容适用于 Linux。我不是百分百确定它是否适用于 OSX,但我几乎可以肯定它不适用于 Windows。
连接的特殊类型
首先,我注意到我在服务端程序中只使用了net.Conn
这意味着,我们需要使用ListenTCP
Go 语言提供的方法
如果你翻看文档可能会注意到这两个相关的方法:SetKeepAlive
但是接下来的func (c *TCPConn) SetKeepAlivePeriod(d time.Duration) error就有些令人困惑了。我们用它究竟设置的是什么?答案可以在这篇文章和重试间隔时间。而重试间隔次数则使用系统的默认值。所以如果我设置5 * time.Second。那么它可能是等待 5 秒钟,发送 ping 并等待另一个 5 秒。并且 8 次重试(取决于系统设置)。而我需要更大的灵活性,设置得更精准。
进入系统层面
可以通过直接操作 socket 参数来实现。我没有关注里面太多的细节,这纯粹是我的个人解释。以下是我们如何设置空闲时间为 30 秒(我们可以通过SetKeepAlivePeriod设置,因为其他参数我们再另外设置),重试时间间隔设置为 5 秒,重试次数设置为 3。我偷了(啊呸,是参考了)上面所引用的文章中的一些代码,多谢。
conn.SetKeepAlive(true)conn.SetKeepAlivePeriod(time.Second * 30) // Getting the file handle of the socket sockFile, sockErr := conn.File() if sockErr == nil { // got socket file handle. Getting descriptor. fd := int(sockFile.Fd()) // Ping amount err := syscall.SetsockoptInt(fd, syscall.IPPROTO_TCP, syscall.TCP_KEEPCNT, 3) if err != nil { Warning("on setting keepalive probe count", err.Error()) } // Retry interval err = syscall.SetsockoptInt(fd, syscall.IPPROTO_TCP, syscall.TCP_KEEPINTVL, 5) if err != nil { Warning("on setting keepalive retry interval", err.Error()) } // don't forget to close the file. No worries, it will *not* cause the connection to close. sockFile.Close()} else { Warning("on setting socket keepalive", sockErr.Error())}
在这段代码之后的某一行我会写上dataLength, err := conn.Read(readBuf),这行代码会阻塞直到收到数据或者发生错误。如果是 keepalive 引起的错误,err.Error()将会包含连接超时信息。
关于文件描述符的坑
上面的代码只有在你不频繁调用的前提下才运行良好。在写完这篇文章之后,我以困难模式学习到了一个关于它的小问题。。。
问题就隐藏在Fd
func (f *File) Fd() uintptr { if f == nil { return ^(uintptr(0)) } // If we put the file descriptor into nonblocking mode, // then set it to blocking mode before we return it, // because historically we have always returned a descriptor // opened in blocking mode. The File will continue to work, // but any blocking operation will tie up a thread. if f.nonblock { f.pfd.SetBlocking() } return uintptr(f.pfd.Sysfd)}
如果文件描述符处于非阻塞模式,会将它修改为阻塞模式。根据stackoverflow 的这个回答的所属系统线程从调度池中移出。如果调度池中的系统线程数小于GOMAXPROCS,则会创建新的系统线程。鉴于我的每一个连接都使用一个独立协程,你可以想象一下这个爆炸速度。将很快到达 10000 线程的限制然后 panic。
将它放入独立协程并不好使。
但是有一个方法是可行的。注意,前提是 Go 版本高于 1.11。看以下代码。
//Sets additional keepalive parameters. //Uses new interfaces introduced in Go1.11, which let us get connection's file descriptor, //without blocking, and therefore without uncontrolled spawning of threads (not goroutines, actual threads). func setKeepaliveParameters(conn devconn) { rawConn, err := conn.SyscallConn() if err != nil { Warning("on getting raw connection object for keepalive parameter setting", err.Error()) } rawConn.Control( func(fdPtr uintptr) { // got socket file descriptor. Setting parameters. fd := int(fdPtr) //Number of probes. err := syscall.SetsockoptInt(fd, syscall.IPPROTO_TCP, syscall.TCP_KEEPCNT, 3) if err != nil { Warning("on setting keepalive probe count", err.Error()) } //Wait time after an unsuccessful probe. err = syscall.SetsockoptInt(fd, syscall.IPPROTO_TCP, syscall.TCP_KEEPINTVL, 3) if err != nil { Warning("on setting keepalive retry interval", err.Error()) } })} func deviceProcessor(conn devconn) { //............ conn.SetKeepAlive(true) conn.SetKeepAlivePeriod(time.Second * 30) setKeepaliveParameters(conn) //............ dataLen, err := conn.Read(readBuf) //............ }
最新版本的 Go 提供了一些新接口,net.TCPConn实现了SyscallConn
关于Go语言中怎么开启TCPkeepalive就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。