小编给大家分享一下怎么解决TCP socket的阻塞问题,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!
解决TCP socket的阻塞问题
大家知道,tcp的读和写是阻塞的,即读的时候不知道什么时候读完,写的时候不知道什么时候写完,因此线程就一直暂停在哪里,一般tcp程序用在上位机下位机之间对吧!
下位机一些设备一般会发心跳报文给我们机器,假设为10s发一次吧,当机器超过10s没接收到数据,那么我们就要考虑把socket断开,因为不断开的话设备重新连接可能又会建立新的socket,这样如果设备反复断开连接的话,将产生大量的socket,占用大量系统资源,这里我们用socket.setSoTimeout(500)方法解决read方法的阻塞问题,同时设定一个标志位
在异常处理程序当中退出socket连接
public void run(){ InputStream is = null; OutputStream os = null; int flag = 0; try { socket.setSoTimeout(500); // 0.5秒就退出read()方法的阻塞 is = socket.getInputStream(); os = socket.getOutputStream(); } catch (Exception e2) { e2.printStackTrace(); } while (true) { try { // 读取数据 int readlen = is.read(buff); if (readlen > 0) { flag = 0; } byte data[] = Arrays.copyOfRange(buff, 0, readlen); resolveData(data); } catch (IOException e) { try { flag++; if (flag == 200) { is.close(); os.close(); socket.close(); } } catch (Exception e1) { e1.printStackTrace(); } } } }
TCP连接阻塞的监控和处理
那么,什么样的TCP连接属于上述发生阻塞的异常连接呢?结合线上运维经验
我们整理出符合该类异常的特征如下
该连接的Recv_Q的值特别大(超过3M)
该连接的Recv_Q的值持续上涨,造成堆积(在一定滑动时间窗口内)
服务端进程已长时间不再处理该连接的请求(超过90秒)
其中Recv_Q的值可以通过netstat或ss系统工具即可进行Recv_Q队列大小的采样,从而进行阀值判断。
netstat 的结果是读取/proc/net/tcp文件而来的.
如何查看一个连接的创建时间
nestat -apn | grep xxx查看到对应的连接的进程pid和端口
将上下游端口,转换为16进制xxxa xxxb
然后cat /proc/net/tcp | grep -i xxxa | grep -i xxxb找到该socket连接的inode inodex
ls -al /proc/pid/fd | grep inodex即可看见该socket文件的创建时间.
以上是“怎么解决TCP socket的阻塞问题”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注编程网行业资讯频道!