概述
我们在网络编程时,通常是让我们本地的应用程序和远程的应用程序进行通信,也就是分布式的进程之间的通信,比如我写的程序A和小明的程序B进行通信,我的程序运行时在本机就是一个进程,是有pid号的,小明的也是。那这两个程序是怎么通信的呢?
这就要理解网络分层的概念了,网络层实现的是主机到主机之间的通信,网络层的实现是ip协议,通过各自的ip地址就能实现远程数据传输,而网络层只是保证了主机A的数据能够到达主机B,并不能够识别和发送到对应的进程,而传输层实现的是进程到进程的通信,对网络层的功能进行了加强,能够把数据交付给对应的进程。
有了传输层的功能,我们用户才能进一步的去实现自己的应用层协议,实现应用。当我们需要远程通信时只需要通过下层的传输层传输数据即可。
但是想象一下,每次我在应用层发送数据时至少都是需要把 要发送的信息、本机ip、本地端口、目的ip和目的端口这五个数据通过层间接口交给传输层(对于TCP协议来说的,UDP无连接不需要应答所以不需要本机ip和端口),如下图
但是每一次应用层向传输层发送数据时都需要发送这些数据是不是很多余?TCP一旦双方建立起连接了,那么除了数据部分,其他的都是相同的,没有必要每次发送数据都发送一遍,为了减少层间接口的传输量,就出现了socket,操作系统底层维护一个列表,用于存放多个socket,即多个会话关系。
socket套接字是传输层提供给应用层的一个API,底层实现就是一个整数,是传输层和应用层的一个约定,该整数就像是打开一个文件并得到文件句柄一样,对这个句柄进行的操作就是对该文件进行操作,方便管理。
有了socket之后应用层数据的传输就变为了这样
传输层概述
先来说说网络层的ip,ip协议在网络上发送数据包是不可靠的,有可能造成丢失,乱序等问题,如发送数据包到对应的路由器,路由器有接收缓冲区,如果发现同一时刻来的数据包太多了,缓冲区放不下,它是可以把装不下的数据包扔掉的。这就是不可靠的传输。
传输层提供了TCP和UDP两种服务:
- TCP:对ip协议进行了增强,通过一些方式来达到可靠的数据传输
- UDP:不可靠的数据传输,它只对ip增加了进程到进程之间的通信,其他的就没了,原原本本
TCP套接字编程
TCP socket反应的是应用进程A和应用进程B会话关系的一个代表,A对对应的socket发送数据,就是A对B发送数据;A对对应的socket接收数据就是对B接收数据。
大致过程
1.服务器进程必须运行,创建一个欢迎socket,该socket和本地的端口进行捆绑,在欢迎socket上阻塞式的等待接收客户端的连接
2.客户端创建本地的套接字,隐式捆绑到本地的端口,再指定服务器的ip和端口进行连接。
3.服务器接受来自用户端的请求 ,解除阻塞式等待,返回一个 新的socket(与欢迎socket不 一样),与客户端通信
4.连接API调用有效时,客户端与服务器建立了TCP连接,即可以通信了
代码如下:
@Test
public void server() throws IOException {
//1.建立欢迎socket,绑定一个监听的端口号
ServerSocket welcomeSocket = new ServerSocket(8080);
//2.阻塞的等待客户端的连接请求,连接请求到来时创建一个新的socket,与客户端绑定
Socket socket = welcomeSocket.accept();
//6.从该socket接收数据
InputStream is = socket.getInputStream();
int len = 0;
while ((len = is.read()) != -1) {
System.out.print((char) len);
}
socket.close();
}
@Test
public void client() throws IOException {
//3.建立一个客户端这边的socket
Socket socket = new Socket();
//4.阻塞的请求连接到指定ip和端口号的服务器进程
socket.connect(new InetSocketAddress("localhost", 8080));
//5.发送数据到该socket
OutputStream os = socket.getOutputStream();
byte[] bytes = new byte[1024];
os.write("hello".getBytes());
socket.shutdownOutput();
}
详细过程
首先来看java中socket的结构体(类),其他语言都大同小异。
public abstract class SocketImpl implements SocketOptions {
protected InetAddress address;
protected int port;
protected int localport;
}
InetAddress类就不介绍了,里面就是封装了ip地址等信息。
ServerSocket和Socket类是一个东西,只时名字不同而已。具体可以看源码。
可以得出来socket其实大致就是这么一个6元组(这里省略了socket的状态),当我们应用进程创建socket时,操作系统给该socket一个唯一的整数标识,且肯定是要保存是哪个进程创建的socket,所以pid也应该对应起来,方便日后能给找到对应的进程。
我们举例如下图的一个通信过程来具体的说明socket的通信过程:
1.首先服务器进程先建立一个欢迎socket,用于监听连接请求,并且绑定端口号为8080,阻塞监听客户端的连接请求,如下图
2.这时候客户端也新建一个socket(该socket以后会当做和服务器的通信socket),这个socket不用像服务器那样绑定一个固定的端口号用于监听,但是操作系统会给该socket绑定一个随机的端口,这里假设是4567。如下图,此时客户端的1号socket还是一个无效的状态,因为还没有连接
3.客户端用刚刚建立的socket和远程服务器进行连接connect,指明服务器的地址和对应的端口号,此时socket的状态也就补齐了,随后客户端进入阻塞模式,进行TCP的三次握手,请求和服务器建立连接
4.服务器和客户端TCP连接建立好后,解除阻塞,并且返回一个新的socket(因为不能占用welcome socket),新的socket就是服务器和客户端的一个连接状态,该socket变为一个有效状态,此时服务器继续进入阻塞状态等待此socket的数据。
5. 连接建立好后,客户端也解除阻塞,它的socket1也变为有效状态。然后客户端把需要发送的数据和对应的socket1(输出流里面封装了socket)交给下层传输层,此时的传输层得到了它相应的信息,根据socket就可以从表中查到需要发送的目的ip和端口,继续交给下层直到发送到服务器。
6.服务器的tcp层收到数据包后,查看源ip、目的ip、源端口、目的端口,一一对照自己的socket表,发现2号socket真好对应,且得知2号socket是pid为100的应用进程,所以tcp把数据发送给该进程,服务器的java进程解除阻塞,read客户端发送来的数据。
7.最后如果服务器和客户端某一方没有数据发了,不想建立连接了,就调用close方法,进行TCP的四次挥手,解除连接,使两边对应的socket都变得无效。
UDP套接字编程
UDP是没有建立连接这一过程的,也不需要维持会话关系,每个报文都是独立传输的。因此UDP只能使用一个整数来标志当前应用进程,不能够固定住对方的ip和端口号,因为UDP通信前不建立连接,可能现在发的这个ip和端口是一台主机,而下次用同样的ip和端口发的就是另一台主机了。所以每次发送的时候都需要指定发送的目的ip和端口。
UDP的socket大致如下
java中UDPsocket结构如下
public abstract class DatagramSocketImpl implements SocketOptions {
protected int localPort;
}
UDP简单套接字编程如下:
@Test
public void server() throws IOException {
//1.创建udp socket,并绑定到本机ip和8080端口号
DatagramSocket socket = new DatagramSocket(8080);
byte[] buff = new byte[100];
//存放数据包的容器
DatagramPacket packet = new DatagramPacket(buff, 0, buff.length);
//接收数据包
socket.receive(packet);
System.out.println(new String(packet.getData(), 0, packet.getLength()));
socket.close();
}
@Test
public void client() throws IOException {
DatagramSocket socket = new DatagramSocket();
byte[] data = "hello".getBytes();
//指明发送端的ip和端口和数据部分
DatagramPacket packet = new DatagramPacket(data, data.length, InetAddress.getByName("127.1.1.1"), 8080);
//使用该socket发送数据包
socket.send(packet);
}
详细步骤如下:
1.服务器创建一个udp的socket,绑定端口8080用于监听数据包,通过调用receive方法阻塞的监听。
2.客户端创建一个自己的socket,该socket的端口假设操作系统分配的是4567
3.客户端发送数据包、目标ip和目标端口给下层的传输层,传输层就能够得到源ip、源端口、目的ip和目的端口,然后一步一步的打包交给下层,发送到服务器主机,服务器主机通过数据包的目的ip和目的端口,对比发现socket对应,然后把数据发送给对应的pid号为100的应用进程。
4.服务器解除阻塞,收取数据。
5.最后关闭连接,删除对应的socket
注意的是UDP是没有welcome socket的
补充
再补充一个小知识点,那就是端口号和进程的联系
进程pid是否可供计算机之间使用呢?
应用层代表的就是我们的应用进程,既然进程代表着应用层,那为什么进程pid不能作为应用层的标识来进行计算机之间传输呢?而是使用额外的端口号呢?
(1)首先: 单个计算机中的进程使用pid来标志的,但是在互联网环境下使用的计算机操作系统种类很多,而不同的操作系统又使用不同格式的进程标识符,为了使运行不同操作系统的计算机的应用进程能够互相通信,就必须使用统一的方法对TCP/IP体系的进程进行标识;
(2)其次:一个机器上运行的进程不能成为互联网上通信的最后终点,因为进程的创建和撤销都是动态的,通信的一方几乎无法识别对方机器的进程是哪一个;
例如:要和互联网上某个邮件服务器联系,几乎无法得知其服务器邮件进程的进程标识符,因为进程标识符是随机分配的;所以,我们并不一定要知道这个服务器服务是由目的主机那个进程实现的;
所以,不能使用进程标识符来做计算机之间的进程通信标识;
如何使用端口号进行通信?
两个计算机中进程要互相通信,除了必须指定对方的IP地址,还需要知道对方的端口号;
例如:我们寄信的过程说明,当我们要给某人写信时,除了通讯地址还要有收件人的名字,这里的通讯地址就是IP地址,但是收件人的名字却不是进程标识符,因为有可能这个人用的是法文、德文、英文名字,快递员无法识别,因此采用 “菜鸟驿站" 的模式,为每个地址配备多个快递箱(端口号),快递员只是将包裹放置具体的快递箱(端口号),收件人通过监听某个快递箱是否有快递(TCP或者UDP),来进行数据接收,最终拿到需要的包裹(数据);
端口号如何分配?
(1)服务器使用的端口号:
一类为熟知端口号或系统端口号(0~1023),将一些重要的应用程序进行登记,所以将一些端口号固定的分配给它们,以便于让所以的用户的了解,与之建立联系;
另一类为登记端口号(1024~49151),为那些不知名的应用程序使用;
(2)客户机使用的端口号:
也称为短暂端口号,由于这类端口仅仅在客户进程进行时才动态选择,留给客户进程短暂使用,当通信结束后,刚才使用过的客户端口号不复存在,可以继续供其他客户进程使用;
到此这篇关于java实现TCP socket和UDP socket的文章就介绍到这了,更多相关java实现TCP socket和UDP socket内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!