1 套接字是一种具有通讯端点概念的计算机网络数据结构,网络化的应用程序在开始任何通讯之前都必须要建立套接字。
套接字起源于20世纪70年代,有时人们把套接字成为“伯克利套接字”或“BSD套接字”,期初,套接字被设计用在同一台主机上多个应用程序之间通讯,也被成为进程之间通讯。
套接字有两种,分别是基于文件型的和基于网络型的
Unix 套接字是第一个套接字家族,其“家族名”为AF_UNIX(在POSIX1.g标准中也叫AF_LOCAL),表示“地址家族:Unix”,包括python在内的大多数流行平台上都是用术语“地址家族”及其缩写“AF”而老一点的系统中,地址家族被称为“域”或“协议家族”,并使用缩写“PF”而不是“AF”
由于两个进程都运行在同一台机器上,而且这些套接字是基于文件的。所以,它们的底层结构是由文件系统来支持的。这样做相当有道理,因为,同一台×××上,文件系统的确是不同的进程都能访问的。
另一种套接字是基于网络的,它有自己的家族名字: AF_INET,或叫“地址家族: Internet”。
还有一种地址家族 AF_INET6 被用于网际协议第 6 版(IPv6)寻址上。还有一些其它的地址家族,不过,它们要么是只用在某个平台上,要么就是已经被废弃,或是很少被使用,或是根本就还没有实现。所有地址家族中,AF_INET 是使用最广泛的一个。Python 2.5 中加入了一种 Linux 套接字的支持:AF_NETLINK(无连接[见下])套接字家族让用户代码与内核代码之间的 IPC 可以使用标准 BSD 套接字接口。而且,相对之前那些往操作系统中加入新的系统调用,proc 文件系统支持或是“IOCTL”等笨重的方案来说,这种方法显得更为优美,更为安全
python只支持AF_UNIX AF_NETLINK和AF_INET 家族
2 套接字地址:主机与端口
一个Internet 地址由网络通讯所必须的主机和端口组成,合法的端口号是0到65535,小于1024的端口号为系统保留端口
面向连接与无连接
面向连接:提供了顺序的,可靠的,不会重复的数据传输,而且不会被加上数据边界(TCP)
实现这种连接的主要协议就是传输控制协议(TCP),要创建TCP套接字就得在创建的时候,指定套接字类型为SOCK_STREAM,TCP 套接字采用SOCK_STREAM这个名字,表达了它作为流套接字的特点,由于这些套接字使用Internet协议(IP)来查找网络中的主机,这样形成的整个系统,一般会由两个协议(TCP和IP)来提及,即TCP/IP
无连接:
与虚链路相反的数据报型的无连接套接字,这意味着,无需建立连接就可以进行通讯,但数据到达的顺序,可靠性,及数据不重复性就无法保证了,数据报会保留数据边界,这就表示,数据不会像面向连接的协议那样被拆分成小块
实现这种连接的主要协议就是用户数据报协议(即 UDP)。要创建 UDP 套接字就得在创建的时候,指定套接字类型为 SOCK_DGRAM。SOCK_DGRAM 这个名字,也许你已经猜到了,来自于单词“datagram”(“数据报”)。由于这些套接字使用 Internet 协议来查找网络中的主机,这样形成的整个系统,一般会由这两个协议(UDP 和 IP)来提及,即 UDP/IP。
socket()函数
Python 中,我们用 socket()函数来创建套接字,语法格式如下:
socket.socket([family[, type[, proto]]])
参数
family: 套接字家族可以使AF_UNIX或者AF_INET
type: 套接字类型可以根据是面向连接的还是非连接分为SOCK_STREAM或SOCK_DGRAM
protocol: 一般不填默认为0.
socket 对象(内建方法)
函数 | 描述 |
---|---|
服务端套接字 | |
s.bind() | 用于绑定到套接字,在IPV4网络协议中,以元组(host,port)的形式表示 |
s.listen() | 开始监听TCP连接,backlog指定在拒绝连接之前,操作系统可以链接的最大链接数量,默认为1 |
s.appept() | 被动接受TCP客户端链接,等待链接的到来 |
客户端套接字 | |
s.connect() | 主动初始化TCP服务器连接,一般格式为元祖(host,port)的格式,如果出错,返回socket.error错误 |
s.connect_ex() | connect()函数的扩展版本,出错时返回出错码,而不是抛出异常 |
公共用途的套接字函数 | |
s.recv() | 接收TCP数据,数据以字符串形式返回,bufsize指定要接收的最大数据量。flag提供有关消息的其他信息,通常可以忽略。 |
s.send() | 发送TCP数据,将string中的数据发送到连接的套接字。返回值是要发送的字节数量,该数量可能小于string的字节大小。 |
s.sendall() | 完整发送TCP数据,完整发送TCP数据。将string中的数据发送到连接的套接字,但在返回之前会尝试发送所有数据。成功返回None,失败则抛出异常。 |
s.recvfrom() | 接收UDP数据,与recv()类似,但返回值是(data,address)。其中data是包含接收数据的字符串,address是发送数据的套接字地址。 |
s.sendto() | 发送UDP数据,将数据发送到套接字,address是形式为(ipaddr,port)的元组,指定远程地址。返回值是发送的字节数。 |
s.close() | 关闭套接字 |
s.getpeername() | 返回连接套接字的远程地址。返回值通常是元组(ipaddr,port)。 |
s.getsockname() | 返回套接字自己的地址。通常是一个元组(ipaddr,port) |
s.setsockopt(level,optname,value) | 设置给定套接字选项的值。 |
s.getsockopt(level,optname[.buflen]) | 返回套接字选项的值。 |
s.settimeout(timeout) | 设置套接字操作的超时期,timeout是一个浮点数,单位是秒。值为None表示没有超时期。一般,超时期应该在刚创建套接字时设置,因为它们可能用于连接的操作(如connect()) |
s.gettimeout() | 返回当前超时期的值,单位是秒,如果没有设置超时期,则返回None。 |
s.fileno() | 返回套接字的文件描述符。 |
s.setblocking(flag) | 如果flag为0,则将套接字设为非阻塞模式,否则将套接字设为阻塞模式(默认值)。非阻塞模式下,如果调用recv()没有发现任何数据,或send()调用无法立即发送数据,那么将引起socket.error异常。 |
s.makefile() | 创建一个与该套接字相关连的文件 |
注意: 必须先启动服务器端,因为服务器端创造接口和IP地址以供客户端访问