3
.
Socket
地址结构
网络中以主机
IP
、端口以及使用的协议表明一个网络应用。
UNIX Socket
将它们组成一个结构,统称为
SOCKET
地址结构。
3.1 IPv4
对应的
SOCKET
地址结构
通常也称为“网际
SOCKET
地址结构”,以“
socketaddr_in
”命名,定义在头文件
<netinet/in.h>
中。
所涉及到的数据类型:
3.2 IPv6
对应的
SOCKET
地址结构
3.3
通用地址结构
当地址结构作为传递给任何一个
SOCKET
函数的参数时,任意一个
Socket
函数必须能处理每一种地址结构,为了解决这个问题,提出了使用通用套接口地址结构。当任何一个地址结构要作为指针参数传到套接口函数时,必须要显示转化为通用地址结构。
在
IPv4
应用中,使用的通用地址结构为
struct sockaddr,
定义在
<sys/socket.h>
中,
例如:
在
IPv6
中,提出了一种新的通用地址结构:
struct sockaddr_storage
定义在<netinet/in.h>中。
struct sockaddr
和
struct sockaddr_storage
的区别
<!--[if !supportLists]-->a.<!--[endif]-->struct sockaddr_storage能提供严格的结构对齐
<!--[if !supportLists]-->b. <!--[endif]-->struct sockaddr_storage能容纳系统支持的更大的地址结构
3.4 Socket
地址结构的比较
4
.
Client/Server Model
Client/Server
的网络通信模型是使用最广最为基础的通信模型。在
Socket API
环境,其应用可以归纳为:
TCP
链接建立
根据
TCP/IP
协议,函数
connect()
激发
TCP
的三路握手过程。
客户端给服务器一个
SYN(J)
信号,服务器返回一个
ACK(J+1);
然后服务器给客户端一个
SYN(K),
客户端也同样给服务器一个
ACK(K+1)
,这样就算
connect
成功。
注意:服务器返回的
SYN(K)
和
ACK(J+1)
是放在同一个分节中发给客户端的,因此链路在建立连接时只用了三个分节,故称为三路握手。
TCP
链接终止
TCP
用三个分节建立一个链接,而终止连接时需要四个分节。原因在于被动关闭链接一方需要关闭处理时间,因此
ACK
和
FIN
不能同时发给主动关闭一方。
主动关闭一方在收到
ACK
后,在等待被动关闭方发
FIN
消息这一状态称为处于
TIME_WAIT
状态。
5 Socket API
描述
5.1
创建套接字——
socket
函数
应用程序在使用套接字前,必须拥有一个套接字,系统调用
socket
()向应用程序提供
创建套接字的手段,其调用格式如下:
参数
family
指定通信发生的区域,
UNIX
系统支持的地址族有:
AF_UNIX,AF_INET,AF_NS
等,而
DOS
、
WINDOWS
中仅支持
AF_INET
,它是网际网区域。因此,地址族与协议族相同。
参数
type
描述要建立的套接字的类型。参数
protocol
说明该套接字使用的特定协议,如果调用者不希望特别指定使用的协议,则置为
0
,使用默认的连接模式。根据这
3
个参数建立一个套接字,并将相应的资源分配给它,同时返回一个整型套接字号。因此,
socket
()系统调用实际上指定了
"
协议
"
。
5.2
指定本地址——
bind
函数
一个套接字用
socket
()创建后,存在一个名字空间(地址族),但它没有被命名。
Bind
()将套接字地址(包括本地主机地址和本断口地址)与所创建的套接字号联系起来,即将,名字赋予套接字,以指定本地半相关。其调用格式如下:
参数
socketfd
是由
socket()
调用返回的并且未作连接的套接字描述符(套接字号)。参数
myaddr
是赋给套接字
socketfd
的本地地址(名字),其长度可变,结构随通信域的不同而不同。
addrlen
表明了
name
的长度。
进程可以把一个特定的
IP
地址捆绑到它的套接口上,但此
IP
地址必须是主机的一个接口。对于
TCP
客户端,这就为在此套接口上发送的
IP
数据包分配了源
IP
地址。对于服务器端,这样做就限制了套接口只接收来自那些目的地址为此
IP
地址的客户链接。
对于
TCP
,调用函数
bind
可以指定一个端口号,指定一个
IP
地址,可以两者都指定,也可以一个都不指定。对于服务器,一般指定众所周知的端口号。而不指定具体的
IP
地址。如果
TCP
服务器不把地址绑到套接口上,那么内核就把客户所发
SYN
所在分组的目的
IP
地址作为服务器的源
IP
地址。
若指定端口号为
0
,则调用函数
bind
时,内核选择一个临时端口;但若指定一个通配
IP
地址,则直到套接口以连接
(TCP)
或数据报已在套接口上发出
(UDP),
内核才选择一个本地
IP
。
注意到在第四部分图中,客户端并没有调用
bind
函数,因为对于客户端来说,没有必要指定具体的
IP
和端口,如果需要,内核会选择一个源
IP
地址和一个临时的端口。
5.3 connect
函数
TCP
客户用
connect()
函数建立一个与
TCP
服务器的链接。
Connect
()的调用格式如下:
参数
socket
是欲建立连接的本地套接字描述符。参数
servaddr
指出说明对方套接字地址结构指针。对方套接字地址长度由
addrlen
说明。
根据
TCP
的状态转移图,函数
connect
导致从
CLOSED
状态
(
调用函数
socket
创建套接口以后就一直处于此状态
)
转到
SYN_SENT
状态,若成功转到
ESTABLISHED
状态。如果函数
connect
失败,则原先创建的套接口就不可再用,必须关闭。如要重新尝试,必须重新调用
socket
,再
connect
。
5.4 listen
函数
函数
listen
仅被
TCP
服务器调用,它做两件事情:
<!--[if !supportLists]-->1. <!--[endif]-->当函数socket创建一个套接口时,它被假设为一个主动套接口,也就是说,它是一个将调用connect发起链接的客户套接口。函数listen将未链接的套接口转换成被动套接口,告诉内核应接受指向此套接口的链接请求。根据TCP状态转移图,函数listen导致套接口状态从CLOSED转到LISTEN。
<!--[if !supportLists]-->2. <!--[endif]-->函数的第二个参数规定了内核为此套接口排队的最大链接个数。
一般而言,此函数应该在
socket
和
bind
之后,调用函数
accept
之前调用。
参数
backlog
的解析:
对于给定的监听套接口
(listen
之后
)
,内核要维护两个队列:一个是处于三次握手过程中(即客户端调用
connect
,服务器端收到
SYN
,并返回
ACK
和
SYN
后,在等待客户端的
ACK
),处于
SYN_RCVD
状态;另一个是从
connect
成功,处于
ESTABLISHED
状态。
两个队列之和不能超过
backlog
。
5.5 accept
函数
Accept
函数由
TCP
服务器调用,从已完成连接队列头返回一个已完成的链接。若已完成队列为空,则进程睡眠(假定套接口为缺省的阻塞方式)。用于使服务器等待来自某客户进程的实际连接。
参数
cliaddr
和
addrlen
用来返回链接对方进程(客户端)的协议地址。
若函数成功返回,返回值是一个由内核自动生成的全新的描述字,代表与客户端的链接。当我们讨论函数
accept
时,常把它的第一个参数称为监听套接口描述字(由
socket
生成的描述字);把它的返回值称为已连接套接口描述字。
6 Reference
补上参考书目及一些好文章
1. Windows Sockets 网络程序设计大全
适合于WinSock编程入门。
2. Unix Networking Programming 3rd ed 很经典的书呀,如果你学习Unix Socket编程,你必须买的,学习WinSock也有作用的,因为WinSock是参考的Unix Socket。
3. Windows网络编程技术
讲了Win2000下的WinSock编程,讲了TCP/IP, Netbios, IPX/SPX, ATM等在Windows下的编程,有很多代码,还有一个MS Platform SDK的东西,这可是很难得的。对了,还有QoS和Raw Socket编程的程序例子
。