进程与端口的关系

进程和端口的关系

Q:

都说端口号是操作系统进行抽象，用来定位一个进程。
当一台主机上有两张网卡时，每张网卡上绑定了一个IP地址。
那么如果访问不同IP地址的同一端口，比如80，应该不会定位到同一个程序吧。
那么端口号就应该是针对于每一张网卡进行的进程抽象，而不是操作系统对每一个进程的抽象吧?

A:

当计算机接收到报文时，需要将这个报文递交(Deliver)给某个特定的进程。

当有(1.1.1.1，50007)——–165364组合报文到达操作系统时,
1.1.1.1 是IP地址，50007是端口号,165364是进程号
稍后当操作系统TCP/IP协议栈接收到一个IP报文，
通过提取目的IP地址(位于IP头)、目的端口号(位于TCP头)，
这两者的组合恰好为(1.1.1.1，50007)。

操作系统查询一下小本子，立马就得知这是(进程ID= 168324)进程A的，
然后通知该进程A前来将报文取走。

进程B也想如法炮制：Bind (‘1.1.1.1’, 50007)，很遗憾，操作系统拒绝了。
拒绝的消息如下：
“builtins.OSError: [WinError 10048] 通常每个套接字地址(协议/网络地址/端口)只允许使用一次。”
意味着(1.1.1.1， 50007)这个组合能唯一识别一个进程，这两者的组合就是一个主键

通俗地说，在数据库管理系统，主键可以唯一锁定一条记录。

进程B(进程ID= 168323)心有不甘，发现计算机还有其它接口地址2.2.2.2，于是通过Bind (‘2.2.2.2’, 50007)，这次成功了。

操作系统老爷爷又颤颤巍巍掏出小本子记录了下来： (2.2.2.2，50007)——–168323
这样当有(2.2.2.2 ， 50007)组合报文到达时，操作系统可以将其转交给(进程号= 168323)进程B。
问题来了，进程A与进程B是什么关系？
进程A、B可以是代码完全不同的程序，也可以是代码相同的程序，
在自己独立的内存空间运行的不同实列(Instance)。
好比你同时打开多个Word程序，这些Word程序使用相同的代码，但是他们是多个Word实例。

问题又来了，如果进程A的代码真的是那样编码，如果放到其它计算机上执行，会遇到问题，因为其它计算机的IP地址可能≠1.1.1.1。
为了提高代码的健壮性、可移植性，
通常会使用这样的代码： Bind (‘ ’, 50007) 其中‘’表示任何IP地址。
换句话说，不Care计算机的接口IP地址。
这个IP地址可以是127.0.0.1，也可以是1.1.1.1，也可以是192.168.1.1，随便多少都行。
那么这个程序可以放到任何计算机上执行。
在同一台机器上一个进程B也这样执行：Bind (‘ ’, 50007)，可以哇？不可以，因为与进程A冲突！
进程B可以Bind (‘ 1.1.1.1’, 50007)，可以哇？
同样不可以，依然与进程A冲突。因为1.1.1.1是所有IP地址的子集。

进程B心慌了，那怎么可以呢？
操作系统老爷爷不紧不慢地说，只要别再使用端口50007就可以了。

进程B于是执行代码如下： Bind (‘ ’, 50008)，可以哇？恭喜你，当然可以！
通常服务器代码，都使用类似Bind (‘ ’, 50007) 方式执行，
所以50007这个端口号可以唯一识别一个进程，这就是端口号可以唯一识别进程号的由来！