通过浏览器访问一个 PHP 文件时发生了什么?

栏目: PHP · 发布时间: 6年前

内容简介:一个标准的 URL 语法通常都建立在由 9 部分构成的通用格式上,浏览器会从用户输入的 URL 字符串中解析对应的内容:其中比较重要的有:如果上面提到的

一个标准的 URL 语法通常都建立在由 9 部分构成的通用格式上,浏览器会从用户输入的 URL 字符串中解析对应的内容:

<schema>://<user>:<password>@<host>:<port>;<params>?<query>#<frag>
复制代码

其中比较重要的有:

  • schema——协议版本
  • host——主机地址
  • port——端口号
  • path——文件路径
  • query——即 query_string 查询字符串

DNS 域名解析

如果上面提到的 host 部分为 域名 ,则需要通过 DNS 对其进行解析。

查找本地 host 文件

用户可以在本地的 host 文件中指定域名和 IP 地址的对应关系,所以浏览器会先去本地的 host 文件中寻找是否存在对应的 IP 地址,如果存在,则向该地址发送请求。

DNS 解析

  • 查询 本地 域名服务器
  • 本地 域名服务器将查询报文转发到 域名服务器并进行查询
  • 域名服务器根据具体的域名地址,向 本地 域名服务器返回 顶级 域名服务器地址
  • 本地 域名服务器向 顶级 域名服务器发送查询请求
  • 顶级 域名服务器向 本地 域名服务器返回 权限 域名服务器地址
  • 本地 域名服务器向 权限 域名服务器发送查询请求

最终,我们通过 DNS 解析获得了主机的 IP 地址

建立 TCP 连接

三次握手

三次握手的过程是老生常谈了,资料比较多,这里就不具体赘述了,只列出大致过程:

  1. 客户端发送 SYN 报文,请求建立连接
  2. 服务端发送 ACK 报文和 SYN 报文,表示同意客户端的建立连接请求,同时自己也请求建立连接
  3. 客户端发送 ACK 报文,表示请求已收到

使用 APR 协议定位目标地址

在以太网中,一台主机要把数据帧发送到同一局域网上的另一台主机时,设备驱动程序必须知道以太网地址才能发送数据。而我们只知道IP地址,这时就需要采用 ARP 协议将 IP 地址映射为以太网地址。 在发送第一个 SYN 报文时,IP 层会通过 ARP 协议查询出目标主机的 MAC 地址。 (TCP/IP协议——ARP详解)

第一次握手 时发送的第一个 SYN 报文首先会通过 connect() 函数到达 IP 层,之后 IP 层会通过查询路由表获取目标主机的 MAC 地址并将其缓存,然后该 MAC 地址会被通过 send() 函数交给网络接口进行封装,最终将数据发送出去。

PS:引用资料的文章非常详细的解释了不同情况下该过程的工作细节,建议认真阅读一遍。

建立 SSL 隧道

如果请求使用的是 HTTPS 协议,则在建立 TCP 连接后,需要通过 四次握手 在其之上再建立一条加密隧道,即 SSL

四次握手

  1. 客户端:
    • 发送 协议版本号
    • 发送支持的加密方法
    • 生成 随机数 1client random )并传输给服务端
  2. 服务端:
    • 选择并发送要使用的加密方法
    • 发送 数字证书
    • 生成 随机数 2server random )并传输给客户端
  3. 客户端:
    • 验证 数字证书
    • 生成一个 随机数 3premaster secret ),使用 公钥 对其进行加密后传输给客户端
    • 使用 client randomserver randompremaster secret 生成 会话密钥session key
  4. 服务器:
    • 使用 私钥 对加密字符串进行解密,获得 premaster secret
    • 使用 client randomserver randompremaster secret 生成 会话密钥session key

四次握手通过 非对称加密 的方式使客户端和服务端获得并持有相同的 session key ,并通过该 key 值对之后的会话过程进行 对称加密

发送 HTTP(s)请求

浏览器使用前两步获得的信息构造 请求报文 ,并通过第三步建立起来的 TCP 连接向服务端发送 HTTP 请求。 其中, 请求报文 的基本格式为:

<method><request-URL><version>  
<headers>  
<entity-body>
复制代码

这三部分分别为 起始行首部主体 ,通过浏览器请求发起的默认为 GET 请求,所以没有 主体 部分。

下面展示了一个假想的 HTTP 报文,其中第一行为 起始行 ,二三行为 首部

GET /index.html HTTP/1.1
Accept: text/html
Host: www.foo.com
复制代码

服务端代理处理请求

服务端代理即为 nginxapache 等服务器软件,它们会根据配置文件 将请求映射为服务器上具体的文件 ,并根据文件类型对其进行处理返回。

直接返回静态文件(.html)

如果文件是类型为 .html.txt.xml 的静态文件,则只需将其内容作为响应的 entity-body 直接返回给客户端。

解析动态文件(.php)

如果文件类型为 .php.jsp.asp 等动态文件,则需要对其进行解析。这里我们只讲解对 .php 文件的操作,以 nginx 服务器为例。

  • nginx 得知要处理的为 .php 文件
  • nginx 调用自己的 Fast-CGI 模块,构造 Fast-CGI 请求
  • nginx 向 PHP-FPM 发送 Fast-CGI 请求, 此时 nginx 相当于一个反向代理服务器
  • PHP-FPM 的 master 进程 收到请求
  • master 将请求分配给特定的 worker 进程
  • worker 进程使用内嵌的 PHP-CGI 解释器对 PHP 文件进行解析,返回结果并生成对 nginx 的响应
  • nginx 获得来自 PHP-FPM 的响应,即得到静态文件

服务端代理响应请求

nginx 生成响应报文,返回给客户端。响应报文和请求报文只有起始行的语法有所不同:

<version><status><reason-phrase>
<headers>
<entity-body>
复制代码

关闭 TCP 连接

老生常谈喜闻乐见的四次挥手环节,因为相关资料实在是太多了,这里也不具体赘述了,只列出大致过程:

  1. 客户端发送 FIN 报文,表示自己的所有数据已传输完毕
  2. 服务端返回 ACK 报文,表示请求已收到
  3. 服务端发送 FIN 报文,表示自己的所有数据也都已经传输完毕
  4. 服务端返回 ACK 报文,表示请求已收到,并进入 TIME_WAIT 状态

客户端对返回的文件进行解析

浏览器会解析返回的 HTML / CSS / JS 等文件,并最终将页面展现在用户面前。


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

应用密码学:协议、算法与C源程序(原书第2版)

应用密码学:协议、算法与C源程序(原书第2版)

(美)Bruce Schneier / 吴世忠、祝世雄、张文政 等 / 机械工业出版社 / 2014-1 / 79.00

......我所读过的关于密码学最好的书......该书是美国国家安全局最不愿意见到出版的书...... —— 《Wired》 ......不朽的......令人着迷的......计算机程序员必读的密码学上决定性的著作...... —— 《Dr.Dobb's Journal》 ......该领域勿庸置疑的一本权威之作。 —— 《PC Magazine》 ..........一起来看看 《应用密码学:协议、算法与C源程序(原书第2版)》 这本书的介绍吧!

HTML 压缩/解压工具
HTML 压缩/解压工具

在线压缩/解压 HTML 代码

URL 编码/解码
URL 编码/解码

URL 编码/解码

RGB HSV 转换
RGB HSV 转换

RGB HSV 互转工具