内容简介:好久没写博客了,我原先的标题是但想着,这是别人嚼烂很多次的内容,缺乏挑战性,而且,页面操作过程中能优化的地方实在太多了。那就干脆给自己挖个坑吧,好歹也在运维开发部待过一年的时间。
好久没写博客了,我原先的标题是 “从输入url到页面加载完成的XXX”?
但想着,这是别人嚼烂很多次的内容,缺乏挑战性,而且,页面操作过程中能优化的地方实在太多了。
那就干脆给自己挖个坑吧,好歹也在运维开发部待过一年的时间。
本文将尝试从 前后端或运维多个角度 ,来述说整个站点从解析到操作过程中的优化。
1. 流程回顾
1.1 URL的输入到浏览器解析的一系列事件
很多大公司面试喜欢问这样一道面试题,输入URL到看见页面发生了什么?,今天我们来总结一下。 简单来说,共有以下几个过程
1.浏览器中输入网址 ==> 2.域名解析(DNS),找到IP服务器 ==> 3.发起TCP连接,HTTP三次握手,发送请求(Request) ==> 4.服务器响应HTTP(Response) ==> 5.浏览器下载资源 html css js images ==> 6.浏览器解析代码(如果服务器有gzip压缩,浏览器先解压) ==> 7.浏览器渲染呈现给用户 复制代码
1.2 结合操作页面到关闭标签页
我们在页面渲染完成之后执行某些操作:
- 按钮重复点击
- 滚动操作
- 条件查询检索
姑且将以上都归为 ==> 8. 界面操作
还在 步骤3:发起TCP连接 前插入:
- 浏览器允许的并发请求优化
下面就让我们从 DNS
解析开始...
2. DNS解析流程
以 Chrome
浏览器为例:
-
Chrome浏览器 会首先搜索浏览器自身的DNS缓存。
(缓存时间比较短,默认只有1分钟,且只能容纳1000条缓存)
chrome://net-internals/#dns
来进行查看
Chrome
自身的缓存)
-
如果浏览器自身的缓存里面没有找到对应的条目,那么
Chrome
会搜索操作系统自身的DNS缓存-
Windows
- 在Windows
中查看DNS
缓存条目的过程非常简单。只需打开命令提示符并输入以下命令:ipconfig /displaydns
。 -
Mac
- 在Mac
上查看DNS
缓存条目的过程略有不同。需要先打开控制台应用,从左侧边栏选择设备,然后输入:any:mdnsresponder
进入搜索栏。接下来,打开命令行并输入以下命令:
sudo log config --mode "private_data:on" sudo killall -INFO mDNSResponder 复制代码
然后,返回控制台应用程序并查看缓存的DNS记录列表。例如,下面的屏幕截图显示了
wx.qlogo.cn
的缓存CNAME
记录。 -
-
如果在系统的DNS缓存也没有找到,那么尝试读取
hosts
文件。看看这里面有没有该域名对应的IP地址,如果有则解析成功。- 注:
Windows
位于C:\Windows\System32\drivers\etc
,Mac
则是/etc/hosts
。 - 这种操作系统级别的域名解析通常会被某客利用,通过修改你
hosts
文件里的内容把域名解析到他指定的ip
地址上,造成所谓的域名劫持,所以将hosts
文件设置成了只读模式,防止被恶意篡改。
- 注:
-
如果在
hosts
文件中也没有找到对应的条目,浏览器就会发起一个DNS的系统调用,请求本地域名服务器localDNS
(LDNS
)来解析这个域名。- 通过
UDP
协议向DNS
的53端口发起请求,这个请求是递归的请求,也就是运营商的DNS服务器必须得提供给我们该域名的IP地址) - 第一次就会请求本地域名服务器(LDNS)来解析这个域名,这台服务一般在你城市的某个角落,距离不会很远,并且他的性能很好,一般都会缓存域名解析结果,大概80%的域名解析到这里都结束了。
- 如果本地域名解析服务器也没有该域名的记录,则开始递归+迭代解析
- 通过
直到这里,浏览器能做的所有DNS解析已完成,接下来的步骤就是和服务器相关了。不想看的可以忽略。
5. 如果`localDNS`仍然没有命中,就直接到`Root Server`域名服务器请求解析。 6. 根域名服务器返回给本地域名服务器一个所查询的主域名服务器(`gTLD Server`)地址。`gTLD`是国际顶级域名服务器,如`.com`、`.cn`、.`org`等,全球只有13台左右。 7. 本地域名服务器`localDNS`再向上一步返回的`gTLD`服务器发送请求。 8. 接受请求的`gTLD`服务器查找并返回此域名对应的`Name Server`域名服务器的地址,这个`Name Server`通常就是用户注册的域名服务器,例如用户在某个域名服务提供商申请的域名,那么这个域名解析任务就由这个域名提供商的服务器来完成。 9. `Name Server`域名服务器会查询存储的域名和IP的映射关系表,在正常情况下都根据域名得到目标`IP`地址,连同一个`TTL`值返回给`DNS Server`域名服务器。 10. 返回该域名对应的`IP`和`TTL`值,`LDNS`会缓存这个域名和`IP`的对应关系,缓存时间由`TTL`值控制。 11. 把解析的结果返回给用户,用户根据TTL值缓存在本地系统缓存中,域名解析过程结束。 复制代码
注:在实际的DNS解析过程中,可能还不止这11步(第1步其实可以忽略不计。),如 Name Server
可能有很多级,或者有一个 GTM
来负载均衡控制,这都有可能会影响域名解析过程。
3. DNS优化
首先需要明确一点:DNS缓存存在多级缓存,从离浏览器的距离 排序 的话,有以下几种:
- 浏览器缓存
- 系统缓存
- 路由器缓存
- IPS服务器缓存
- 根域名服务器缓存
- 顶级域名服务器缓存
- 主域名服务器缓存。
如果每次都经过这么多步骤解析,是否太耗时间?如何减少该过程的步骤呢? 那就需要DNS优化了。而在前端优化中与 DNS
有关的有两点:
DNS DNS
DNS
作为互联网的基础协议,其解析的速度似乎很容易被网站优化人员忽视。现在大多数新浏览器已经针对DNS解析进行了优化,典型的一次DNS解析需要耗费 20-120
毫秒,减少DNS解析时间和次数是个很好的优化方式。这里就不再述说,着重谈DNS预解析吧。
3.1 前端: DNS prefetch
[来自:] DNS prefetch
是让具有此属性的域名不需要用户点击链接就在后台解析,而域名解析和内容载入是串行的网络操作,所以这个方式能减少用户的等待时间,提升用户体验 。
默认情况下浏览器会对页面中和当前域名(正在浏览网页的域名)不在同一个域的域名进行预获取,并且缓存结果,这就是隐式的 DNS Prefetch。
如果想对页面中没有出现的域进行预获取,那么就要使用显示的 DNS Prefetch
。
其用法也很简单,只要在link标签上加上对应的属性:
/* 这是用来告知浏览器当前页面要做DNS预解析 */ <meta http-equiv="x-dns-prefetch-control" content="on" /> <link rel="dns-prefetch" href="//example.com"> 复制代码
- 如果你的页面中需要大量访问不同域名的资源,可以利用这项技术加快资源的获取,从而获得更好的用户体验。
- 需要注意的是,DNS预解析虽好,但是也不能滥用。如果对多页面重复DNS预解析,会增加DNS的查询次数。
目前很多大型站点也应用了这一优化,例如:
淘宝:
京东:
如果需要禁止隐式的 DNS Prefetch
,可以使用以下的标签:
<meta http-equiv="x-dns-prefetch-control" content="off"> 复制代码
3.2 后端&运维: CDN
与 HTTPDNS
实际上后端&运维能做的优化有三种:
-
CDN
-
HTTPDNS
-
DNS
负载均衡
但稍微大型的Web站点,基本舍弃DNS负载均衡这一方案了,缺点太多。感兴趣的可以看看这篇:
1. CDN
与 DNS
循环
CDN
, 全称是 Content Delivery Network
,即内容分发网络。其目的是通过在现有的 Internet
中增加一层新的 CACHE
(缓存)层,将网站的内容发布到最接近用户的网络”边缘“的节点,使用户可以就近取得所需的内容,提高用户访问网站的响应速度。
DNS
循环: 当权威 DNS
发现一个域名映射多个 IP
时,会使用 IP
轮询的方式来将 IP
平均分配给多个 DNS
请求,从而达到负载均衡的效果(同上述 DNS
负载均衡)。
为什么需要 CDN
?
- 由于
DNS
循环时平均分配,不能根据不同服务器的负载情况优化分配,甚至如果有一台服务器宕机了,DNS
不能及时了解到该情况把该服务器的IP
分配出去,便会造成无法访问。 - 因此,在权威 DNS 和 服务器之间加上一个 CDN 层就显得很必要了。
-
CDN
在具备调度分配服务器能力的基础上,能够同步服务器运行情况,然后根据该情况及时适当调整调度策略,从而使得负载均衡能力大大提高。
CDN
好处:
- 解决服务器端的“第一公里”问题。
- 缓解甚至消除了不同运营商之间互联的瓶颈造成的影响。
- 减轻了各省的出口带宽压力。
- 缓解了骨干网的压力。
- 优化了网上热点内容的分布。
CDN
的访问步骤:
(1)未部署CDN应用前:
网络请求路径:
- 请求:本机网络(局域网)——》运营商网络——》应用服务器机房
- 响应:应用服务器机房——》运营商网络——》本机网络(局域网)
在不考虑复杂网络的情况下,从请求到响应需要经过3个节点,6个步骤完成一次用户访问操作。
(2)部署CDN应用后:
网络路径:
- 请求:本机网络(局域网)——》运营商网络
- 响应:运营商网络——》本机网络(局域网)
在不考虑复杂网络的情况下,从请求到响应需要经过2个节点,2个步骤完成一次用户访问操作。
与不部署CDN服务相比,减少了1个节点,4个步骤的访问。极大的提高的系统的响应速度。
以下是结合具体网络运维的步骤:
step1:用户向localDNS发起请求查询输入域名对应的IP地址(若有缓存直接返回,否则去rootDNS查询); step2:localDNS迭代向rootDNS查询,逐级迭代,rootDNS=>顶级DNS=>权限DNS; step3:获得权限DNS后,localDNS向权限DNS发起域名解析请求; step4:权限DNS通常会将域名CNAME 【如果有有CNAME则解析CNAME对应的CDN服务,否则的话默认为普通请求,直接返回解析到的IP】到另一个域名,这个域名最终会被指向CDN网络中的智能DNS负载均衡系统; step5:DNS负载均衡系统通过一些智能算法,将最合适的CDN节点IP地址返回给localDNS; step6:localDNS将获得的IP地址返回给用户; step7:用户得到节点的IP地址后,向该节点发起访问请求; step8:CDN节点返回请求文件,如果该节点中请求的文件不存在,就会再回到源站获取这个文件,然后返回给用户。 复制代码
2. HTTPDNS
:解决 DNS
挟持
在惯有的印象中,很多时候觉得站点上完 HTTPS
协议就 VANS
。其实不然:
- 尽管使用了
HTTPS
技术,部分邪恶的运营商,仍然使用DNS
污染技术,让域名指向的他们自己服务器。 - 而这些服务器并没有部署
SSL
服务(就算部署了,也会触发SSL
证书Common name
不一致报警), 导致 443 端口直接被拒绝。
运营商为了赚广告钱、省网间结算是不择手段的。 他们普遍使用的劫持手段是通过 ISP
提供的 DNS
伪造域名。 那有没有什么方法可以解决 DNS
劫持呢?
业界有一套解决这类场景的方案,即 HTTPDNS
:
HTTPDNS
使用 HTTP
协议进行域名解析,代替现有基于 UDP
的DNS协议,域名解析请求直接发送到 HTTPDNS
服务器,从而绕过运营商的 Local DNS
,能够避免 Local DNS
造成的域名劫持问题和调度不精准问题。
HTTPDNS
的原理很简单,将 DNS
这种容易被劫持的协议,转为使用 HTTP
协议请求 Domain
<-> IP
映射。 获得正确 IP
之后, Client
自己组装 HTTP
协议,从而避免 ISP
篡改数据。
腾讯作为首家提供 HttpDNS
服务的云服务商,有两篇相隔四年发布的文章,非常详细的揭示其中技术细节:
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- 如何在 VuePress 中添加博客导流公众号:即输入验证码解锁全站文章
- 某鱼直播数据全站爬取
- 基于haproxy的全站https
- Python爬虫---爬取腾讯动漫全站漫画
- DNSPod将对全站SSL证书进行升级
- 58 全站用户行为数据仓库建设及实践
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
黑客简史:棱镜中的帝国
刘创 / 电子工业出版社 / 2015-1 / 39.80元
“黑客”,伴随着计算机和互联网而诞生,他们掌握着前沿的计算机和网络技术,能够发现并利用计算机系统和网络的弱点,他们的行为动机多样,因此我们必须对这一群体进行分解,认识他们及其技术的两面性——“黑客”中那些不断拓展技术边界、富于创造力的,和那些掌握技术、却利欲熏心的,就像硬币的两面,谁都无法清晰地辨别是非。相对于主流文化,黑客的行为方式和理念等形成了一种“亚文化”,与主流文化相互作用。一起来看看 《黑客简史:棱镜中的帝国》 这本书的介绍吧!