TAT.yana 浅谈 Web 缓存
In Web开发 on 2016年03月05日 by view: 26,605
13

在前端开发中,性能一直都是被大家所重视的一点,然而判断一个网站的性能最直观的就是看网页打开的速度。其中提高网页反应速度的一个方式就是使用缓存。一个优秀的缓存策略可以缩短网页请求资源的距离,减少延迟,并且由于缓存文件可以重复利用,还可以减少带宽,降低网络负荷。那么下面我们就来看看服务器端缓存的原理。

 

缓存分类

web 缓存分为很多种,比如数据库缓存、代理服务器缓存、还有我们熟悉的 CDN 缓存,以及浏览器缓存。对于太多文字的阅读其实我是拒绝的,于是就画了个图来解释下。

浏览器通过代理服务器向源服务器发起请求的原理如下图,

图片1

浏览器先向代理服务器发起 Web 请求,再将请求转发到源服务器。它属于共享缓存,所以很多地方都可以使用其缓存资源,因此对于节省流量有很大作用。

浏览器缓存是将文件保存在客户端,在同一个会话过程中会检查缓存的副本是否足够新,在后退网页时,访问过的资源可以从浏览器缓存中拿出使用。通过减少服务器处理请求的数量,用户将获得更快的体验

下面我就来着重讲下传说中的浏览器缓存。

 

浏览器缓存

页面的缓存状态是由 header 决定的,header 的参数有四种:

一、Cache-Control

    1、max-age(单位为 s)指定设置缓存最大的有效时间,定义的是时间长短。当浏览器向服务器发送请求后,在 max-age 这段时间里浏览器就不会再向服务器发送请求了。

我们来找个资源看下。比如 shang.qq.com 上的 css 资源,max-age=2592000,也就是说缓存有效期为 2592000 秒(也就是 30 天)。于是在 30 天内都会使用这个版本的资源,即使服务器上的资源发生了变化,浏览器也不会得到通知。max-age 会覆盖掉 Expires,后面会有讨论。

图片2

 

    2、s-maxage(单位为 s)同 max-age,只用于共享缓存(比如 CDN 缓存)。

比如,当 s-maxage=60 时,在这 60 秒中,即使更新了 CDN 的内容,浏览器也不会进行请求。也就是说 max-age 用于普通缓存,而 s-maxage 用于代理缓存。如果存在 s-maxage,则会覆盖掉 max-age 和 Expires header。

    3、public 指定响应会被缓存,并且在多用户间共享。也就是下图的意思。如果没有指定 public 还是 private,则默认为 public。

9

    4、private  响应只作为私有的缓存(见下图),不能在用户间共享。如果要求 HTTP 认证,响应会自动设置为 private。

10

    5、no-cache  指定不缓存响应,表明资源不进行缓存,比如,

图片3

但是设置了 no-cache 之后并不代表浏览器不缓存,而是在缓存前要向服务器确认资源是否被更改。因此有的时候只设置 no-cache 防止缓存还是不够保险,还可以加上 private 指令,将过期时间设为过去的时间。

    6、no-store  绝对禁止缓存,一看就知道如果用了这个命令当然就是不会进行缓存啦~每次请求资源都要从服务器重新获取。

    7、must-revalidate 指定如果页面是过期的,则去服务器进行获取。这个指令并不常用,就不做过多的讨论了。

二、Expires

        缓存过期时间,用来指定资源到期的时间,是服务器端的具体的时间点。也就是说,Expires=max-age +  请求时间,需要和 Last-modified 结合使用。但在上面我们提到过,cache-control 的优先级更高。 Expires 是 Web 服务器响应消息头字段,在响应 http 请求时告诉浏览器在过期时间前浏览器可以直接从浏览器缓存取数据,而无需再次请求。

11

三、Last-modified 

        服务器端文件的最后修改时间,需要和 cache-control 共同使用,是检查服务器端资源是否更新的一种方式。当浏览器再次进行请求时,会向服务器传送 If-Modified-Since 报头,询问 Last-Modified 时间点之后资源是否被修改过。如果没有修改,则返回码为 304,使用缓存;如果修改过,则再次去服务器请求资源,返回码和首次请求相同为 200,资源为服务器最新资源。

如下图,最后修改时间为 2014 年 12 月 19 日星期五 2 点 50 分 47 秒

图片4

四、ETag

         根据实体内容生成一段 hash 字符串,标识资源的状态,由服务端产生。浏览器会将这串字符串传回服务器,验证资源是否已经修改,如果没有修改,过程如下:

12

使用 ETag 可以解决 Last-modified 存在的一些问题:

    a、某些服务器不能精确得到资源的最后修改时间,这样就无法通过最后修改时间判断资源是否更新 

    b、如果资源修改非常频繁,在秒以下的时间内进行修改,而 Last-modified 只能精确到秒 

    c、一些资源的最后修改时间改变了,但是内容没改变,使用 ETag 就认为资源还是没有修改的。

 

使用缓存流程

还是用图说话,下面是我所总结的从浏览器请求到展示资源的过程:

图片6

 

 

cache-control 指令使用

说了那么多 cache-control 的指令,那么如何选择使用哪些指令呢?我还是不说话==

图片5

 

额外的

除了开头提到的那么多缓存方式以外,还有一种我们都熟悉的缓存方式,LocalStorage 和 sessionStorage(好像是两种 23333)。

LocalStorage 是一种本地存储的公共资源,域名下很多应用共享这份资源会有风险;LocalStorage 是以页面域名划分的,如果有多个等价域名之间的 LocalStorage 不互通,则会造成缓存多份浪费。

LocalStorage 在 PC 上的兼容性不太好,而且当网络速度快、协商缓存响应快时使用 localStorage 的速度比不上 304。并且不能缓存 css 文件。而移动端由于网速慢,使用 localStorage 要快于 304。

 

在 html 中加载一个 png 图,首次加载的时候时间如下图,

图片7

然而将图片使用了 LocalStorage 存储后,再次刷新后加载时间为 0。

图片8

而相对 LocalStorage 来说,SessionStorage 的数据只存储到特定的会话中,不属于持久化的存储,所以关闭浏览器会清除数据。和 localstorage 具有相同的方法。

 

在前端开发中缓存是必不可少的,那么使用怎样的缓存方式更高效、让我们项目的性能更优,还是需要我们仔细斟酌。

原创文章转载请注明:

转载自AlloyTeam:http://www.alloyteam.com/2016/03/discussion-on-web-caching/

  1. Maxim 2017 年 6 月 16 日

    “也就是说,Expires=max-age + 请求时间”,既然是公式,我们知道其中一个字段值,就可以计算出另一个,为什么需要定义两个字段?

  2. falost 2017 年 3 月 29 日

    看了半天,怎么好像都是后端来处理缓存的啊,那么前端的处理呢?

  3. juve 2017 年 1 月 9 日

    再结合一个实际例子吧

  4. 晨钟暮鼓_烟雨姑苏 2017 年 1 月 9 日

    挺不错的图解

    • cccc 2017 年 8 月 14 日

      只不过是把 mdn 上的图翻译了一下而已

  5. 浅谈Web缓存 – 项目经验积累与分享 2016 年 12 月 19 日

    […] 作者:TAT.yana 转载自 AlloyTeam:http://www.alloyteam.com/2016/03/discussion-on-web-caching/ […]

  6. 浅谈Web缓存 | 歪布IT笔记 2016 年 12 月 16 日

    […] 转载自 AlloyTeam:http://www.alloyteam.com/2016/03/discussion-on-web-caching/ […]

  7. 龙虾 2016 年 8 月 12 日

    我明白了,单击 enter 不会请求,F5 刷新无论如何都会产生请求!

  8. 龙虾 2016 年 8 月 12 日

    有问题啊,cache-control 我设置成了 public, max-age=1000, 可在 1000 秒内重新访问还是会产生请求啊。。。并不是直接拿本地数据的哦

  9. Tony 2016 年 6 月 13 日

    写的不错,有时候 CDN 厂商会修改一些关键的 Head,排查时要注意

  10. 前端面试知识点集锦 — 好JSER 2016 年 4 月 24 日

    […] 浅谈 Web 缓存 […]

  11. 杨立ming__KK 2016 年 3 月 17 日

    web 缓存总结

  12. Benjamin-zuo 2016 年 3 月 12 日

    很不错的文章!

发表评论到 前端面试知识点集锦 — 好JSER