日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 前端技术 > HTML >内容正文

HTML

浏览器缓存详解

發布時間:2023/12/14 HTML 40 豆豆
生活随笔 收集整理的這篇文章主要介紹了 浏览器缓存详解 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

搞懂前端緩存

總的來說:

  • 如果開啟了Service Worker首先會從Service Worker中拿
  • 如果新開一個以前打開過的頁面緩存會從Disk Cache中拿(前提是命中強緩存)
  • 刷新當前頁面時瀏覽器會根據當前運行環境內存來決定是從 Memory Cache 還是 從Disk Cache中拿(可以看到下圖最后幾個文件有時候是從 Memory Cache中拿有時候是從Disk Cache中拿)
  • 注意:以上回答全部基于chrome瀏覽器

    搞懂前端緩存

    前端緩存/后端緩存

    扯了些沒用的,我們先進入定義環節:什么是前端緩存?與之相對的什么又是后端緩存?

    基本的網絡請求就是三個步驟:請求,處理,響應。

    后端緩存主要集中于“處理”步驟,通過保留數據庫連接,存儲處理結果等方式縮短處理時間,盡快進入“響應”步驟。當然這不在本文的討論范圍之內。

    而前端緩存則可以在剩下的兩步:“請求”和“響應”中進行。在“請求”步驟中,瀏覽器也可以通過存儲結果的方式直接使用資源,直接省去了發送請求;而“響應”步驟需要瀏覽器和服務器共同配合,通過減少響應內容來縮短傳輸時間。這些都會在下面進行討論。

    本文主要包含

    • 按緩存位置分類 (memory cache, disk cache, Service Worker 等)
    • 按失效策略分類 (Cache-Control, ETag 等)
    • 幫助理解原理的一些案例
    • 緩存的應用模式

    按緩存位置分類

    我看過的大部分討論緩存的文章會直接從 HTTP 協議頭中的緩存字段開始,例如 Cache-Control, ETag, max-age 等。但偶爾也會聽到別人討論 memory cache, disk cache 等。那這兩種分類體系究竟有何關聯?是否有交叉?(我個人認為這是本文的最大價值所在,因為在寫之前我自己也是被兩種分類體系搞的一團糟)

    實際上,HTTP 協議頭的那些字段,都屬于 disk cache 的范疇,是幾個緩存位置的其中之一。因此本著從全局到局部的原則,我們應當先從緩存位置開始討論。等講到 disk cache 時,才會詳細講述這些協議頭的字段及其作用。

    我們可以在 Chrome 的開發者工具中,Network -> Size 一列看到一個請求最終的處理方式:如果是大小 (多少 K, 多少 M 等) 就表示是網絡請求,否則會列出 from memory cache, from disk cache 和 from ServiceWorker。

    它們的優先級是:(由上到下尋找,找到即返回;找不到則繼續)

  • Service Worker
  • Memory Cache
  • Disk Cache
  • 網絡請求
  • memory cache

    memory cache 是內存中的緩存,(與之相對 disk cache 就是硬盤上的緩存)。按照操作系統的常理:先讀內存,再讀硬盤。disk cache 將在后面介紹 (因為它的優先級更低一些),這里先討論 memory cache。

    幾乎所有的網絡請求資源都會被瀏覽器自動加入到 memory cache 中。但是也正因為數量很大但是瀏覽器占用的內存不能無限擴大這樣兩個因素,memory cache 注定只能是個“短期存儲”。常規情況下,瀏覽器的 TAB 關閉后該次瀏覽的 memory cache 便告失效 (為了給其他 TAB 騰出位置)。而如果極端情況下 (例如一個頁面的緩存就占用了超級多的內存),那可能在 TAB 沒關閉之前,排在前面的緩存就已經失效了。

    剛才提過,幾乎所有的請求資源 都能進入 memory cache,這里細分一下主要有兩塊:

  • preloader。如果你對這個機制不太了解,這里做一個簡單的介紹,詳情可以參閱這篇文章。

    熟悉瀏覽器處理流程的同學們應該了解,在瀏覽器打開網頁的過程中,會先請求 HTML 然后解析。之后如果瀏覽器發現了 js, css 等需要解析和執行的資源時,它會使用 CPU 資源對它們進行解析和執行。在古老的年代(大約 2007 年以前),“請求 js/css - 解析執行 - 請求下一個 js/css - 解析執行下一個 js/css” 這樣的“串行”操作模式在每次打開頁面之前進行著。很明顯在解析執行的時候,網絡請求是空閑的,這就有了發揮的空間:我們能不能一邊解析執行 js/css,一邊去請求下一個(或下一批)資源呢?

    這就是 preloader 要做的事情。不過 preloader 沒有一個官方標準,所以每個瀏覽器的處理都略有區別。例如有些瀏覽器還會下載 css 中的 @import 內容 poster等。

    而這些被 preloader 請求夠來的資源就會被放入 memory cache 中,供之后的解析執行操作使用。

  • preload (雖然看上去和剛才的 preloader 就差了倆字母)。實際上這個大家應該更加熟悉一些。這些顯式指定的預加載資源,也會被放入 memory cache 中。

  • memory cache 機制保證了一個頁面中如果有兩個相同的請求 (例如兩個 src 相同的 ,兩個 `href` 相同的)都實際只會被請求最多一次,避免浪費。

    不過在匹配緩存時,除了匹配完全相同的 URL 之外,還會比對他們的類型,CORS 中的域名規則等。因此一個作為腳本 (script) 類型被緩存的資源是不能用在圖片 (image) 類型的請求中的,即便他們 src 相等。

    在從 memory cache 獲取緩存內容時,瀏覽器會忽視例如 max-age=0, no-cache 等頭部配置。例如頁面上存在幾個相同 src 的圖片,即便它們可能被設置為不緩存,但依然會從 memory cache 中讀取。這是因為 memory cache 只是短期使用,大部分情況生命周期只有一次瀏覽而已。而 max-age=0 在語義上普遍被解讀為“不要在下次瀏覽時使用”,所以和 memory cache 并不沖突。

    但如果站長是真心不想讓一個資源進入緩存,就連短期也不行,那就需要使用 no-store。存在這個頭部配置的話,即便是 memory cache 也不會存儲,自然也不會從中讀取了。(后面的第二個示例有關于這點的體現)

    disk cache

    disk cache 也叫 HTTP cache,顧名思義是存儲在硬盤上的緩存,因此它是持久存儲的,是實際存在于文件系統中的。而且它允許相同的資源在跨會話,甚至跨站點的情況下使用,例如兩個站點都使用了同一張圖片。

    disk cache 會嚴格根據 HTTP 頭信息中的各類字段來判定哪些資源可以緩存,哪些資源不可以緩存;哪些資源是仍然可用的,哪些資源是過時需要重新請求的。當命中緩存之后,瀏覽器會從硬盤中讀取資源,雖然比起從內存中讀取慢了一些,但比起網絡請求還是快了不少的。絕大部分的緩存都來自 disk cache。

    關于 HTTP 的協議頭中的緩存字段,我們會在稍后進行詳細討論。

    凡是持久性存儲都會面臨容量增長的問題,disk cache 也不例外。在瀏覽器自動清理時,會有神秘的算法去把“最老的”或者“最可能過時的”資源刪除,因此是一個一個刪除的。不過每個瀏覽器識別“最老的”和“最可能過時的”資源的算法不盡相同,可能也是它們差異性的體現。

    Service Worker

    上述的緩存策略以及緩存/讀取/失效的動作都是由瀏覽器內部判斷 & 進行的,我們只能設置響應頭的某些字段來告訴瀏覽器,而不能自己操作。舉個生活中去銀行存/取錢的例子來說,你只能告訴銀行職員,我要存/取多少錢,然后把由他們會經過一系列的記錄和手續之后,把錢放到金庫中去,或者從金庫中取出錢來交給你。

    但 Service Worker 的出現,給予了我們另外一種更加靈活,更加直接的操作方式。依然以存/取錢為例,我們現在可以繞開銀行職員,自己走到金庫前(當然是有別于上述金庫的一個單獨的小金庫),自己把錢放進去或者取出來。因此我們可以選擇放哪些錢(緩存哪些文件),什么情況把錢取出來(路由匹配規則),取哪些錢出來(緩存匹配并返回)。當然現實中銀行沒有給我們開放這樣的服務

    Service Worker 能夠操作的緩存是有別于瀏覽器內部的 memory cache 或者 disk cache 的。我們可以從 Chrome 的 F12 中,Application -> Cache Storage 找到這個單獨的“小金庫”。除了位置不同之外,這個緩存是永久性的,即關閉 TAB 或者瀏覽器,下次打開依然還在(而 memory cache 不是)。有兩種情況會導致這個緩存中的資源被清除:手動調用 API cache.delete(resource) 或者容量超過限制,被瀏覽器全部清空。

    如果 Service Worker 沒能命中緩存,一般情況會使用 fetch() 方法繼續獲取資源。這時候,瀏覽器就去 memory cache 或者 disk cache 進行下一次找緩存的工作了。注意:經過 Service Worker 的 fetch() 方法獲取的資源,即便它并沒有命中 Service Worker 緩存,甚至實際走了網絡請求,也會標注為 from ServiceWorker。這個情況在后面的第三個示例中有所體現。

    請求網絡

    如果一個請求在上述 3 個位置都沒有找到緩存,那么瀏覽器會正式發送網絡請求去獲取內容。之后容易想到,為了提升之后請求的緩存命中率,自然要把這個資源添加到緩存中去。具體來說:

  • 根據 Service Worker 中的 handler 決定是否存入 Cache Storage (額外的緩存位置)。
  • 根據 HTTP 頭部的相關字段(Cache-control, Pragma 等)決定是否存入 disk cache
  • memory cache 保存一份資源 的引用,以備下次使用。
  • 按失效策略分類

    memory cache 是瀏覽器為了加快讀取緩存速度而進行的自身的優化行為,不受開發者控制,也不受 HTTP 協議頭的約束,算是一個黑盒。Service Worker 是由開發者編寫的額外的腳本,且緩存位置獨立,出現也較晚,使用還不算太廣泛。所以我們平時最為熟悉的其實是 disk cache,也叫 HTTP cache (因為不像 memory cache,它遵守 HTTP 協議頭中的字段)。平時所說的強制緩存,對比緩存,以及 Cache-Control 等,也都歸于此類。

    強制緩存 (也叫強緩存)

    強制緩存的含義是,當客戶端請求后,會先訪問緩存數據庫看緩存是否存在。如果存在則直接返回;不存在則請求真的服務器,響應后再寫入緩存數據庫。

    強制緩存直接減少請求數,是提升最大的緩存策略。 它的優化覆蓋了文章開頭提到過的請求數據的全部三個步驟。如果考慮使用緩存來優化網頁性能的話,強制緩存應該是首先被考慮的。

    可以造成強制緩存的字段是 Cache-control 和 Expires。

    Expires

    這是 HTTP 1.0 的字段,表示緩存到期時間,是一個絕對的時間 (當前時間+緩存時間),如

    Expires: Thu, 10 Nov 2017 08:45:11 GMT 復制代碼

    在響應消息頭中,設置這個字段之后,就可以告訴瀏覽器,在未過期之前不需要再次請求。

    但是,這個字段設置時有兩個缺點:

  • 由于是絕對時間,用戶可能會將客戶端本地的時間進行修改,而導致瀏覽器判斷緩存失效,重新請求該資源。此外,即使不考慮自行修改,時差或者誤差等因素也可能造成客戶端與服務端的時間不一致,致使緩存失效。
  • 寫法太復雜了。表示時間的字符串多個空格,少個字母,都會導致非法屬性從而設置失效。
  • Cache-control

    已知Expires的缺點之后,在HTTP/1.1中,增加了一個字段Cache-control,該字段表示資源緩存的最大有效時間,在該時間內,客戶端不需要向服務器發送請求

    這兩者的區別就是前者是絕對時間,而后者是相對時間。如下:

    Cache-control: max-age=2592000 復制代碼

    下面列舉一些 Cache-control 字段常用的值:(完整的列表可以查看 MDN)

    • max-age:即最大有效時間,在上面的例子中我們可以看到
    • must-revalidate:如果超過了 max-age 的時間,瀏覽器必須向服務器發送請求,驗證資源是否還有效。
    • no-cache:雖然字面意思是“不要緩存”,但實際上還是要求客戶端緩存內容的,只是是否使用這個內容由后續的對比來決定。
    • no-store: 真正意義上的“不要緩存”。所有內容都不走緩存,包括強制和對比。
    • public:所有的內容都可以被緩存 (包括客戶端和代理服務器, 如 CDN)
    • private:所有的內容只有客戶端才可以緩存,代理服務器不能緩存。默認值。

    這些值可以混合使用,例如 Cache-control:public, max-age=2592000。在混合使用時,它們的優先級如下圖:(圖片來自 developers.google.com/web/fundame…)

    這里有一個疑問:max-age=0 和 no-cache 等價嗎?從規范的字面意思來說,max-age 到期是 應該(SHOULD) 重新驗證,而 no-cache 是 必須(MUST) 重新驗證。但實際情況以瀏覽器實現為準,大部分情況他們倆的行為還是一致的。(如果是 max-age=0, must-revalidate 就和 no-cache 等價了)

    順帶一提,在 HTTP/1.1 之前,如果想使用 no-cache,通常是使用 Pragma 字段,如 Pragma: no-cache(這也是 Pragma 字段唯一的取值)。但是這個字段只是瀏覽器約定俗成的實現,并沒有確切規范,因此缺乏可靠性。它應該只作為一個兼容字段出現,在當前的網絡環境下其實用處已經很小。

    總結一下,自從 HTTP/1.1 開始,Expires 逐漸被 Cache-control 取代。Cache-control 是一個相對時間,即使客戶端時間發生改變,相對時間也不會隨之改變,這樣可以保持服務器和客戶端的時間一致性。而且 Cache-control 的可配置性比較強大。

    Cache-control 的優先級高于 Expires,為了兼容 HTTP/1.0 和 HTTP/1.1,實際項目中兩個字段我們都會設置。

    對比緩存 (也叫協商緩存)

    當強制緩存失效(超過規定時間)時,就需要使用對比緩存,由服務器決定緩存內容是否失效。

    流程上說,瀏覽器先請求緩存數據庫,返回一個緩存標識。之后瀏覽器拿這個標識和服務器通訊。如果緩存未失效,則返回 HTTP 狀態碼 304 表示繼續使用,于是客戶端繼續使用緩存;如果失效,則返回新的數據和緩存規則,瀏覽器響應數據后,再把規則寫入到緩存數據庫。

    對比緩存在請求數上和沒有緩存是一致的,但如果是 304 的話,返回的僅僅是一個狀態碼而已,并沒有實際的文件內容,因此 在響應體體積上的節省是它的優化點。它的優化覆蓋了文章開頭提到過的請求數據的三個步驟中的最后一個:“響應”。通過減少響應體體積,來縮短網絡傳輸時間。所以和強制緩存相比提升幅度較小,但總比沒有緩存好。

    對比緩存是可以和強制緩存一起使用的,作為在強制緩存失效后的一種后備方案。實際項目中他們也的確經常一同出現。

    對比緩存有 2 組字段(不是兩個):

    Last-Modified & If-Modified-Since

  • 服務器通過 Last-Modified 字段告知客戶端,資源最后一次被修改的時間,例如

    Last-Modified: Mon, 10 Nov 2018 09:10:11 GMT 復制代碼
  • 瀏覽器將這個值和內容一起記錄在緩存數據庫中。

  • 下一次請求相同資源時時,瀏覽器從自己的緩存中找出“不確定是否過期的”緩存。因此在請求頭中將上次的 Last-Modified 的值寫入到請求頭的 If-Modified-Since 字段

  • 服務器會將 If-Modified-Since 的值與 Last-Modified 字段進行對比。如果相等,則表示未修改,響應 304;反之,則表示修改了,響應 200 狀態碼,并返回數據。

  • 但是他還是有一定缺陷的:

    • 如果資源更新的速度是秒以下單位,那么該緩存是不能被使用的,因為它的時間單位最低是秒。
    • 如果文件是通過服務器動態生成的,那么該方法的更新時間永遠是生成的時間,盡管文件可能沒有變化,所以起不到緩存的作用。

    Etag & If-None-Match

    為了解決上述問題,出現了一組新的字段 Etag 和 If-None-Match

    Etag 存儲的是文件的特殊標識(一般都是 hash 生成的),服務器存儲著文件的 Etag 字段。之后的流程和 Last-Modified 一致,只是 Last-Modified 字段和它所表示的更新時間改變成了 Etag 字段和它所表示的文件 hash,把 If-Modified-Since 變成了 If-None-Match。服務器同樣進行比較,命中返回 304, 不命中返回新資源和 200。

    Etag 的優先級高于 Last-Modified

    緩存小結

    當瀏覽器要請求資源時

  • 調用 Service Worker 的 fetch 事件響應
  • 查看 memory cache
  • 查看 disk cache。這里又細分:
  • 如果有強制緩存且未失效,則使用強制緩存,不請求服務器。這時的狀態碼全部是 200
  • 如果有強制緩存但已失效,使用對比緩存,比較后確定 304 還是 200
  • 發送網絡請求,等待網絡響應
  • 把響應內容存入 disk cache (如果 HTTP 頭信息配置可以存的話)
  • 把響應內容 的引用 存入 memory cache (無視 HTTP 頭信息的配置)
  • 把響應內容存入 Service Worker 的 Cache Storage (如果 Service Worker 的腳本調用了 cache.put())
  • 一些案例

    光看原理不免枯燥。我們編寫一些簡單的網頁,通過案例來深刻理解上面的那些原理。

    1. memory cache & disk cache

    我們寫一個簡單的 index.html,然后引用 3 種資源,分別是 index.js, index.css 和 mashroom.jpg。

    我們給這三種資源都設置上 Cache-control: max-age=86400,表示強制緩存 24 小時。以下截圖全部使用 Chrome 的隱身模式。

  • 首次請求

    毫無意外的全部走網絡請求,因為什么緩存都還沒有。

  • 再次請求 (F5)

    第二次請求,三個請求都來自 memory cache。因為我們沒有關閉 TAB,所以瀏覽器把緩存的應用加到了 memory cache。(耗時 0ms,也就是 1ms 以內)

  • 關閉 TAB,打開新 TAB 并再次請求

    因為關閉了 TAB,memory cache 也隨之清空。但是 disk cache 是持久的,于是所有資源來自 disk cache。(大約耗時 3ms,因為文件有點小)

    而且對比 2 和 3,很明顯看到 memory cache 還是比 disk cache 快得多的。

  • 2. no-cache & no-store

    我們在 index.html 里面一些代碼,完成兩個目標:

    • 每種資源都(同步)請求兩次
    • 增加腳本異步請求圖片
    <!-- 把3種資源都改成請求兩次 --> <link rel="stylesheet" href="/static/index.css"> <link rel="stylesheet" href="/static/index.css"> <script src="/static/index.js"></script> <script src="/static/index.js"></script> <img src="/static/mashroom.jpg"> <img src="/static/mashroom.jpg"><!-- 異步請求圖片 --> <script>setTimeout(function () {let img = document.createElement('img')img.src = '/static/mashroom.jpg'document.body.appendChild(img)}, 1000) </script> 復制代碼
  • 當把服務器響應設置為 Cache-Control: no-cache 時,我們發現打開頁面之后,三種資源都只被請求 1 次。

    這說明兩個問題:

    • 同步請求方面,瀏覽器會自動把當次 HTML 中的資源存入到緩存 (memory cache),這樣碰到相同 src 的圖片就會自動讀取緩存(但不會在 Network 中顯示出來)
    • 異步請求方面,瀏覽器同樣是不發請求而直接讀取緩存返回。但同樣不會在 Network 中顯示。

    總體來說,如上面原理所述,no-cache 從語義上表示下次請求不要直接使用緩存而需要比對,并不對本次請求進行限制。因此瀏覽器在處理當前頁面時,可以放心使用緩存。

  • 當把服務器響應設置為 Cache-Control: no-store 時,情況發生了變化,三種資源都被請求了 2 次。而圖片因為還多一次異步請求,總計 3 次。(紅框中的都是那一次異步請求)

    這同樣說明:

    • 如之前原理所述,雖然 memory cache 是無視 HTTP 頭信息的,但是 no-store 是特別的。在這個設置下,memory cache 也不得不每次都請求資源。
    • 異步請求和同步遵循相同的規則,在 no-store 情況下,依然是每次都發送請求,不進行任何緩存。
  • 3. Service Worker & memory (disk) cache

    我們嘗試把 Service Worker 也加入進去。我們編寫一個 serviceWorker.js,并編寫如下內容:(主要是預緩存 3 個資源,并在實際請求時匹配緩存并返回)

    // serviceWorker.js self.addEventListener('install', e => {// 當確定要訪問某些資源時,提前請求并添加到緩存中。// 這個模式叫做“預緩存”e.waitUntil(caches.open('service-worker-test-precache').then(cache => {return cache.addAll(['/static/index.js', '/static/index.css', '/static/mashroom.jpg'])})) })self.addEventListener('fetch', e => {// 緩存中能找到就返回,找不到就網絡請求,之后再寫入緩存并返回。// 這個稱為 CacheFirst 的緩存策略。return e.respondWith(caches.open('service-worker-test-precache').then(cache => {return cache.match(e.request).then(matchedResponse => {return matchedResponse || fetch(e.request).then(fetchedResponse => {cache.put(e.request, fetchedResponse.clone())return fetchedResponse})})})) }) 復制代碼

    注冊 SW 的代碼這里就不贅述了。此外我們還給服務器設置 Cache-Control: max-age=86400 來開啟 disk cache。我們的目的是看看兩者的優先級。

  • 當我們首次訪問時,會看到常規請求之外,瀏覽器(確切地說是 Service Worker)額外發出了 3 個請求。這來自預緩存的代碼。

  • 第二次訪問(無論關閉 TAB 重新打開,還是直接按 F5 刷新)都能看到所有的請求標記為 from SerciceWorker。

    from ServiceWorker 只表示請求通過了 Service Worker,至于到底是命中了緩存,還是繼續 fetch() 方法光看這一條記錄其實無從知曉。因此我們還得配合后續的 Network 記錄來看。因為之后沒有額外的請求了,因此判定是命中了緩存。

    從服務器的日志也能很明顯地看到,3 個資源都沒有被重新請求,即命中了 Service Worker 內部的緩存。

  • 如果修改 serviceWorker.js 的 fetch 事件監聽代碼,改為如下:

    // 這個也叫做 NetworkOnly 的緩存策略。 self.addEventListener('fetch', e => {return e.respondWith(fetch(e.request)) }) 復制代碼

    可以發現在后續訪問時的效果和修改前是 完全一致的。(即 Network 僅有標記為 from ServiceWorker 的幾個請求,而服務器也不打印 3 個資源的訪問日志)

    很明顯 Service Worker 這層并沒有去讀取自己的緩存,而是直接使用 fetch() 進行請求。所以此時其實是 Cache-Control: max-age=86400 的設置起了作用,也就是 memory/disk cache。但具體是 memory 還是 disk 這個只有瀏覽器自己知道了,因為它并沒有顯式的告訴我們。(個人猜測是 memory,因為不論從耗時 0ms 還是從不關閉 TAB 來看,都更像是 memory cache)

  • 瀏覽器的行為

    所謂瀏覽器的行為,指的就是用戶在瀏覽器如何操作時,會觸發怎樣的緩存策略。主要有 3 種:

    • 打開網頁,地址欄輸入地址: 查找 disk cache 中是否有匹配。如有則使用;如沒有則發送網絡請求。
    • 普通刷新 (F5):因為 TAB 并沒有關閉,因此 memory cache 是可用的,會被優先使用(如果匹配的話)。其次才是 disk cache。
    • 強制刷新 (Ctrl + F5):瀏覽器不使用緩存,因此發送的請求頭部均帶有 Cache-control: no-cache(為了兼容,還帶了 Pragma: no-cache)。服務器直接返回 200 和最新內容。

    緩存的應用模式

    了解了緩存的原理,我們可能更加關心如何在實際項目中使用它們,才能更好的讓用戶縮短加載時間,節約流量等。這里有幾個常用的模式,供大家參考

    模式 1:不常變化的資源

    Cache-Control: max-age=31536000 復制代碼

    通常在處理這類資源資源時,給它們的 Cache-Control 配置一個很大的 max-age=31536000 (一年),這樣瀏覽器之后請求相同的 URL 會命中強制緩存。而為了解決更新的問題,就需要在文件名(或者路徑)中添加 hash, 版本號等動態字符,之后更改動態字符,達到更改引用 URL 的目的,從而讓之前的強制緩存失效 (其實并未立即失效,只是不再使用了而已)。

    在線提供的類庫 (如 jquery-3.3.1.min.js, lodash.min.js 等) 均采用這個模式。如果配置中還增加 public 的話,CDN 也可以緩存起來,效果拔群。

    這個模式的一個變體是在引用 URL 后面添加參數 (例如 ?v=xxx 或者 ?_=xxx),這樣就不必在文件名或者路徑中包含動態參數,滿足某些完美主義者的喜好。在項目每次構建時,更新額外的參數 (例如設置為構建時的當前時間),則能保證每次構建后總能讓瀏覽器請求最新的內容。

    特別注意: 在處理 Service Worker 時,對待 sw-register.js(注冊 Service Worker) 和 serviceWorker.js (Service Worker 本身) 需要格外的謹慎。如果這兩個文件也使用這種模式,你必須多多考慮日后可能的更新及對策。

    模式 2:經常變化的資源

    Cache-Control: no-cache 復制代碼

    這里的資源不單單指靜態資源,也可能是網頁資源,例如博客文章。這類資源的特點是:URL 不能變化,但內容可以(且經常)變化。我們可以設置 Cache-Control: no-cache 來迫使瀏覽器每次請求都必須找服務器驗證資源是否有效。

    既然提到了驗證,就必須 ETag 或者 Last-Modified 出場。這些字段都會由專門處理靜態資源的常用類庫(例如 koa-static)自動添加,無需開發者過多關心。

    也正如上文中提到協商緩存那樣,這種模式下,節省的并不是請求數,而是請求體的大小。所以它的優化效果不如模式 1 來的顯著。

    模式 3:非常危險的模式 1 和 2 的結合 (反例)

    Cache-Control: max-age=600, must-revalidate 復制代碼

    不知道是否有開發者從模式 1 和 2 獲得一些啟發:模式 2 中,設置了 no-cache,相當于 max-age=0, must-revalidate。我的應用時效性沒有那么強,但又不想做過于長久的強制緩存,我能不能配置例如 max-age=600, must-revalidate 這樣折中的設置呢?

    表面上看這很美好:資源可以緩存 10 分鐘,10 分鐘內讀取緩存,10 分鐘后和服務器進行一次驗證,集兩種模式之大成,但實際線上暗存風險。因為上面提過,瀏覽器的緩存有自動清理機制,開發者并不能控制。

    舉個例子:當我們有 3 種資源: index.html, index.js, index.css。我們對這 3 者進行上述配置之后,假設在某次訪問時,index.js 已經被緩存清理而不存在,但 index.html, index.css 仍然存在于緩存中。這時候瀏覽器會向服務器請求新的 index.js,然后配上老的 index.html, index.css 展現給用戶。這其中的風險顯而易見:不同版本的資源組合在一起,報錯是極有可能的結局。

    除了自動清理引發問題,不同資源的請求時間不同也能導致問題。例如 A 頁面請求的是 A.js 和 all.css,而 B 頁面是 B.js 和 all.css。如果我們以 A -> B 的順序訪問頁面,勢必導致 all.css 的緩存時間早于 B.js。那么以后訪問 B 頁面就同樣存在資源版本失配的隱患。


    有開發者朋友(wd2010)在知乎的評論區提了一個很好的問題:

    如果我不使用must-revalidate,只是Cache-Control: max-age=600,瀏覽器緩存的自動清理機制就不會執行么?如果瀏覽器緩存的自動清理機制執行的話那后續的index.js被清掉的所引發的情況都是一樣的呀!

    這個問題涉及幾個小點,我補充說明一下:

  • ‘max-age=600’ 和 ‘max-age=600,must-revalidate’ 有什么區別?

    沒有區別。在列出 max-age 了之后,must-revalidate 是否列出效果相同,瀏覽器都會在超過 max-age 之后進行校驗,驗證緩存是否可用。

    在 HTTP 的規范中,只闡述了 must-revalidate 的作用,卻沒有闡述不列出 must-revalidate 時,瀏覽器應該如何解決緩存過期的問題,因此這其實是瀏覽器實現時的自主決策。(可能有少數瀏覽器選擇在源站點無法訪問時繼續使用過期緩存,但這取決于瀏覽器自身)

  • 那 ‘max-age=600’ 是不是也會引發問題?

    是的。問題的出現和是否列出 ‘must-revalidate’ 無關,依然會存在 JS CSS等文件版本失配的問題。因此常規的網站在不同頁面需要使用不同的 JS CSS 文件時,如果要使用 max-age 做強緩存,不要設置一個太短的時間。

  • 那這類比較短的 max-age 到底能用在哪里呢?

    既然版本存在失配的問題,那么要避開這個問題,就有兩種方法。

  • 整站都使用相同的 JS 和 CSS,即合并后的文件。這個比較適合小型站點,否則可能過于冗余,影響性能。(不過可能還是會因為瀏覽器自身的清理策略被清理,依然有隱患)
  • 資源是獨立使用的,并不需要和其他文件配合生效。例如 RSS 就歸在此類。
  • 轉載來源未知。

    總結

    以上是生活随笔為你收集整理的浏览器缓存详解的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。