日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

炸裂!万字长文拿下HTTP!

發(fā)布時間:2025/3/16 编程问答 26 豆豆
生活随笔 收集整理的這篇文章主要介紹了 炸裂!万字长文拿下HTTP! 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

本文將從以下幾個方面進行分享。其中包括HTTP發(fā)展史,HTTP緩存代理機制,常用的web攻擊,HTTP和HTTPS的流量識別,網(wǎng)絡協(xié)議學習的工具推薦以及高頻HTTP與HTTPS的高頻面試題題解等,開工。

提綱

1989年,蒂姆·伯納斯 - 李(Tim Berners-Lee)在論文中提出可以在互聯(lián)網(wǎng)上構建超鏈接文檔,并提出了三點.

URI:統(tǒng)一資源標識符。互聯(lián)網(wǎng)的唯一ID

HTML:超文本文檔

HTTP:傳輸超文本的文本傳輸協(xié)議

1 HTTP應用在哪兒

學習一門知識,采用五分鐘時間看看這個知識是干啥的可能會更加有目的性。HTTP可謂無處不在,這里例舉出幾個。

HTTP應用場景

2 HTTP是什么

HTTP(hypertext transport protocol)翻譯過來為"超文本傳輸協(xié)議",文本可以理解為簡單的字符文字組合,也可以理解為更為復雜的音頻或者圖像等。那么將這個詞語拆分為三個部分。

超文本傳輸協(xié)議

"超文本"和"文本"相比多了一個字"超",這樣看來比文本豐富,因為它可以將多種文本/圖像等進行混合,更重要的是可以從一個文本跳轉到另一個文本(文本連接)。

"傳輸",傳輸?shù)倪^程中需要溝通,溝通即可能一對一溝通也可能一對多溝通(進行內(nèi)容協(xié)商),無論怎么樣,參加溝通的人數(shù)>1,想盡一切一切辦法更快更好的完成相應的任務。

"協(xié)議",無規(guī)矩不成方圓,做機密項目之前需要簽署保密協(xié)議,找工作要簽"三方協(xié)議",三方協(xié)議是學校,公司,和個人組成的協(xié)議,都是為了讓大家受一定的約束,違反了即有相應的懲罰。

三方協(xié)議

3 不同版本的HTTP

HTTP/0.9

當時網(wǎng)絡資源匱乏,0.9版本相對簡單,采用純文本格式,且設置為只讀,所以當時只能使用"Get"的方式從服務器獲得HTML文檔,響應以后則關閉。如下圖所示

GET?/Mysite.html

響應中只包含了文檔本身。響應內(nèi)容無響應頭,無錯誤碼,無狀態(tài)碼,可以說是"裸奔"。

<HTML> Hello?world </HTML> HTTP/1.0

此時HTTP/0.9請求過程如下

  • 應用層的HTTP建立在傳輸層的TCP之上并運用TCP可靠性等特性,先三次握手建立連接

  • 客戶端請求建立連接(此時只有GET)

  • 服務端響應請求,數(shù)據(jù)以 ASCII 字符流返回給客戶端

  • 傳輸完成,斷開連接。

HTTP 0.9

HTTP1.0

隨著時代的進步,僅僅文本的傳輸無法滿足需求,更多情況需要采用圖文的方式才能生動的表達出自己的觀點。隨著1995年開發(fā)出Apache,同時其他的多媒體等技術發(fā)展迅速,從而進一步的促使HTTP新功能的出現(xiàn)。HTTP1.0在1996年誕生,增加了一下幾個方面:

  • 之前只有Get方法,現(xiàn)在增加Post(加參數(shù)),Head方法

  • 加入?yún)f(xié)議版本號,同時添加文件處理類型

  • 加入HTTP Header,讓HTTP處理請求更加靈活

  • 增加響應狀態(tài)碼,標記出錯的原因

  • 提供國際化(不同語言)支持

典型的請求過程

GET?/image.html?HTTP/1.0 User-Agent:?Mozilla/5.0?(Windows?NT?6.1;?WOW64)200?OK Date:?Tue,?17?Nov?2020?09:15:31?GMT Content-Type:?text/html <HTML>? 一個包含圖片的頁面<IMG?SRC="/image.gif"> </HTML>

HTTP1.0通信過程

HTTP1.0

HTTP /1.1

1995年是不平凡的一年,網(wǎng)景公司和微軟開啟瀏覽器大戰(zhàn),誰都想當老大。1999年HTTP/1.1發(fā)布并成為標準,寫入RFC,以為以后不管是網(wǎng)關還是APP等,只要你要使用HTTP,就得遵守這個標準。

  • 繼續(xù)增加了PUT等方法

  • 允許持久連接

隨著文件越來越大,圖片等信息越來越復雜,如果每一次上傳下載文件都需要建立連接斷開連接的過程將增加大量的開銷。為此,提出了持久連接,也就是一次TCP連接可以具有多個HTTP請求。當然持久連接是可選擇的,如果考慮關閉,只需要使用Connecttion:close關閉即可。長連接如下圖所示

長連接
  • 強制要求Host頭

我們知道,在電商系統(tǒng)中,經(jīng)常會因為促銷活動導致流量飆升,為了緩解流量,其中有種方法即加緩存或者加服務器。如果是單臺服務器負載過大,數(shù)據(jù)庫可能分庫分表。數(shù)據(jù)結構算法中分而治之方法亦是如此。那么HTTP中,同樣的道理,如果文件太大,就大文件切分為小文件塊發(fā)送。

HTTP /2

HTTP/1.1的出現(xiàn),幾年間出來大量牛掰的互聯(lián)網(wǎng)公司,發(fā)展實在是太快,但是HTTP1.1中這幾點成為詬病

  • 原因1 TCP自帶慢啟動

顧名思義,"慢啟動"從0到1循循漸進。轎車啟動不會按下按鈕就直接起飛,而是緩慢調(diào)節(jié)到適合的速度。這不是挺好的?為什么會帶來性能問題呢。我們知道一個頁面有靜態(tài)數(shù)據(jù),動態(tài)頁面,很多小文件在加載的過程中就會直接發(fā)起請求,這樣導致太多的請求都會經(jīng)歷慢啟動過程,花費時間太多。

  • 原因2 多條TCP連接帶寬競爭

帶寬固定,多條TCP連接同時發(fā)起競爭帶寬資源,由于各個TCP連接之間沒有通信機制,也無法得知哪些資源優(yōu)先級更高,從而導致想快速下載的資源反而延遲下載。

  • 原因3 頭部阻塞

阻塞,在網(wǎng)絡編程中,我們采用異步,多路復用(epoll)方式盡量讓cpu少等待多干事。在HTTP1.1中,雖然大家共用了一條TCP通道,但是第一個請求沒有結束,第二請求就可能阻塞等待,也就是說不能同時發(fā)送接收數(shù)據(jù)。那么一個網(wǎng)頁很多數(shù)據(jù)文件,如果能夠同時發(fā)出請求,讓部分數(shù)據(jù)文件能夠得到響應并預處理,這樣就大大的利用了帶寬和cpu的資源。基于這些因素,在HTTP2中出現(xiàn)了新的方案

如何解決頭部阻塞呢?

HTTP是一問一答的模式,大家都在這個隊列排隊導致堵塞,那就多個隊列并發(fā)進行,也就是"對同一個域名發(fā)起多個長連接"。舉個例子,在火車站排隊買票的時候,如果只有一個窗口可用,大家只能苦等,多開幾個窗口就可緩解這個問題。

這個時候用戶數(shù) * 并發(fā)數(shù)(上限6-8)已經(jīng)不錯得效果,但是互聯(lián)網(wǎng)速度太快,火車站就這么大,窗口也就這么多,怎么辦,建新的火車站進行分流(大部分城市都有什么東站 西站)。在這里叫做"域名分片",使用多個域名,這些域名指向同一服務器。

HTTP/3

HTTP/2看似很完美了吧,但是Google輪子哥可不服,其他人在研究HTTP/2的時候,它們就在琢磨QUIC。那QUIC有啥牛掰的地方呢

QUIC是Google開發(fā)的一個基于UDP且能像TCP一樣具有可靠性特點的協(xié)議。具備像HTTP/2一樣的應用數(shù)據(jù)二進制分幀傳輸。其主要解決的問題有兩個。

  • 進一步解決線頭阻塞問題。通過獨立不同流,讓各個流之間實現(xiàn)相互獨立傳輸,互不干擾

  • 切換網(wǎng)絡時的連接保持。wifi和3G/4G經(jīng)常需要來回切換。基于TCP的協(xié)議,會因為網(wǎng)絡的切換導致IP地址的改變。而基于UDP的QUIC協(xié)議,及時切換也可以恢復之前與服務器的連接。(這里推薦大家可以去看看MPTCP)

  • 4 HTTP報文詳解

    客戶端與服務端進行交互的信息為報文。客戶端為請求報文,服務端為響應報文。我們先用wireshark抓一個博客看看

    報文層次結構GET?/article/12?HTTP/1.1 Host:?www.xxx.cn Connection:?keep-alive Cache-Control:?max-age=0 Upgrade-Insecure-Requests:?1 User-Agent:?Mozilla/5.0?(Windows?NT?10.0;?Win64;?x64)?AppleWebKit/537.36?(KHTML,?like?Gecko)?Chrome/80.0.3987.106?Safari/537.36 Accept:?text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9 Accept-Encoding:?gzip,?deflate Accept-Language:?zh-CN,zh;q=0.9 Cookie:?SESSION=so9nlsvenminor5abs65sh9dsa HTTP/1.1?200?OK Server:?nginx Date:?Sun,?17?May?2020?17:04:29?GMT Content-Type:?text/html;?charset=UTF-8 Transfer-Encoding:?chunked Connection:?keep-alive Vary:?Accept-Encoding X-Powered-By:?blade-2.0.6-BETA Content-Encoding:?gzip

    請求報文

    請求報文

    請求報文通常由三部分組成:

    起始行:描述請求或者響應的基本信息

    頭部字段集合:key-value形式說明報文

    消息正文:實際傳輸諸如圖片等信息。具體如下圖試試

    1 請求方法:一共有八種方法選擇,如下圖所示。采用不同的方法獲取不同的資源

    HTTP請求方法詳解

    說一下非常常見的幾種請求方法

    Get:從服務器中取資源。可以請求圖片,視頻等

    HEAD:和Get類似,但是從服務器請求的資源不會返回請求的實體數(shù)據(jù),只會返回響應頭

    POST/PUT:對應于GET,向服務器發(fā)送數(shù)據(jù)

    2 URI

    統(tǒng)一資源標識符(Uniform Resource Identifier),嚴格來說不等于網(wǎng)址,它包含URL和URN,可是URL太出名了以致于URL="網(wǎng)址"。無論開發(fā),測試運維配置都離不開URI,所以好好掌握。

    網(wǎng)絡層的IP主要目的是解決路由和尋址。現(xiàn)在的IP地址按照"."分割,總共2的32次方大約42億。對于計算機來說比較方便,但是對于人類來說還是不容易記憶,此時出現(xiàn)DNS了,他把IP地址映射為我們平時常見的"redis.org",按照"."分割域名,從左到右級別越高,最右邊為"頂級域名"。如下圖所示

    域名體系

    好了,現(xiàn)在TCP提供可靠(數(shù)據(jù)不丟失)且字節(jié)流(數(shù)據(jù)完整性),而且也有方便我們記憶的域名,但是互聯(lián)網(wǎng)資源千萬種,也不知道訪問什么(圖片,文字,視頻一大堆),這個時候URI(統(tǒng)一資源標識符)出現(xiàn)了,那長啥樣?

    URI格式

    協(xié)議名:HTTP協(xié)議,另外還有ftp等協(xié)議。告知訪問資源時使用什么協(xié)議。

    緊接著是分隔符:"://"

    主機名:標記互聯(lián)網(wǎng)主機,可以是IP也可以是域名,如果不寫端口則使用默認端口,例如HTTP為80,HTTPS為443.

    登錄認證信息:登錄主機時的用戶名密碼(不建議,直接告訴了別人你的隱私信息)

    主機名:此處可以是域名也可以是IP,如果不寫端口號則是默認端口。比如HTTP默認端口為80,HTTPS默認端口為443

    資源所在位置:資源在主機上的位置,使用“/”分隔多級目錄,在這里是“/en/download.html”。注意,必須"/"開頭

    參數(shù):用"?"開始,表示額外的請求要求。通常使用"key=value"的方式存在,如果多個"key=value"則使用"&"相連。

    看幾個例子

    http://nginx.org/en/download.html

    file:///E:/Demo/index/

    這里注意是三個"///",因為前面"://"作為分隔符,資源路徑按照"/"開頭。

    既然規(guī)則這么多,對于接收方而言需要完成的解析也需要遵守規(guī)則,全球用戶很多使用HTTP,每個國家地區(qū)所使用語言不同,HTTP為了能對其進行統(tǒng)一處理,引入了URI編碼,方法比較簡單,將非ASCII或者特殊字符全部轉換為十六進制字節(jié)值,同時在前面加入"%"。比如空格被轉換為"%20","中國"就編碼為"%E4%B8%AD%E5%9B%BD%0A"。

    3 請求體

    響應報文

    響應報文

    狀態(tài)行----服務器響應的狀態(tài)

    <1> 版本號:使用的HTTP什么版本

    <2> 狀態(tài)碼:不同數(shù)字代表不同的結果,就如我們在編碼時,通過返回不同的值代表不同的語義。

    狀態(tài)碼一共分為5類。

    1××:處于中間狀態(tài),還需后續(xù)操作

    2××:成功收到報文并正確處理

    "200 OK"

    最常見的成功狀態(tài)碼,表示一切正常,客戶端獲得期許的處理結果。如果不是Head請求,那么在響應頭中通常會有body數(shù)據(jù)。

    "204 No Content"

    這個的含義和"200"很相似,不同之處在于它的響應頭中沒有body數(shù)據(jù)。

    "206 Partial Content"

    是 HTTP 分塊下載或斷點續(xù)傳的基礎,在客戶端發(fā)送“范圍請求”、要求獲取資源的部分數(shù)據(jù)時出現(xiàn),它與 200 一樣,也是服務器成功處理了請求,但 body 里的數(shù)據(jù)不是資源的全部,而是其中的一部分。狀態(tài)碼 206 通常還會伴隨著頭字段“Content-Range”,表示響應報文里 body 數(shù)據(jù)的具體范圍,供客戶端確認,例如“Content-Range: bytes 0-99/5000”,意思是此次獲取的是總計 5000 個字節(jié)的前 100 個字節(jié)。

    3××:重定向到其他資源位置

    "301 Moved Permanently"

    “永久重定向”,意思是本地請求的資源以及不存在,使用新的URI再次訪問。

    “302 Found”

    “Moved Temporarily”,“臨時重定向”,臨時則所請求的資源暫時還在,但是目前需要用另一個URI訪問。

    301 和 302 通過在字段Location中表明需要跳轉的URI。兩者最大的不同在于一個是臨時改變,一個是永久改變。舉個例子,有時候需要將網(wǎng)站全部升級為HTTPS,這種永久性改變就需要配置永久的"301"。有時候晚上更新系統(tǒng),系統(tǒng)暫時不可用,可以配置"302"臨時訪問,此時不會做緩存優(yōu)化,第二天還會訪問原來的地址。

    “304 Not Modified”

    運用于緩存控制。它用于 If-Modified-Since 等條件請求,表示資源未修改,可以理解成“重定向已到緩存的文件”(即“緩存重定向”)。

    4××:請求報文有誤,服務器無法處理

    "400 Bad Request”

    通用錯誤碼,表示請求報文有錯誤,但是這個錯誤過于籠統(tǒng)。不知道是客戶端還是哪里的錯誤,所以在實際應用中,通常會返回含有明確含義的狀態(tài)碼。

    “403 Forbidden”

    注意了,這一個是表示服務器禁止訪問資源。原因比如涉及到敏感詞匯、法律禁止等。當然,如果能讓客戶端有一個清晰的認識,可以考慮說明拒絕的原因并返回即可。

    “404 Not Found”

    這可能是我們都知道且都不想看到的狀態(tài)碼之一,它的本意是想要的資源在本地未找到從而無法提供給服務端,但是現(xiàn)在,只要服務器"耍脾氣"就會給你返回 404,而我們也無從得知后面到底是真的未找到,還是有什么別的原因,

    "405 Method Not Allowed"

    獲取資源的方法好幾種,我們可以對某些方法進行限制。例如不允許 POST 只能 GET;

    "406 Not Acceptable"

    客戶端資源無法滿足客戶端請求的條件,例如請求需要中文但只有英文;

    "408 Request Timeout"

    請求超時,服務器等待了過長的時間;

    "409 Conflict":

    多個請求發(fā)生了沖突,可以理解為多線程并發(fā)時的競態(tài);

    413 Request Entity Too Large:

    請求報文里的 body 太大;

    414 Request-URI Too Long:請求行里的 URI 太大;

    429 Too Many Requests:客戶端發(fā)送了太多的請求,
    通常是由于服務器的限連策略;

    431 Request Header Fields Too Large:請求頭某個字
    段或總體太大;

    5××:服務器錯誤,服務器對請求出的時候發(fā)生內(nèi)部錯誤。

    “500 Internal Server Error”

    和400 類似,屬于一個通用的錯誤碼,但是服務器到底是什么錯誤我們不得而知。其實這是好事,盡量少的將服務器資源暴露外網(wǎng),盡量保證服務器的安全。

    “502 Bad Gateway”

    通常是服務器作為網(wǎng)關或者代理時返回的錯誤碼,表示服務器自身工作正常,訪問后端服務器時發(fā)生了錯誤,但具體的錯誤原因也是不知道的。

    “503 Service Unavailable”

    表示服務器當前很忙,暫時無法響應服務,我們上網(wǎng)時有時候遇到的“網(wǎng)絡服務正忙,請稍后重試”的提示信息就是狀態(tài)碼 503。

    503 是一個“臨時”的狀態(tài),

    暫時比較忙,稍后提供服務。在響應報文中的“Retry-After”字段,指示客戶端可以在多久以后再次嘗試發(fā)送請求。

    4 請求體

    上面大部分都是涉及到header部分,還有非常重要的body,everybody

    頭字段注意事項

    <1> 字段名不區(qū)分大小寫,例如“Host”也可以寫成“host”,但首字母大寫的可讀性更好;

    <2> 字段名里不允許出現(xiàn)空格,可以使用連字符“-”,但不能使用下劃線"_"。例如,“test-name”是合法的字段名,而“test name”“test_name”是不正確的字段名;

    <3> 字段名后面必須緊接著“:”,不能有空格,而":"后的字段值前可以有多個空格;

    <4> 字段的順序是沒有意義的,可以任意排列不影響語義;

    <5> 字段原則上不能重復,除非這個字段本身的語義允許,例如 Set-Cookie。

    HTTP的body常常被分為這幾種的類別

    <1> text:超文本text/html,純文本text/plain

    <2> audio/video:音視頻數(shù)據(jù)

    <3> application: 可能是文本,也可能是二進制,交給上層應用處理

    <4> image: 圖像文件。image/png等

    但是帶寬一定,數(shù)據(jù)大了通常考慮使用壓縮算法進行壓縮,在HTTP中使用Encoding type表示,常用的壓縮方式有下面幾種

    <1> gzip:

    一種數(shù)據(jù)格式,默認且目前僅使用deflate算法壓縮data部分

    <2> deflate:

    deflate是一種壓縮算法,是huffman編碼的一種加強

    <3> br:

    br通過變種的LZ77算法、Huffman編碼以及二階文本建模等方式進行數(shù)據(jù)壓縮,其他壓縮算法相比,它有著更高的壓塑壓縮效率

    使用相應的壓縮方法在帶寬一定的情況下確實有不錯的效果,但是gzip等主要針對文件壓縮效果不錯,但是對視頻就不行了。這個時候是不是可以使用數(shù)據(jù)結構中常用的分而治之,大化小再合并的方式呢,

    文件拆分

    ok,在報文中使用"Transer-Encoding:chunked"表示,代表body部分數(shù)據(jù)是分塊傳輸?shù)摹A硗庠赽ody中存在一個content-length字段表示body的長度,兩者不能共存,另外很多時候是流式數(shù)據(jù),body中沒有指明content-length,這個時候一般就是chunked傳輸了。

    現(xiàn)在可以通過采用分塊的方式增強帶寬的利用率,那他的編碼規(guī)則如何呢

    <1> 每一個分塊包含長度和數(shù)據(jù)塊

    <2> 長度頭按照CRLF結束

    <3> 數(shù)據(jù)塊在長度快后,且最后CRLF結尾

    <4> 使用長度0表示結束,"0\r\n\r\n"

    我們還是看圖加深印象

    chunked分塊

    分塊解決了咋們一部分問題,但是有的時候我們想截斷發(fā)送怎么辦呢。在HTTP中提供了使用字段“Accept - Ranges: bytes”,明確告知客戶端:“我是支持范圍請求的”。那么Range范圍是怎樣的呢,Range從0開始計算,比如Range:0-5則讀取前6個字節(jié),服務器收到了這個請求,將如何回應呢

    <1> 合法性檢查。比如一共只有20字節(jié),但是請求range:100-200。此時會返回416----"范圍請求有誤"

    <2> 范圍正常,則返回216,表示請求數(shù)據(jù)知識一部分

    <3> 服務器端在相應投資端增加Content-Range,格式"bytes x-y/length"。

    敲黑板:斷點續(xù)傳怎么操作?

    <1> 查看服務器是否支持范圍請求并記錄文件大小

    <2> 多個線程分別負責不同的range

    <3> 下載同時記錄進度,即使因為網(wǎng)絡等原因中斷也沒事,Range請求剩余即可

    現(xiàn)在我們通過MIME-TYPE和Encoding-type可以知道body部分的類型,下一步將是對內(nèi)容進行協(xié)商。HTTP中,請求體中使用Accept告訴服務端需要什么類型數(shù)據(jù)(我能處理哪些類型數(shù)據(jù)),響應頭中使用Content表明發(fā)送了什么類型數(shù)據(jù),具體如下圖所示

    好了,為了各個國家民族順利友好的溝通和明確的區(qū)分。HTTP請求頭中使用"type-subtype",注意此時分隔符是"-"。比如en-GB表示英式英語,zh-CN表示常用的漢語,那對于客戶端而言,它通過Accept-Language來標記自己可以理解的自然語言,對應的服務端使用Content-Language表明實體數(shù)據(jù)使用的語言類型,如下圖所示。

    字符集和編碼

    Cookie機制

    HTTP是無狀態(tài)、無記憶的,Cookie機制的出現(xiàn)讓其有記憶功能,是怎么個實現(xiàn)呢

    Cookie

    從上圖我們可以知道Cookie是由瀏覽器負責存儲,并不是操作系統(tǒng)負責,我們換個瀏覽器打開同樣的網(wǎng)頁,服務就認不出來了。

    Cookie常見的應用一個是身份識別,一個是廣告追蹤,比如我們在訪問網(wǎng)頁視頻或者圖片的時候,廣告商會悄悄給我們Cookie打上標記,方便做關聯(lián)分析和行為分析,從而給我推薦一些相關內(nèi)容。

    HTTP代理

    之前介紹的都是一問一答的情景,但是在大部分的情況下都會存在多臺服務器進行通信服務。其中比較常見的就是在請求方與應答方中間增加一個中間代理。

    代理

    代理作為中間位置,相對請求方為服務端,相當于后端服務端為請求方。代理常見的功能為負載均衡。在負載均衡中需要區(qū)分正向代理與反向代理,其中也就會涉及調(diào)度算法,比如輪詢,一致性哈希等。

    正向代理與反向代理

    那么問題來了,代理作為隱藏身份,相當于隱藏了真實的客戶端與服務端,那在是不是

    5 HTTPS

    好人占多數(shù),壞人也不少。總有些要搞壞事,因為HTTP是明文,所以需要想辦法保護明文,從而出現(xiàn)了https。

    安全是什么

    安全四要素

    機密性

    對信息進行保密,只能可信的人可以訪問(讓我想起時間管理者)。

    完整性

    數(shù)據(jù)在傳輸過程中內(nèi)容不被"篡改"。雖然機密性對數(shù)據(jù)進行保密了,但是有上策也有下策(hack)

    身份認證

    證明自己的身份是本人,保證其消息發(fā)給可信的人

    不可否認

    君子一言駟馬難追,說話算數(shù),說過的話做過的事要有所保證

    HTTPS

    HTTP和HTTPS

    從上圖我們知道HTTPS無非是在傳輸層和應用層中間加了一層TLS,正是TLS緊跟當代密碼學的步伐,盡全力的保障用戶的安全。老規(guī)矩,我們用wireshark看看長什么樣子。

    TLS

    可以看出在交互的過程中多了不少新東西,了解TLS,TLS由SSL握手協(xié)議,SSL修改密碼規(guī)范協(xié)議,SSL警報協(xié)議,SSL記錄協(xié)議組成。

    TLS組成

    SSL握手協(xié)議:

    相對于三次握手

    記錄協(xié)議

    記錄為TLS發(fā)送接收數(shù)據(jù)的基本單位。它的自協(xié)議需要通過記錄協(xié)議發(fā)出。如果多個紀錄數(shù)據(jù)則可以一個TCP包一次性發(fā)出。

    警報協(xié)議

    類似HTTP狀態(tài)碼,通過反饋不同的消息進行不同的策略。

    變更密碼規(guī)范協(xié)議

    告訴對方,從此刻開始,后續(xù)的數(shù)據(jù)將使用加密算法進行加密再傳輸。

    對稱加密與非對稱加密

    對稱加密

    對稱加密,顧名思義,加密方與解密方使用同一鑰匙(秘鑰)。具體一些就是,發(fā)送方通過使用相應的加密算法和秘鑰,對將要發(fā)送的信息進行加密;對于接收方而言,使用解密算法和相同的秘鑰解鎖信息,從而有能力閱讀信息。

    對稱加密

    非對稱加密

    在對稱加密中,發(fā)送方與接收方使用相同的秘鑰。那么在非對稱加密中則是發(fā)送方與接收方使用的不同的秘鑰。其主要解決的問題是防止在秘鑰協(xié)商的過程中發(fā)生泄漏。

    比如在對稱加密中,小藍將需要發(fā)送的消息加密,然后告訴你密碼是123balala,ok,對于其他人而言,很容易就能劫持到密碼是123balala。那么在非對稱的情況下,小藍告訴所有人密碼是123balala,對于中間人而言,拿到也沒用,因為沒有私鑰。所以,非對稱密鑰其實主要解決了密鑰分發(fā)的難題。如下圖

    非對稱加密

    其實我們經(jīng)常都在使用非對稱加密,比如使用多臺服務器搭建大數(shù)據(jù)平臺hadoop,為了方便多臺機器設置免密登錄,是不是就會涉及到秘鑰分發(fā)。再比如搭建docker集群也會使用相關非對稱加密算法。

    混合加密

    非對稱加密算法,大多數(shù)是從數(shù)學問題演變而來,運算速度較慢。混合加密所謂取長補短。通信過程中使用RSA等解決密鑰交換問題,然后使用隨機數(shù)產(chǎn)生的在對稱算法中的會話密鑰,最后使用加密。對方使用私鑰解密得到的密文取出會話秘鑰,這樣就實現(xiàn)了密鑰交換。

    混合加密

    通過混淆加密等方式完成了機密性任務,作為Hack只需要偽造發(fā)布公鑰或者作為之間人竊聽密文。但是我們知道安全是四要素,還需要保證數(shù)據(jù)的完整性,身份認證等。

    摘要

    摘要算法可以理解為一種特殊的"單向"加密算法,無密鑰,不可逆。在平時項目中,應該大家都是用過MD5,SHA-1。但是在TLS中使用SHA-2。

    假設小A轉賬5000給小C,小A加上SHA-2摘要。網(wǎng)站計算摘要并對比,如果一致則完整可信。

    摘要可信

    此時小B想修改小A給的money,這個時候網(wǎng)站計算摘要就會發(fā)現(xiàn)不一樣,不可信

    摘要不可信

    HTTPS請求建立連接過程

    HTTP握手過程

    注意:

  • 首先通過非對稱加密建立通信過程

  • 在握手階段,為什么使用3個隨機數(shù),一方面防止「隨機數(shù) C」被猜出,另一方增加Session key隨機性

  • Client發(fā)出支持的「對稱/非對稱加密」算法

  • server返回選用的「對稱/非對稱加密」算法

  • Client對算法進行確認

  • Server對算法進行確認

  • 根據(jù)wireshak結果,對TLS進一步剖析。TCP三次握手建立連接,作為禮貌,Client先打招呼"Client Hello"。里面包含了Client的版本號、所支持的密碼套件和隨機數(shù),如下圖所示

    Client Hello

    Server端表示尊重,回復"Server Hello",同時進行版本校對,給出隨機數(shù)(Server Random),從Client算法列表中選擇一個密碼套件,在這里選擇的"TLS_ECDHE_RSA_WITH_AES_128_GCM_SHA256"。

    cipher Suite

    這里的"TLS_ECDHE_RSA_WITH_AES_128_GCM_SHA256"什么意思呢

    密碼套件選擇橢圓曲線加RSA、AES、SHA256

    雙方通過證書驗證身份。因為本機服務器選用了ECDHE算法,為了實現(xiàn)密鑰交換算法,它會發(fā)送證書后把橢圓曲線的公鑰(Server Params)連帶"Server Key Exchange"消息發(fā)送出去。

    Server Key Exchange

    意思是,剛才混合加密套件比較復雜,給你個算法參數(shù),好好記住,別弄丟了。

    ServerHelloDone

    隨后服務端回復"hello done"告知打招呼完畢

    打完招呼完畢后,客戶端對證書進行核實。然后根據(jù)密碼套件也生成橢圓曲線的公鑰,用"Client Key Exchange"消息發(fā)給服務器

    Client Key Exchange

    此時客戶端和服務端都有了密鑰交換的兩個參數(shù)(Client Params、ServerParams),然后通過 ECDHE 算法算出了一個新的值,叫“Pre-Master”

    有了主密鑰和會話密鑰,客戶端發(fā)送“Change Cipher Spec”和“Finished”消息,最后將所有消息加上摘要發(fā)送給服務器驗證。

    服務器同樣發(fā)送“Change Cipher Spec”和“Finished”消息,握手結束,開始進行HTTP請求與響應

    4 初探域名

    我們知道域名的出現(xiàn)讓我們更容易記憶,按照"."分割,越靠近右邊級別越高。域名本質(zhì)是一個名字空間系統(tǒng),采用多級域名的方式區(qū)分不同的國家,公司等,作為一種身份的標識。

    根域名服務器(Root DNS Server):管理頂級域名服務器,返回“com”“net”“cn”等頂級域名服務器的 IP 地址;

    頂級域名服務器(Top-level DNS Server):管理各自域名下的權威域名服務器,比如
    com 頂級域名服務器可以返回 apple.com 域名服務器的 IP 地址;

    權威域名服務器(Authoritative DNS Server):管理自己域名下主機的 IP 地址,比如apple.com 權威域名服務器可以返回 www.apple.com 的 IP 地址**

    6 HTTP特點小結

    寫到這里,說它簡單是假的,簡單的東西通常更具有擴展的可能性。根據(jù)需求的變更,越來越復雜。

    1:靈活且易擴展,他的頭部字段很多都是可定制且可擴展

    2:應用廣泛。各個領域都有涉及。"跨平臺,跨語言"

    3:無狀態(tài)。沒有記憶功能,少功能即少占用資源。另外無狀態(tài)更容易搭建集群,通過負載均衡將請求轉發(fā)到任意一臺服務器。缺點是無法支持需要連續(xù)步驟的"事務"操作。我們知道TCP協(xié)議有11種狀態(tài),不同狀態(tài)代表通信過程中不同的含義。

    同樣操作系統(tǒng)中的進程也有執(zhí)行,就緒,活動阻塞等多種狀態(tài)。但是HTTP全程都是"懵逼"無狀態(tài)。比如小華請求服務器獲取視頻X,服務器覺得可行就發(fā)給小華。小華還想獲取視頻Y,這時服務器不會記錄之前的狀態(tài),也就不知道這兩個請求是否是同一個,所以小華還得告訴服務器自己的身份。

    4:明文。優(yōu)點是能讓開發(fā)人員通過wireshark工具更直觀的調(diào)試。缺點即裸奔互聯(lián)網(wǎng),沒隱私可言。

    5:可靠傳輸。HTTP為應用層協(xié)議,基于TCP/IP,而TCP為“可靠”傳輸協(xié)議,因此HTTP能在請求應答中"可靠"傳輸數(shù)據(jù)。

    6:應用層協(xié)議。應用層協(xié)議很多,其中常用的郵件協(xié)議SMTP,上傳下載文件ftp,默認端口22/23,SSH遠程登錄(XSHELL)。這些應用層協(xié)議都太專一,而HTTP通過各種頭部字段,實體數(shù)據(jù)的組合,并綜合緩存代理等功能,不得不說是網(wǎng)絡中的冠希哥。

    7 HTTP識別(還原)

    這里說的識別,通過代碼層面(libpcap封裝)實現(xiàn)HTTP的識別,也能進一步體現(xiàn)TCP/IP協(xié)議棧的分層特性。先看回憶一下IP頭部格式。

    IP頭部

    注意頭部中的協(xié)議字段,如果此字段值為0x0600則為TCP分組。當知道了是TCP分組后,是不是可以通過TCP頭部中端口(80)就可以判斷為HTTP呢,不能的,很多情況都會使用動態(tài)端口的方式進行部署。

    此時可以通過HTTP中的關鍵字進行判斷。如果為HTTP,再通過頭部字段中的"Content-type",charset等確認文本信息,編碼方式,最后采用解碼算法進行還原。

    8 HTTPS(密文)識別

    方法一也是比較直接的方法是直接通過抓包工具,插件配置即可。這里想給大家分享另一種思路和在Linux持續(xù)捕包的方法。

    • 數(shù)據(jù)集采集

    使用python的dpkt庫(pip install dpkt即可),dpkt庫方便對每一層協(xié)議進行拆解,同時也能進行流的拆分以及特征的提取。下面舉一個通過無頭瀏覽的方式自動化采集流量(ps如果需要較大規(guī)模的流量采集則可以考慮使用docker集群的方式)

    Read_pcap
    • 根據(jù)所提特征生成npz(實際上是numpy提供的數(shù)組存儲方式)

    • 使用開源skearn庫進行模型訓練并識別預測,此處假設使用SVM(僅使用默認參數(shù))

    SVM
    • 識別結果(參數(shù)進行適度調(diào)整定會更好的效果)

    識別結果

    9 HTTP面試題測試

    希望大家看完本文,下面的這些面試是不是可以秒殺了

    • Get和Post區(qū)別

    • HTTP與HTTPS區(qū)別

    • HTTP通信過程

    • 游覽器輸入一個地址。到頁面展示中間經(jīng)歷了哪些步驟?

    • cookies機制和session機制的區(qū)別:

    • HTTP請求報文與響應報文格式

    • 一次完整的HTTP請求所經(jīng)歷的7個步驟

    • HTTP優(yōu)化方案

    • 不同版本的HTTP區(qū)別

    • HTTP優(yōu)點缺點

    • URI和URL的區(qū)別

    • 如何判斷是否為http

    • HTTP 1.1引入分塊傳輸編碼提供了以下幾點好處

    • 長連接與短連接的區(qū)別,以及應用場景

    • 常見web攻擊

    • 站內(nèi)跳轉和外部重定向有何區(qū)別

    • HTTP的keep-alive是干什么的?

    • 關于Http 2.0 你知道多少?

    • 講講304緩存的原理

    • HTTP與RPC異同

    • 從傳輸協(xié)議來說

    RPC既可以基于TCP也可以基于HTTP協(xié)議,但是HTTP通常都是基于HTTP

    • 從性能消耗來說

    RPC可以基于thrift實現(xiàn)高效二進制傳輸。HTTP大部分通過json實現(xiàn),無論從字節(jié)大小還是序列化耗時都比t'hrift耗時

    • 從負載均衡來說

    RPC基本上自帶負載均衡策略,而HTTP需要配置Nginx實現(xiàn)。

    巨人的肩膀

    https://www.chainnews.com/articles/401950499827.htm
    https://developer.mozilla.org/zhCN/docs/Web/HTTP/Basics_of_HTTP/Evolution_of_HTTP
    https://blog.csdn.net/liaynling/article/details/86743432
    http://www.webkaka.com/tutorial/server/2015/021013/
    http://ningg.top/introduction-of-https/
    https://www.jianshu.com/p/b61695e6b473
    《圖解HTTP》
    《透視HTTP》

    有道無術,術可成;有術無道,止于術

    歡迎大家關注Java之道公眾號

    好文章,我在看??

    總結

    以上是生活随笔為你收集整理的炸裂!万字长文拿下HTTP!的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: 欧美一区二不卡视频 | 1000部拍拍拍18勿入免费视频 | 亚洲第一页色 | 老牛影视av一区二区在线观看 | 午夜视频网| 在线视频精品 | 人人超碰人人 | 国产av一区二区三区 | 国产传媒在线 | 亚洲图色在线 | 国产永久免费视频 | 伊人久久视频 | 欧美性xxxxxxxxx | www.色日本 | 很色的网站 | 一区三区在线 | 公交上高潮的丁芷晴 | 中文av免费观看 | 成人3d动漫一区二区三区91 | www..99热 | 亚洲一区二区免费 | 国产九色视频 | 波多野结衣av在线播放 | 日日骑| 日本一区视频在线播放 | 中国一及毛片 | 日韩色区 | 成人黄色动漫在线观看 | 老司机午夜免费精品视频 | 欧美亚洲自拍偷拍 | 欧美日韩一区二区三区不卡 | 黄色小电影网址 | 日本午夜啪啪 | 久久动态图 | 黄色大片在线看 | 日本特级淫片 | 欧洲a级片 | 国产亚洲久一区二区 | 国产酒店自拍 | 久久伊人成人网 | 午夜福利理论片在线观看 | 国产婷婷色一区二区三区在线 | 日韩激情床戏 | 一本色综合 | 福利影院在线观看 | 精品国产乱码久久久久久鸭王1 | 亚洲av无码日韩精品影片 | 国产特级片 | 可以免费观看的av网站 | 亚洲最黄网站 | av一二三四| 91美女片黄 | 国产又黄又大又粗的视频 | 成人毛片视频在线观看 | 欧美成人亚洲 | 欧美大片网站 | 亚洲最大免费视频 | 欧美日韩性生活 | 久久国产视频网站 | 三级久久| 中文天堂av | 青青成人 | 日日碰日日摸 | 中国性老太hd大全69 | 亚洲在线精品视频 | 欧美涩色| 午夜精品福利影院 | 黄色一级片毛片 | 国产黄色一级大片 | 天天超碰 | 毛茸茸毛片 | 探花国产 | 国产精品亚洲lv粉色 | 天天综合天天干 | 国产成人精品无码片区在线 | 少妇把腿扒开让我舔18 | 午夜高潮视频 | 粉嫩av一区二区夜夜嗨 | 双性人做受视频 | 国产人妻人伦精品1国产 | 黄视频免费在线看 | 国产精品二区在线观看 | 天堂中文在线观看视频 | 麻豆一区二区99久久久久 | 啪啪免费视频网站 | 午夜免费激情视频 | 强行挺进白丝老师里呻吟 | 久久精品美乳 | 久久精品欧美一区二区 | 少妇又白又嫩又色又粗 | 2018av| 在线看网站 | 色呦呦视频在线观看 | 成人精品免费在线观看 | 麻豆www.| 久久精品tv | 欧美 日韩 中文字幕 | √天堂中文官网8在线 | 国产精品日韩精品欧美精品 |