日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

HTTP协议1之协议详解--转

發布時間:2023/12/20 编程问答 28 豆豆
生活随笔 收集整理的這篇文章主要介紹了 HTTP协议1之协议详解--转 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

當今web程序的開發技術真是百家爭鳴,ASP.NET, PHP, JSP,Perl, AJAX 等等。?無論Web技術在未來如何發展,理解Web程序之間通信的基本協議相當重要, 因為它讓我們理解了Web應用程序的內部工作. 使用Fiddler工具非常方便地捕獲HTTP Request和HTTP Response

什么是HTTP協議

協議是指計算機通信網絡中兩臺計算機之間進行通信所必須共同遵守的規定或規則,超文本傳輸協議(HTTP)是一種通信協議,它允許將超文本標記語言(HTML)文檔從Web服務器傳送到客戶端的瀏覽器

目前我們使用的是HTTP/1.1 版本

HTTP協議特點

http協議是請求、響應式的。沒有請求就木有響應。

http協議是無狀態的,同一客戶端的這次請求和上次請求沒有關系,對http服務器來說并不知道兩個請求來自同一客戶端。 為解決這個問題Web程序引入Cookie機制來維護狀態.

?http是面向文本的,所以報文中的每一個字段都是一些ASCII碼串,所以各個字段的長度不確定。

Web服務器,瀏覽器,代理服務器

當我們打開瀏覽器,在地址欄中輸入URL,然后我們就看到了網頁。 原理是怎樣的呢?

實際上我們輸入URL后,我們的瀏覽器給Web服務器發送了一個Request, Web服務器接到Request后進行處理,生成相應的Response,然后發送給瀏覽器, 瀏覽器解析Response中的HTML,這樣我們就看到了網頁,過程如下圖所示

?

?

我們的Request 有可能是經過了代理服務器,最后才到達Web服務器的。

過程如下圖所示

代理服務器就是網絡信息的中轉站,有什么功能呢?

1. 提高訪問速度, 大多數的代理服務器都有緩存功能。

2. 突破限制, 也就是FQ了

3. 隱藏身份。

?

URL詳解

每個服務器里的資源文件都有一個名字,這樣客戶端就可以說明他們感興趣的資源。

服務器資源名被稱為:統一資源標識符(Uniform Resource Identifier,URI)。

URI用于標記一個資源文件,例如一個文件地址:http://www.baidu.com/123.jpg就是一個URI。

URI有兩種形式,分別是URL和URN。URN仍處于試驗階段。URL?資源標記符最常見的形式。?基本格式如下

schema://host[:port#]/path/.../[?query-string][#anchor]

scheme?????????????? 指定低層使用的協議(例如:http, https, ftp)

host?????????????????? HTTP服務器的IP地址或者域名

port#???????????????? HTTP服務器的默認端口是80,這種情況下端口號可以省略。如果使用了別的端口,必須指明,例如 http://www.cnblogs.com:8080/

path?????????????????? 訪問資源的路徑

query-string?????? 發送給http服務器的數據

anchor-???????????? 錨

URL 的一個例子

http://www.mywebsite.com/sj/test/test.aspx?name=sviergn&x=true#stuff

Schema: http
host: www.mywebsite.com
path: /sj/test/test.aspx
Query String: name=sviergn&x=true
Anchor: stuff

?

打開一個網頁需要瀏覽器發送很多次Request

1. 當你在瀏覽器輸入URL http://www.cnblogs.com 的時候,瀏覽器發送一個Request去獲取 http://www.cnblogs.com 的html.? 服務器把Response發送回給瀏覽器.

2. 瀏覽器分析Response中的 HTML,發現其中引用了很多其他文件,比如圖片,CSS文件,JS文件。

3. 瀏覽器會自動再次發送Request去獲取圖片,CSS文件,或者JS文件。

4. 等所有的文件都下載成功后。 網頁就被顯示出來了。

?

HTTP消息的結構

?? 無論是請求報文還是響應報文都可以劃分為三部分。
? ?1)起始行
? ?2)首部(也叫消息報頭)
? ?3)實際主體

先看請求消息的結構,?? Request 消息分為3部分,第一部分叫Request line, 第二部分叫Request header, 第三部分是body. header和body之間有個空行, 結構如下圖

第一行中的Method表示請求方法

GET???? 請求獲取Request-URI所標識的資源
POST??? 在Request-URI所標識的資源后附加新的數據
HEAD??? 請求獲取由Request-URI所標識的資源的響應消息報頭
PUT ? ? ?請求服務器存儲一個資源,并用Request-URI作為其標識
DELETE? 請求服務器刪除Request-URI所標識的資源
TRACE?? 請求服務器回送收到的請求信息,主要用于測試或診斷
CONNECT 保留將來使用
OPTIONS 請求查詢服務器的性能,或者查詢與資源相關的選項和需求

Path-to-resoure表示請求的資源

Http/version-number 表示HTTP協議的版本號

當使用的是"GET" 方法的時候, body是為空的?

下面我們打開Fiddler 捕捉一個博客園登錄的Request 然后分析下它的結構, 在Inspectors tab下以Raw的方式可以看到完整的Request的消息, ? 如下圖

HTTP最常見的請求頭如下: l

Accept:瀏覽器可接受的MIME類型 ? ??Accept-Charset:瀏覽器可接受的字符集;

MIME:

  因特網上有數千種不同的數據類型,HTTP仔細地給每種要通過Web傳輸的對象都打上了名為MIME類型(MIME type)的數據格式標簽。

  MIME類型是一種文本標記,表示一種主要的對象類型和一個特定的子類型,中間由一條斜杠分隔。?格式:類型/格式

  如:HTML格式的文本文檔由text/html類型來標記。  text是文檔類型,html是格式。

  普通的ASCII文本文檔由text/plain類型來標記。JPEG格式圖片為image/jpeg類型。Apple的QuickTime電影為video/quicktime類型。

Referer:包含一個URL,用戶從該URL代表的頁面出發訪問當前請求的頁面

Accept-Language:瀏覽器所希望的語言種類,當服務器能夠提供一種以上的語言版本時要用到;

UA-Pixels,UA-Color,UA-OS,UA-CPU:由某些版本的IE瀏覽器所發送的非標準的請求頭,表示屏幕大小、顏色深度、操作系統和CPU類型。

Accept-Encoding:瀏覽器能夠進行解碼的數據編碼方式,比如gzip。

User-Agent:瀏覽器類型,如果Servlet返回的內容與瀏覽器類型有關則該值非常有用;?

Connection:表示是否需要持久連接。如果Servlet看到這里的值為“Keep-Alive”,或者看到請求使用的是HTTP 1.1(HTTP 1.1默認進行持久連接),它就可以利用持久連接的優點,當頁面包含多個元素時(例如Applet,圖片),顯著地減少下載所需要的時間。要實現這一點,Servlet需要在應答中發送一個Content-Length頭,最簡單的實現方法是:先把內容寫入ByteArrayOutputStream,然后在正式寫出內容之前計算它的大小;

Content-Length:表示請求消息正文的長度;

Host:初始URL中的主機和端口;

Pragma:指定“no-cache”值表示服務器必須返回一個刷新后的文檔,即使它是代理服務器而且已經有了頁面的本地拷貝;

Authorization:授權信息,通常出現在對服務器發送的WWW-Authenticate頭的應答中;

?Cookie:這是最重要的請求頭信息之一;

If-Modified-Since:只有當所請求的內容在指定的日期之后又經過修改才返回它,否則返回304“Not Modified”應答;?(在http請求頭部中會有詳解)

?

我們再看Response消息的結構, 和Request消息的結構基本一樣。 同樣也分為三部分,第一部分叫Response line, 第二部分叫Response header,第三部分是body. header和body之間也有個空行,? 結構如下圖

HTTP/version-number表示HTTP協議的版本號,? status-code 和message 請看下節[狀態代碼]的詳細解釋.

我們用Fiddler 捕捉一個博客園首頁的Response然后分析下它的結構, 在Inspectors tab下以Raw的方式可以看到完整的Response的消息, ? 如下圖


HTTP最常見的響應頭如下所示:?

Content-Type: 表示后面的文檔屬于什么MIME類型。Servlet默認為text/plain,但通常需要顯式地指定為text/html。

Expires:指明應該在什么時候認為文檔已經過期,從而不再緩存它。

Last-Modified:文檔的最后改動時間。客戶可以通過If-Modified-Since請求頭提供一個日期,該請求將被視為一個條件GET,只有改動時間遲于指定時間的文檔才會返回,否則返回一個304(Not Modified)狀態。Last-Modified也可用setDateHeader方法來設置;

Allow:服務器支持哪些請求方法(如GET、POST等)

Content-Encoding:文檔的編碼(Encode)方法。只有在解碼之后才可以得到Content-Type頭指定的內容類型。

Content-Length:表示內容長度。只有當瀏覽器使用持久HTTP連接時才需要這個數據。如果你想要利用持久連接的優勢,可以把輸出文檔寫入ByteArrayOutputStram,完成后查看其大小,然后把該值放入Content-Length頭,最后通過byteArrayStream.writeTo(response.getOutputStream()發送內容;?

Location:表示客戶應當到哪里去提取文檔。Location通常不是直接設置的,而是通過HttpServletResponse的sendRedirect方法,該方法同時設置狀態代碼為302;

Date:當前的GMT時間。你可以用setDateHeader來設置這個頭以避免轉換時間格式的麻煩;

Refresh:表示瀏覽器應該在多少時間之后刷新文檔,以秒計。

?

Get和Post方法的區別

Http協議定義了很多與服務器交互的方法,最基本的有4種,分別是GET,POST,PUT,DELETE. 一個URL地址用于描述一個網絡上的資源,而HTTP中的GET, POST, PUT, DELETE就對應著對這個資源的查,改,增,刪4個操作。 我們最常見的就是GET和POST了。GET一般用于獲取/查詢資源信息,而POST一般用于更新資源信息.

我們看看GET和POST的區別

1. GET提交的數據會放在URL之后,以?分割URL和傳輸數據,參數之間以&相連,如EditPosts.aspx?name=test1&id=123456.? POST方法是把提交的數據放在HTTP包的Body中.

2. GET提交的數據大小有限制1024個字節(因為瀏覽器對URL的長度有限制),而POST方法提交的數據沒有限制.

3. GET方式需要使用Request.QueryString來取得變量的值,而POST方式通過Request.Form來獲取變量的值。

4. GET方式提交數據,會帶來安全問題,比如一個登錄頁面,通過GET方式提交數據時,用戶名和密碼將出現在URL上,如果頁面可以被緩存或者其他人可以訪問這臺機器,就可以從歷史記錄獲得該用戶的賬號和密碼.

?

狀態碼

Response 消息中的第一行叫做狀態行,由HTTP協議版本號, 狀態碼, 狀態消息 三部分組成。

狀態碼用來告訴HTTP客戶端,HTTP服務器是否產生了預期的Response.

HTTP/1.1中定義了5類狀態碼, 狀態碼由三位數字組成,第一個數字定義了響應的類別

1XX? 提示信息 - 表示請求已被成功接收,繼續處理

2XX? 成功 - 表示請求已被成功接收,理解,接受

3XX? 重定向 - 要完成請求必須進行更進一步的處理

4XX? 客戶端錯誤 -? 請求有語法錯誤或請求無法實現

5XX? 服務器端錯誤 -?? 服務器未能實現合法的請求

?

看看一些常見的狀態碼

最常見的就是成功響應狀態碼200了, 這表明該請求被成功地完成,所請求的資源發送回客戶端

如下圖, 打開博客園首頁

?

302 Found

重定向,新的URL會在response 中的Location中返回,瀏覽器將會自動使用新的URL發出新的Request

例如在IE中輸入, http://www.google.com. HTTP服務器會返回302, IE取到Response中Location header的新URL, 又重新發送了一個Request.

?

304 Not Modified

代表上次的文檔已經被緩存了, 還可以繼續使用,

例如打開博客園首頁, 發現很多Response 的status code 都是304

提示: 如果你不想使用本地緩存可以用Ctrl+F5 強制刷新頁面

?

400 Bad Request? 客戶端請求與語法錯誤,不能被服務器所理解

403 Forbidden 服務器收到請求,但是拒絕提供服務

404 Not Found

請求資源不存在(輸錯了URL)

比如在IE中輸入一個錯誤的URL, http://www.cnblogs.com/tesdf.aspx

?

500 Internal Server Error 服務器發生了不可預期的錯誤

503 Server Unavailable 服務器當前不能處理客戶端的請求,一段時間后可能恢復正常

?

HTTP 請求頭部

使用Fiddler 能很方便的查看Reques header, 點擊Inspectors tab ->Request tab-> headers? 如下圖所示.

header 有很多,比較難以記憶,我們也按照Fiddler那樣把header 進行分類,這樣比較清晰也容易記憶。

Cache 頭域

If-Modified-Since

作用: 把瀏覽器端緩存頁面的最后修改時間發送到服務器去,服務器會把這個時間與服務器上實際文件的最后修改時間進行對比。如果時間一致,那么返回304,客戶端就直接使用本地緩存文件。如果時間不一致,就會返回200和新的文件內容。客戶端接到之后,會丟棄舊文件,把新文件緩存起來,并顯示在瀏覽器中.

例如:If-Modified-Since: Thu, 09 Feb 2012 09:07:57 GMT

實例如下圖

?

If-None-Match

作用: If-None-Match和ETag一起工作,工作原理是在HTTP Response中添加ETag信息。 當用戶再次請求該資源時,將在HTTP Request 中加入If-None-Match信息(ETag的值)。如果服務器驗證資源的ETag沒有改變(該資源沒有更新),將返回一個304狀態告訴客戶端使用本地緩存文件。否則將返回200狀態和新的資源和Etag.? 使用這樣的機制將提高網站的性能

例如: If-None-Match: "03f2b33c0bfcc1:0"

實例如下圖

?

Pragma

作用: 防止頁面被緩存, 在HTTP/1.1版本中,它和Cache-Control:no-cache作用一模一樣

Pargma只有一個用法, 例如: Pragma: no-cache

注意: 在HTTP/1.0版本中,只實現了Pragema:no-cache, 沒有實現Cache-Control

?

Cache-Control

作用: 這個是非常重要的規則。 這個用來指定Response-Request遵循的緩存機制。各個指令含義如下

Cache-Control:Public?? 可以被任何緩存所緩存()

Cache-Control:Private???? 內容只緩存到私有緩存中

Cache-Control:no-cache? 所有內容都不會被緩存

還有其他的一些用法, 我沒搞懂其中的意思, 請大家參考其他的資料

?

Client 頭域

Accept

作用:?瀏覽器端可以接受的媒體類型,

例如:? Accept: text/html ?代表瀏覽器可以接受服務器回發的類型為 text/html ?也就是我們常說的html文檔,

如果服務器無法返回text/html類型的數據,服務器應該返回一個406錯誤(non acceptable)

通配符 * 代表任意類型

例如 ?Accept: */* ?代表瀏覽器可以處理所有類型,(一般瀏覽器發給服務器都是發這個)

?

Accept-Encoding:

作用: 瀏覽器申明自己接收的編碼方法,通常指定壓縮方法,是否支持壓縮,支持什么壓縮方法(gzip,deflate),(注意:這不是只字符編碼);

例如: Accept-Encoding: gzip, deflate

?

Accept-Language

作用: 瀏覽器申明自己接收的語言。?

語言跟字符集的區別:中文是語言,中文有多種字符集,比如big5,gb2312,gbk等等;

例如: Accept-Language: en-us

?

User-Agent

作用:告訴HTTP服務器, 客戶端使用的操作系統和瀏覽器的名稱和版本.

我們上網登陸論壇的時候,往往會看到一些歡迎信息,其中列出了你的操作系統的名稱和版本,你所使用的瀏覽器的名稱和版本,這往往讓很多人感到很神奇,實際上,服務器應用程序就是從User-Agent這個請求報頭域中獲取到這些信息User-Agent請求報頭域允許客戶端將它的操作系統、瀏覽器和其它屬性告訴服務器。

例如:?User-Agent: Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; CIBA; .NET CLR 2.0.50727; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729; .NET4.0C; InfoPath.2; .NET4.0E)

?

Accept-Charset

作用:瀏覽器申明自己接收的字符集,這就是本文前面介紹的各種字符集和字符編碼,如gb2312,utf-8(通常我們說Charset包括了相應的字符編碼方案)

?

Cookie/Login 頭域

Cookie:

作用: 最重要的header, 將cookie的值發送給HTTP 服務器

Entity頭域

Content-Length

作用:發送給HTTP服務器數據的長度。

例如: Content-Length: 38

?

Content-Type

作用:

例如:Content-Type: application/x-www-form-urlencoded

?

Miscellaneous 頭域

Referer:

作用: 提供了Request的上下文信息的服務器,告訴服務器我是從哪個鏈接過來的,比如從我主頁上鏈接到一個朋友那里,他的服務器就能夠從HTTP Referer中統計出每天有多少用戶點擊我主頁上的鏈接訪問他的網站。

例如: Referer:http://translate.google.cn/?hl=zh-cn&tab=wT

Transport 頭域

Connection

例如: Connection: keep-alive?? 當一個網頁打開完成后,客戶端和服務器之間用于傳輸HTTP數據的TCP連接不會關閉,如果客戶端再次訪問這個服務器上的網頁,會繼續使用這一條已經建立的連接

例如:? Connection: close? 代表一個Request完成后,客戶端和服務器之間用于傳輸HTTP數據的TCP連接會關閉, 當客戶端再次發送Request,需要重新建立TCP連接。

?

Host(發送請求時,該報頭域是必需的)

作用: 請求報頭域主要用于指定被請求資源的Internet主機和端口號,它通常從HTTP URL中提取出來的

例如: 我們在瀏覽器中輸入:http://www.guet.edu.cn/index.html

瀏覽器發送的請求消息中,就會包含Host請求報頭域,如下:

Host:http://www.guet.edu.cn

此處使用缺省端口號80,若指定了端口號,則變成:Host:指定端口號

?

HTTP Response header

同樣使用Fiddler 查看Response header, 點擊Inspectors tab ->Response tab-> headers? 如下圖所示

?我們也按照Fiddler那樣把header 進行分類,這樣比較清晰也容易記憶。

Cache頭域

Date

作用:? 生成消息的具體時間和日期

例如: Date: Sat, 11 Feb 2012 11:35:14 GMT?

?

Expires

作用: 瀏覽器會在指定過期時間內使用本地緩存

例如: Expires: Tue, 08 Feb 2022 11:35:14 GMT

?

Vary

作用:

例如: Vary: Accept-Encoding

?

Cookie/Login 頭域

P3P

作用: 用于跨域設置Cookie, 這樣可以解決iframe跨域訪問cookie的問題

例如: P3P: CP=CURa ADMa DEVa PSAo PSDo OUR BUS UNI PUR INT DEM STA PRE COM NAV OTC NOI DSP COR

?

Set-Cookie

作用: 非常重要的header, 用于把cookie 發送到客戶端瀏覽器, 每一個寫入cookie都會生成一個Set-Cookie.

例如: Set-Cookie: sc=4c31523a; path=/; domain=.acookie.taobao.com

?

Entity頭域

ETag

作用:? 和If-None-Match 配合使用。 (實例請看上節中If-None-Match的實例)

例如: ETag: "03f2b33c0bfcc1:0"

?

Last-Modified:

作用: 用于指示資源的最后修改日期和時間。(實例請看上節的If-Modified-Since的實例)

例如: Last-Modified: Wed, 21 Dec 2011 09:09:10 GMT

?

Content-Type

作用:WEB服務器告訴瀏覽器自己響應的對象的類型和字符集,

例如:

Content-Type: text/html; charset=utf-8

Content-Type:text/html;charset=GB2312

Content-Type: image/jpeg

?

Content-Length

指明實體正文的長度,以字節方式存儲的十進制數字來表示。在數據下行的過程中,Content-Length的方式要預先在服務器中緩存所有數據,然后所有數據再一股腦兒地發給客戶端。

例如: Content-Length: 19847

?

Content-Encoding

WEB服務器表明自己使用了什么壓縮方法(gzip,deflate)壓縮響應中的對象。

例如:Content-Encoding:gzip

?

Content-Language

作用: WEB服務器告訴瀏覽器自己響應的對象的語言者

例如: Content-Language:da

?

Miscellaneous 頭域

Server:

作用:指明HTTP服務器的軟件信息

例如:Server: Microsoft-IIS/7.5

?

X-AspNet-Version:

作用:如果網站是用ASP.NET開發的,這個header用來表示ASP.NET的版本

例如: X-AspNet-Version: 4.0.30319

X-Powered-By:

作用:表示網站是用什么技術開發的

例如: X-Powered-By: ASP.NET


Transport頭域

Connection

例如: Connection: keep-alive?? 當一個網頁打開完成后,客戶端和服務器之間用于傳輸HTTP數據的TCP連接不會關閉,如果客戶端再次訪問這個服務器上的網頁,會繼續使用這一條已經建立的連接

例如:? Connection: close? 代表一個Request完成后,客戶端和服務器之間用于傳輸HTTP數據的TCP連接會關閉, 當客戶端再次發送Request,需要重新建立TCP連接。

Location頭域

Location

作用: 用于重定向一個新的位置, 包含新的URL地址

?實例請看304狀態實例

?

HTTP協議是無狀態的和Connection: keep-alive的區別

無狀態是指協議對于事務處理沒有記憶能力,服務器不知道客戶端是什么狀態。從另一方面講,打開一個服務器上的網頁和你之前打開這個服務器上的網頁之間沒有任何聯系

HTTP是一個無狀態的面向連接的協議無狀態不代表HTTP不能保持TCP連接,更不能代表HTTP使用的是UDP協議(無連接)

從HTTP/1.1起,默認都開啟了Keep-Alive,保持連接特性,簡單地說,當一個網頁打開完成后,客戶端和服務器之間用于傳輸HTTP數據的TCP連接不會關閉,如果客戶端再次訪問這個服務器上的網頁,會繼續使用這一條已經建立的連接

?Keep-Alive不會永久保持連接,它有一個保持時間,可以在不同的服務器軟件(如Apache)中設定這個時間

?

轉:http://www.cnblogs.com/TankXiao/archive/2012/02/13/2342672.html

轉載于:https://www.cnblogs.com/waterBlog/p/10788842.html

總結

以上是生活随笔為你收集整理的HTTP协议1之协议详解--转的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。