基于websocket单台机器支持百万连接分布式聊天(IM)系统
本文將介紹如何實(shí)現(xiàn)一個(gè)基于websocket分布式聊天(IM)系統(tǒng)。
使用golang實(shí)現(xiàn)websocket通訊,單機(jī)可以支持百萬連接,使用gin框架、nginx負(fù)載、可以水平部署、程序內(nèi)部相互通訊、使用grpc通訊協(xié)議。
本文內(nèi)容比較長,如果直接想clone項(xiàng)目體驗(yàn)直接進(jìn)入項(xiàng)目體驗(yàn) goWebSocket項(xiàng)目下載 ,文本從介紹webSocket是什么開始,然后開始介紹這個(gè)項(xiàng)目,以及在Nginx中配置域名做webSocket的轉(zhuǎn)發(fā),然后介紹如何搭建一個(gè)分布式系統(tǒng)。
目錄
- 1、項(xiàng)目說明
- 1.1 goWebSocket
- 1.2 項(xiàng)目體驗(yàn)
- 2、介紹webSocket
- 2.1 webSocket 是什么
- 2.2 webSocket的兼容性
- 2.3 為什么要用webSocket
- 2.4 webSocket建立過程
- 3、如何實(shí)現(xiàn)基于webSocket的長連接系統(tǒng)
- 3.1 使用go實(shí)現(xiàn)webSocket服務(wù)端
- 3.1.1 啟動(dòng)端口監(jiān)聽
- 3.1.2 升級協(xié)議
- 3.1.3 客戶端連接的管理
- 3.1.4 注冊客戶端的socket的寫的異步處理程序
- 3.1.5 注冊客戶端的socket的讀的異步處理程序
- 3.1.6 接收客戶端數(shù)據(jù)并處理
- 3.1.7 使用路由的方式處理客戶端的請求數(shù)據(jù)
- 3.1.8 防止內(nèi)存溢出和Goroutine不回收
- 3.2 使用javaScript實(shí)現(xiàn)webSocket客戶端
- 3.2.1 啟動(dòng)并注冊監(jiān)聽程序
- 3.2.2 發(fā)送數(shù)據(jù)
- 3.1 使用go實(shí)現(xiàn)webSocket服務(wù)端
- 4、goWebSocket 項(xiàng)目
- 4.1 項(xiàng)目說明
- 4.2 項(xiàng)目依賴
- 4.3 項(xiàng)目啟動(dòng)
- 5、webSocket項(xiàng)目Nginx配置
- 5.1 為什么要配置Nginx
- 5.2 nginx配置
- 5.3 問題處理
- 6、壓測
- 6.1 Linux內(nèi)核優(yōu)化
- 6.2 壓測準(zhǔn)備
- 6.3 壓測數(shù)據(jù)
- 7、如何基于webSocket實(shí)現(xiàn)一個(gè)分布式Im
- 7.1 說明
- 7.2 架構(gòu)
- 7.3 分布式系統(tǒng)部署
- 8、回顧和反思
- 8.1 在其它系統(tǒng)應(yīng)用
- 8.2 需要完善、優(yōu)化
- 8.3 總結(jié)
- 9、參考文獻(xiàn)
1、項(xiàng)目說明
1.1 goWebSocket
本文將介紹如何實(shí)現(xiàn)一個(gè)基于websocket聊天(IM)分布式系統(tǒng)。
使用golang實(shí)現(xiàn)websocket通訊,單機(jī)支持百萬連接,使用gin框架、nginx負(fù)載、可以水平部署、程序內(nèi)部相互通訊、使用grpc通訊協(xié)議。
- 一般項(xiàng)目中webSocket使用的架構(gòu)圖
1.2 項(xiàng)目體驗(yàn)
- 項(xiàng)目地址 gowebsocket
- IM-聊天首頁 或者在新的窗口打開 http://im.91vh.com/home/index
- 打開連接以后進(jìn)入聊天界面
- 多人群聊可以同時(shí)打開兩個(gè)窗口
2、介紹webSocket
2.1 webSocket 是什么
WebSocket 協(xié)議在2008年誕生,2011年成為國際標(biāo)準(zhǔn)。所有瀏覽器都已經(jīng)支持了。
它的最大特點(diǎn)就是,服務(wù)器可以主動(dòng)向客戶端推送信息,客戶端也可以主動(dòng)向服務(wù)器發(fā)送信息,是真正的雙向平等對話,屬于服務(wù)器推送技術(shù)的一種。
-
HTTP和WebSocket在通訊過程的比較
-
HTTP和webSocket都支持配置證書,ws:// 無證書 wss:// 配置證書的協(xié)議標(biāo)識(shí)
2.2 webSocket的兼容性
- 瀏覽器的兼容性,開始支持webSocket的版本
- 服務(wù)端的支持
golang、java、php、node.js、python、nginx 都有不錯(cuò)的支持
- Android和IOS的支持
Android可以使用java-webSocket對webSocket支持
iOS 4.2及更高版本具有WebSockets支持
2.3 為什么要用webSocket
- 從業(yè)務(wù)上出發(fā),需要一個(gè)主動(dòng)通達(dá)客戶端的能力
目前大多數(shù)的請求都是使用HTTP,都是由客戶端發(fā)起一個(gè)請求,有服務(wù)端處理,然后返回結(jié)果,不可以服務(wù)端主動(dòng)向某一個(gè)客戶端主動(dòng)發(fā)送數(shù)據(jù)
- 大多數(shù)場景我們需要主動(dòng)通知用戶,如:聊天系統(tǒng)、用戶完成任務(wù)主動(dòng)告訴用戶、一些運(yùn)營活動(dòng)需要通知到在線的用戶
- 可以獲取用戶在線狀態(tài)
- 在沒有長連接的時(shí)候通過客戶端主動(dòng)輪詢獲取數(shù)據(jù)
- 可以通過一種方式實(shí)現(xiàn),多種不同平臺(tái)(H5/Android/IOS)去使用
2.4 webSocket建立過程
- 客戶端先發(fā)起升級協(xié)議的請求
客戶端發(fā)起升級協(xié)議的請求,采用標(biāo)準(zhǔn)的HTTP報(bào)文格式,在報(bào)文中添加頭部信息
Connection: Upgrade表明連接需要升級
Upgrade: websocket需要升級到 websocket協(xié)議
Sec-WebSocket-Version: 13 協(xié)議的版本為13
Sec-WebSocket-Key: I6qjdEaqYljv3+9x+GrhqA== 這個(gè)是base64 encode 的值,是瀏覽器隨機(jī)生成的,與服務(wù)器響應(yīng)的 Sec-WebSocket-Accept對應(yīng)
# Request Headers Connection: Upgrade Host: im.91vh.com Origin: http://im.91vh.com Pragma: no-cache Sec-WebSocket-Extensions: permessage-deflate; client_max_window_bits Sec-WebSocket-Key: I6qjdEaqYljv3+9x+GrhqA== Sec-WebSocket-Version: 13 Upgrade: websocket- 服務(wù)器響應(yīng)升級協(xié)議
服務(wù)端接收到升級協(xié)議的請求,如果服務(wù)端支持升級協(xié)議會(huì)做如下響應(yīng)
返回:
Status Code: 101 Switching Protocols 表示支持切換協(xié)議
# Response Headers Connection: upgrade Date: Fri, 09 Aug 2019 07:36:59 GMT Sec-WebSocket-Accept: mB5emvxi2jwTUhDdlRtADuBax9E= Server: nginx/1.12.1 Upgrade: websocket- 升級協(xié)議完成以后,客戶端和服務(wù)器就可以相互發(fā)送數(shù)據(jù)
3、如何實(shí)現(xiàn)基于webSocket的長連接系統(tǒng)
3.1 使用go實(shí)現(xiàn)webSocket服務(wù)端
3.1.1 啟動(dòng)端口監(jiān)聽
- websocket需要監(jiān)聽端口,所以需要在golang 成功的 main 函數(shù)中用協(xié)程的方式去啟動(dòng)程序
- main.go 實(shí)現(xiàn)啟動(dòng)
- init_acc.go 啟動(dòng)程序
3.1.2 升級協(xié)議
- 客戶端是通過http請求發(fā)送到服務(wù)端,我們需要對http協(xié)議進(jìn)行升級為websocket協(xié)議
- 對http請求協(xié)議進(jìn)行升級 golang 庫gorilla/websocket 已經(jīng)做得很好了,我們直接使用就可以了
- 在實(shí)際使用的時(shí)候,建議每個(gè)連接使用兩個(gè)協(xié)程處理客戶端請求數(shù)據(jù)和向客戶端發(fā)送數(shù)據(jù),雖然開啟協(xié)程會(huì)占用一些內(nèi)存,但是讀取分離,減少收發(fā)數(shù)據(jù)堵塞的可能
- init_acc.go
3.1.3 客戶端連接的管理
- 當(dāng)前程序有多少用戶連接,還需要對用戶廣播的需要,這里我們就需要一個(gè)管理者(clientManager),處理這些事件:
- 記錄全部的連接、登錄用戶的可以通過 appId+uuid 查到用戶連接
- 使用map存儲(chǔ),就涉及到多協(xié)程并發(fā)讀寫的問題,所以需要加讀寫鎖
- 定義四個(gè)channel ,分別處理客戶端建立連接、用戶登錄、斷開連接、全員廣播事件
3.1.4 注冊客戶端的socket的寫的異步處理程序
- 防止發(fā)生程序崩潰,所以需要捕獲異常
- 為了顯示異常崩潰位置這里使用string(debug.Stack())打印調(diào)用堆棧信息
- 如果寫入數(shù)據(jù)失敗了,可能連接有問題,就關(guān)閉連接
- client.go
3.1.5 注冊客戶端的socket的讀的異步處理程序
- 循環(huán)讀取客戶端發(fā)送的數(shù)據(jù)并處理
- 如果讀取數(shù)據(jù)失敗了,關(guān)閉channel
- client.go
3.1.6 接收客戶端數(shù)據(jù)并處理
-
約定發(fā)送和接收請求數(shù)據(jù)格式,為了js處理方便,采用了json的數(shù)據(jù)格式發(fā)送和接收數(shù)據(jù)(人類可以閱讀的格式在工作開發(fā)中使用是比較方便的)
-
登錄發(fā)送數(shù)據(jù)示例:
- 登錄響應(yīng)數(shù)據(jù)示例:
-
websocket是雙向的數(shù)據(jù)通訊,可以連續(xù)發(fā)送,如果發(fā)送的數(shù)據(jù)需要服務(wù)端回復(fù),就需要一個(gè)seq來確定服務(wù)端的響應(yīng)是回復(fù)哪一次的請求數(shù)據(jù)
-
cmd 是用來確定動(dòng)作,websocket沒有類似于http的url,所以規(guī)定 cmd 是什么動(dòng)作
-
目前的動(dòng)作有:login/heartbeat 用來發(fā)送登錄請求和連接保活(長時(shí)間沒有數(shù)據(jù)發(fā)送的長連接容易被瀏覽器、移動(dòng)中間商、nginx、服務(wù)端程序斷開)
-
為什么需要AppId,UserId是表示用戶的唯一字段,設(shè)計(jì)的時(shí)候?yàn)榱俗龀赏ㄓ眯?#xff0c;設(shè)計(jì)AppId用來表示用戶在哪個(gè)平臺(tái)登錄的(web、app、ios等),方便后續(xù)擴(kuò)展
-
request_model.go 約定的請求數(shù)據(jù)格式
- response_model.go
3.1.7 使用路由的方式處理客戶端的請求數(shù)據(jù)
- 使用路由的方式處理由客戶端發(fā)送過來的請求數(shù)據(jù)
- 以后添加請求類型以后就可以用類是用http相類似的方式(router-controller)去處理
- acc_routers.go
3.1.8 防止內(nèi)存溢出和Goroutine不回收
- 定時(shí)任務(wù)清除超時(shí)連接
沒有登錄的連接和登錄的連接6分鐘沒有心跳則斷開連接
client_manager.go
// 定時(shí)清理超時(shí)連接 func ClearTimeoutConnections() {currentTime := uint64(time.Now().Unix())for client := range clientManager.Clients {if client.IsHeartbeatTimeout(currentTime) {fmt.Println("心跳時(shí)間超時(shí) 關(guān)閉連接", client.Addr, client.UserId, client.LoginTime, client.HeartbeatTime)client.Socket.Close()}} }- 讀寫的Goroutine有一個(gè)失敗,則相互關(guān)閉
write()Goroutine寫入數(shù)據(jù)失敗,關(guān)閉c.Socket.Close()連接,會(huì)關(guān)閉read()Goroutine
read()Goroutine讀取數(shù)據(jù)失敗,關(guān)閉close(c.Send)連接,會(huì)關(guān)閉write()Goroutine - 客戶端主動(dòng)關(guān)閉
關(guān)閉讀寫的Goroutine
從ClientManager刪除連接 - 監(jiān)控用戶連接、Goroutine數(shù)
十個(gè)內(nèi)存溢出有九個(gè)和Goroutine有關(guān)
添加一個(gè)http的接口,可以查看系統(tǒng)的狀態(tài),防止Goroutine不回收
查看系統(tǒng)狀態(tài) - Nginx 配置不活躍的連接釋放時(shí)間,防止忘記關(guān)閉的連接
- 使用 pprof 分析性能、耗時(shí)
3.2 使用javaScript實(shí)現(xiàn)webSocket客戶端
3.2.1 啟動(dòng)并注冊監(jiān)聽程序
- js 建立連接,并處理連接成功、收到數(shù)據(jù)、斷開連接的事件處理
3.2.2 發(fā)送數(shù)據(jù)
- 需要注意:連接建立成功以后才可以發(fā)送數(shù)據(jù)
- 建立連接以后由客戶端向服務(wù)器發(fā)送數(shù)據(jù)示例
4、goWebSocket 項(xiàng)目
4.1 項(xiàng)目說明
-
本項(xiàng)目是基于webSocket實(shí)現(xiàn)的分布式IM系統(tǒng)
-
客戶端隨機(jī)分配用戶名,所有人進(jìn)入一個(gè)聊天室,實(shí)現(xiàn)群聊的功能
-
單臺(tái)機(jī)器(24核128G內(nèi)存)支持百萬客戶端連接
-
支持水平部署,部署的機(jī)器之間可以相互通訊
-
項(xiàng)目架構(gòu)圖
4.2 項(xiàng)目依賴
- 本項(xiàng)目只需要使用 redis 和 golang
- 本項(xiàng)目使用govendor管理依賴,克隆本項(xiàng)目就可以直接使用
4.3 項(xiàng)目啟動(dòng)
- 克隆項(xiàng)目
- 修改項(xiàng)目配置
- 配置文件說明
- 啟動(dòng)項(xiàng)目
- 進(jìn)入IM聊天地址
http://127.0.0.1:8080/home/index - 到這里,就可以體驗(yàn)到基于webSocket的IM系統(tǒng)
5、webSocket項(xiàng)目Nginx配置
5.1 為什么要配置Nginx
- 使用nginx實(shí)現(xiàn)內(nèi)外網(wǎng)分離,對外只暴露Nginx的Ip(一般的互聯(lián)網(wǎng)企業(yè)會(huì)在nginx之前加一層LVS做負(fù)載均衡),減少入侵的可能
- 使用Nginx可以利用Nginx的負(fù)載功能,前端再使用的時(shí)候只需要連接固定的域名,通過Nginx將流量分發(fā)了到不同的機(jī)器
- 同時(shí)我們也可以使用Nginx的不同的負(fù)載策略(輪詢、weight、ip_hash)
5.2 nginx配置
- 使用域名 im.91vh.com 為示例,參考配置
- 一級目錄im.91vh.com/acc 是給webSocket使用,是用nginx stream轉(zhuǎn)發(fā)功能(nginx 1.3.31 開始支持,使用Tengine配置也是相同的),轉(zhuǎn)發(fā)到golang 8089 端口處理
- 其它目錄是給HTTP使用,轉(zhuǎn)發(fā)到golang 8080 端口處理
5.3 問題處理
- 運(yùn)行nginx測試命令,查看配置文件是否正確
- 如果出現(xiàn)錯(cuò)誤
- 處理方法
- 在nginx.com添加
- 原因:Nginx代理webSocket的時(shí)候就會(huì)遇到Nginx的設(shè)計(jì)問題 End-to-end and Hop-by-hop Headers
6、壓測
6.1 Linux內(nèi)核優(yōu)化
- 設(shè)置文件打開句柄數(shù)
- 設(shè)置sockets連接參數(shù)
6.2 壓測準(zhǔn)備
-
待壓測,如果大家有壓測的結(jié)果歡迎補(bǔ)充
-
后續(xù)會(huì)出專門的教程,從申請機(jī)器、寫壓測用例、內(nèi)核優(yōu)化、得出壓測數(shù)據(jù)
-
關(guān)于壓測請移步 go-stress-testing,從申請機(jī)器開始,優(yōu)化內(nèi)核,部署項(xiàng)目壓測,解釋壓測的原理
6.3 壓測數(shù)據(jù)
- 項(xiàng)目在實(shí)際使用的時(shí)候,每個(gè)連接約占 24Kb內(nèi)存,一個(gè)Goroutine 約占11kb
- 支持百萬連接需要22G內(nèi)存
| 1W | ||||
| 10W | ||||
| 100W |
7、如何基于webSocket實(shí)現(xiàn)一個(gè)分布式Im
7.1 說明
-
參考本項(xiàng)目源碼
-
gowebsocket v1.0.0 單機(jī)版Im系統(tǒng)
-
gowebsocket v2.0.0 分布式Im系統(tǒng)
-
為了方便演示,IM系統(tǒng)和webSocket(acc)系統(tǒng)合并在一個(gè)系統(tǒng)中
-
IM系統(tǒng)接口:
獲取全部在線的用戶,查詢單前服務(wù)的全部用戶+集群中服務(wù)的全部用戶
發(fā)送消息,這里采用的是http接口發(fā)送(微信網(wǎng)頁版發(fā)送消息也是http接口),這里考慮主要是兩點(diǎn):
1.服務(wù)分離,讓acc系統(tǒng)盡量的簡單一點(diǎn),不摻雜其它業(yè)務(wù)邏輯
2.發(fā)送消息是走h(yuǎn)ttp接口,不使用webSocket連接,才用收和發(fā)送數(shù)據(jù)分離的方式,可以加快收發(fā)數(shù)據(jù)的效率
7.2 架構(gòu)
- 項(xiàng)目啟動(dòng)注冊和用戶連接時(shí)序圖
- 其它系統(tǒng)(IM、任務(wù))向webSocket(acc)系統(tǒng)連接的用戶發(fā)送消息時(shí)序圖
7.3 分布式系統(tǒng)部署
- 用水平部署兩個(gè)項(xiàng)目(gowebsocket和gowebsocket1)演示分部署
- 項(xiàng)目之間如何相互通訊:項(xiàng)目啟動(dòng)以后將項(xiàng)目Ip、rpcPort注冊到redis中,讓其它項(xiàng)目可以發(fā)現(xiàn),需要通訊的時(shí)候使用gRpc進(jìn)行通訊
- gowebsocket
- gowebsocket1
- Nginx配置
在之前Nginx配置項(xiàng)中添加第二臺(tái)機(jī)器的Ip和端口
upstream go-im {server 127.0.0.1:8080 weight=1 max_fails=2 fail_timeout=10s;server 127.0.0.1:8081 weight=1 max_fails=2 fail_timeout=10s;keepalive 16; }upstream go-acc {server 127.0.0.1:8089 weight=1 max_fails=2 fail_timeout=10s;server 127.0.0.1:8090 weight=1 max_fails=2 fail_timeout=10s;keepalive 16; }- 配置完成以后重啟Nginx
- 重啟以后請求,驗(yàn)證是否符合預(yù)期:
查看請求是否落在兩個(gè)項(xiàng)目上
實(shí)驗(yàn)兩個(gè)用戶分別連接不同的項(xiàng)目(gowebsocket和gowebsocket1)是否也可以相互發(fā)送消息
- 關(guān)于分布式部署
本項(xiàng)目只是演示了這個(gè)項(xiàng)目如何分布式部署,以及分布式部署以后模塊如何進(jìn)行相互通訊
完全解決系統(tǒng)沒有單點(diǎn)的故障,還需 Nginx集群、redis cluster等
8、回顧和反思
8.1 在其它系統(tǒng)應(yīng)用
- 本系統(tǒng)設(shè)計(jì)的初衷就是:和客戶端保持一個(gè)長連接、對外部系統(tǒng)兩個(gè)接口(查詢用戶是否在線、給在線的用戶推送消息),實(shí)現(xiàn)業(yè)務(wù)的分離
- 只有和業(yè)務(wù)分離可,才可以供多個(gè)業(yè)務(wù)使用,而不是每個(gè)業(yè)務(wù)都建立一個(gè)長連接
8.2 已經(jīng)實(shí)現(xiàn)的功能
- gin log日志(請求日志+debug日志)
- 讀取配置文件 完成
- 定時(shí)腳本,清理過期未心跳連接 完成
- http接口,獲取登錄、連接數(shù)量 完成
- http接口,發(fā)送push、查詢有多少人在線 完成
- grpc 程序內(nèi)部通訊,發(fā)送消息 完成
- appIds 一個(gè)用戶在多個(gè)平臺(tái)登錄
- 界面,把所有在線的人拉倒一個(gè)群里面,發(fā)送消息 完成
- 單聊、群聊 完成
- 實(shí)現(xiàn)分布式,水平擴(kuò)張 完成
- 壓測腳本
- 文檔整理
- 文檔目錄、百萬長連接的實(shí)現(xiàn)、為什么要實(shí)現(xiàn)一個(gè)IM、怎么實(shí)現(xiàn)一個(gè)Im
- 架構(gòu)圖以及擴(kuò)展
IM實(shí)現(xiàn)細(xì)節(jié):
- 定義文本消息結(jié)構(gòu) 完成
- html發(fā)送文本消息 完成
- 接口接收文本消息并發(fā)送給全體 完成
- html接收到消息 顯示到界面 完成
- 界面優(yōu)化 需要持續(xù)優(yōu)化
- 有人加入以后廣播全體 完成
- 定義加入聊天室的消息結(jié)構(gòu) 完成
- 引入機(jī)器人 待定
8.2 需要完善、優(yōu)化
- 登錄,使用微信登錄 獲取昵稱、頭像等
- 有賬號(hào)系統(tǒng)、資料系統(tǒng)
- 界面優(yōu)化、適配手機(jī)端
- 消息 文本消息(支持表情)、圖片、語音、視頻消息
- 微服務(wù)注冊、發(fā)現(xiàn)、熔斷等
- 添加配置項(xiàng),單臺(tái)機(jī)器最大連接數(shù)量
8.3 總結(jié)
- 雖然實(shí)現(xiàn)了一個(gè)分布式在聊天的IM,但是有很多細(xì)節(jié)沒有處理(登錄沒有鑒權(quán)、界面還待優(yōu)化等),但是可以通過這個(gè)示例可以了解到:通過WebSocket解決很多業(yè)務(wù)上需求
- 本文雖然號(hào)稱單臺(tái)機(jī)器能有百萬長連接(內(nèi)存上能滿足),但是實(shí)際在場景遠(yuǎn)比這個(gè)復(fù)雜(cpu有些壓力),當(dāng)然了如果你有這么大的業(yè)務(wù)量可以購買更多的機(jī)器更好的去支撐你的業(yè)務(wù),本程序只是演示如何在實(shí)際工作用使用webSocket.
- 參考本文,你可以實(shí)現(xiàn)出來符合你需要的程序
9、參考文獻(xiàn)
維基百科 WebSocket
阮一峰 WebSocket教程
WebSocket協(xié)議:5分鐘從入門到精通
go-stress-testing 單臺(tái)機(jī)器100w連接壓測實(shí)戰(zhàn)
github 搜:link1st 查看項(xiàng)目 gowebsocket
https://github.com/link1st/gowebsocket
總結(jié)
以上是生活随笔為你收集整理的基于websocket单台机器支持百万连接分布式聊天(IM)系统的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 二进制的学习总结
- 下一篇: win10打开计算机黑屏怎么办,win1