美团的DBProxy实践
本文整理自美團(tuán)技術(shù)沙龍第10期:數(shù)據(jù)庫(kù)技術(shù)架構(gòu)與實(shí)踐。
美團(tuán)技術(shù)沙龍由美團(tuán)技術(shù)團(tuán)隊(duì)主辦,每月一期,每期沙龍邀請(qǐng)美團(tuán)及其它互聯(lián)網(wǎng)公司的技術(shù)專家分享來自一線的實(shí)踐經(jīng)驗(yàn),覆蓋各主要技術(shù)領(lǐng)域。
本次沙龍主要圍繞數(shù)據(jù)庫(kù)相關(guān)的主題,內(nèi)容包括美團(tuán)數(shù)據(jù)庫(kù)自動(dòng)化運(yùn)維系統(tǒng)構(gòu)建、點(diǎn)評(píng)側(cè)MySQL自動(dòng)化服務(wù)平臺(tái)RDS、美團(tuán)數(shù)據(jù)庫(kù)中間件、和小米高級(jí)DBA帶來的Redis Cluster的大規(guī)模運(yùn)維實(shí)踐。
平仲,美團(tuán)高級(jí)DBA,現(xiàn)負(fù)責(zé)美團(tuán)數(shù)據(jù)庫(kù)中間件DBProxy的開發(fā);主要工作經(jīng)歷從事于數(shù)據(jù)庫(kù)內(nèi)核及中間件開發(fā)。
這次分享的主要內(nèi)容包括6個(gè)部分:
- 第一是我的簡(jiǎn)單介紹一下美團(tuán)DBProxy;
- 第二部分,會(huì)介紹一下美團(tuán)DBProxy的整體架構(gòu);
- 第三個(gè)是美團(tuán)DBProxy的主要模塊,主要模塊介紹我們美團(tuán)在上面的主要工作;
- 第四個(gè)部分是上線的現(xiàn)狀;
- 第五個(gè)部分是我們后續(xù)的一些安排,未來的計(jì)劃;
- 最后是QA的部分。
首先介紹一下為什么要使用DBProxy:
- 使用DBProxy之后,應(yīng)用程序只需要在連接串中設(shè)置DBProxy的地址,不需要關(guān)注整個(gè)數(shù)據(jù)庫(kù)集群的結(jié)點(diǎn);
- DBProxy內(nèi)部實(shí)現(xiàn)負(fù)載均衡,讀寫分離;
- Slave上下線的操作由DBA在自動(dòng)化運(yùn)營(yíng)系統(tǒng)上點(diǎn)一下鼠標(biāo)就能夠完成。
這樣極大的減輕了DBA和應(yīng)用開發(fā)人員的工作;而沒有DBProxy的情況下,這些工作是由RD來實(shí)現(xiàn)的,引入DBProxy對(duì)于系統(tǒng)的可管理性和便利性都有非常大的幫助。
介紹DBProxy的軟件模塊。軟件模塊分三層:
- 第一層是一個(gè)訪問控制,包括用戶處理,IP過濾等等的功能;
- 中間層是一個(gè)SQL處理的過程,包括SQL解析,SQL重寫,和SQL執(zhí)行;
- 第三層就是一個(gè)主要和DBA連接相關(guān)的一個(gè)模塊,像讀寫分離,負(fù)載均衡,連接池;
- 另外還有三個(gè)模塊是貫穿整個(gè)三層的: 第一是連接的管理,負(fù)責(zé)管理收發(fā)數(shù)據(jù)的底層連接;第二是日志的管理,第三個(gè)是監(jiān)控管理。
首先介紹一下連接的管理:根據(jù)我們鏈路比較長(zhǎng)的特點(diǎn),著重添加了對(duì)于連接異常的檢測(cè)和處理,包括:
- DBProxy上游和MGW交互的連接檢測(cè);
- DBProxy下游和MySQL連接的檢測(cè);
- DBProxy所在機(jī)器的連接檢測(cè)。
SQL處理模塊中增加了SESSION參數(shù)的功能: 客戶端分配一個(gè)DB連接的時(shí)候,如果二者SESSION級(jí)參數(shù)不一樣時(shí),首先做一個(gè)校正,校正之后才會(huì)真正執(zhí)行查詢。
連接池的管理中做了這樣的修改:將鏈表改成Hash表,其中Hash鍵是用戶名,Hash值是以用戶身份建立的連接的一個(gè)鏈表。如下圖把連接按用戶來分,client分別會(huì)分到各自u(píng)ser建立的db連接,二者互不影響,既保證了查詢的正確性,又保證了較高的性能。
下面講一下訪問控制模塊,是在我們整個(gè)軟件模型的第一層。
- 第一個(gè)是增加了一個(gè)SQL過濾的功能:
- 該功能由黑名單的方式實(shí)現(xiàn),黑名單的形式是如下邊兩個(gè)語句;
- 黑名單可以根據(jù)執(zhí)行的頻率,執(zhí)行的時(shí)間來自動(dòng)的添加,其中頻率時(shí)間,都是可以根據(jù)自己的需求動(dòng)態(tài)修改的,另外我們也提供了一個(gè)手動(dòng)添加黑名單的功能。
- 第二個(gè)個(gè)是根據(jù)后臺(tái)db的thread running進(jìn)行負(fù)載均衡,每當(dāng)分配到一個(gè)后臺(tái)的連接的時(shí)候,先檢查后臺(tái)的Thread running數(shù),直到有一個(gè)thread running數(shù)在我閾值之內(nèi)的時(shí)候才真正去分配。
- 第三個(gè)就是用戶IP限制,我們限制了用戶的host地址,相當(dāng)于進(jìn)行一個(gè)權(quán)限的控制。
- 最后一個(gè)就是從庫(kù)流量配置,我可以指定某一個(gè)用戶只能訪問某幾個(gè)從庫(kù),或者反過來說某幾個(gè)從庫(kù)只允許某幾個(gè)用戶訪問,這樣可能在一個(gè)更細(xì)的力度上對(duì)數(shù)據(jù)庫(kù)的資源進(jìn)行分配。
DBProxy的監(jiān)控體系實(shí)現(xiàn)了一個(gè)從無到有的過程,目前主要監(jiān)控一些DBProxy內(nèi)部運(yùn)行相關(guān)的一些參數(shù):
對(duì)于sharding版本,做了如下的改進(jìn):
- 首先我們把分庫(kù)變成分庫(kù)分表,并且提供了5種分庫(kù)分表的方式;
- 第二個(gè)是改進(jìn)了Lemon基本上兼容MySQL語法;
- 第三個(gè)是有限支持單個(gè)庫(kù)內(nèi)部的JOIN,經(jīng)過Lemon解析后,發(fā)現(xiàn)涉及的表都是在同一個(gè)庫(kù),那么表的JOIN是支持的;
- 同樣的道理,單庫(kù)的事務(wù)也是支持的。
- 最后一個(gè)就是增加錯(cuò)誤處理:在一個(gè)庫(kù)上面執(zhí)行出錯(cuò)的時(shí)候,會(huì)相應(yīng)有一些rollback的機(jī)制,來處理一些異常情況導(dǎo)致的執(zhí)行失敗。
Q:這方面能大概講一下怎么去改進(jìn)的? A:首先是一個(gè)語法的支持,我們就是把中間不支持語法的支持,這樣的話有些復(fù)雜的查詢,我們可以通過這個(gè)語法來進(jìn)行一些,比如說where條件的分析,可以知道分布分表的情況,然后就是表的替換。
和大家分享一下上線的現(xiàn)狀:從2015.5上線第一個(gè)版本后到現(xiàn)在已經(jīng)有87%的服務(wù)組接入了DBProxy, DBProxy也已經(jīng)經(jīng)歷了5個(gè)版本的迭代。
最后講一下未來的計(jì)劃:
- 第一個(gè)就是更強(qiáng)大的SQL處理:
- 增加一些SQL優(yōu)化,Row cache的功能;
- 分庫(kù)分表全面的SQL支持,如聚集,排序;
- 更全面的連接上下文信息;
- 第二:監(jiān)控管理要結(jié)合自動(dòng)故障處理,真正把監(jiān)控的信息智能化;
- 第三:下一個(gè)是和我們美團(tuán)自己的MHA融合,支持自動(dòng)故障切換;
- 第四:支持分布式事務(wù)。
目前DBProxy已經(jīng)開源,github地址: DBProxy
總結(jié)
以上是生活随笔為你收集整理的美团的DBProxy实践的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Java多线程与并发系列从0到1全部合集
- 下一篇: 简化Swagger使用的自制Starte