MySQL分区分表 原理详解
MySQL分區(qū)分表
為什么要分區(qū)和分表
我們的數(shù)據(jù)庫(kù)數(shù)據(jù)越來(lái)越大,隨之而來(lái)的是單個(gè)表中數(shù)據(jù)太多,以至于查詢速度過(guò)慢,而且由于表的鎖機(jī)制導(dǎo)致應(yīng)用操作也受到嚴(yán)重影響,出現(xiàn)數(shù)據(jù)庫(kù)性能瓶頸。
MySQL中有一種機(jī)制是表鎖定和行鎖定,是為了保證數(shù)據(jù)的完整性。表鎖定表示你們都不能對(duì)這張表進(jìn)行操作,必須等我對(duì)表操作完才行。行鎖定也一樣,別的sql必須等我對(duì)這條數(shù)據(jù)操作完了,才能對(duì)這條數(shù)據(jù)進(jìn)行操縱。但出現(xiàn)這種情況時(shí),我們可以考慮分表或者分區(qū)。
1、分表
什么是分表
分表是將一個(gè)大表按照一定的規(guī)則分解成多張具有獨(dú)立存儲(chǔ)空間的實(shí)體表,每個(gè)表都對(duì)應(yīng)三個(gè)文件,MYD數(shù)據(jù)文件,MYI索引文件,frm表結(jié)構(gòu)文件。這些表可以分布在同一塊磁盤上,也可以在不同的機(jī)器上。app讀寫的時(shí)候根據(jù)事先定義好的規(guī)則得到對(duì)應(yīng)的表名,然后去操作他。
用單個(gè)數(shù)據(jù)庫(kù)表進(jìn)行拆分,拆分成多個(gè)數(shù)據(jù)表,然后用戶訪問(wèn)的時(shí)候,根據(jù)一定的算法(如用hash算法的方式,也可以用求余(取模)的方式),讓用戶訪問(wèn)不同的表,這樣數(shù)據(jù)分散到多個(gè)數(shù)據(jù)表中,減少了單個(gè)表的訪問(wèn)壓力,提升了數(shù)據(jù)庫(kù)的訪問(wèn)性能。分表的目的就在于此,減少數(shù)據(jù)庫(kù)的負(fù)擔(dān),縮短查詢時(shí)間。
2、分區(qū)
什么是分區(qū)
分區(qū)和分表相似,都是按照規(guī)則分解表。不同在與分表將大表分解若干個(gè)獨(dú)立的實(shí)體表,而分區(qū)是將數(shù)據(jù)分段劃分在多個(gè)位置存放,分區(qū)后,表還是一張表,但數(shù)據(jù)散列到多個(gè)位置了。app讀寫的時(shí)候操作還是表名子,db自動(dòng)去組織分區(qū)的數(shù)據(jù)。
MySQL的分區(qū)類型
1、RANGE分區(qū)
基于屬于一個(gè)給定連續(xù)區(qū)間的列值,把多行分配給給分區(qū)。這些區(qū)間要連續(xù)且不能相互重疊,使用values less than操作符進(jìn)行定義。
2、LIST分區(qū)
類似于按RANGE分區(qū),區(qū)別在于LIST分區(qū)是基于列值匹配一個(gè)離散值集合中的某個(gè)值來(lái)進(jìn)行選擇。
LIST分區(qū)通過(guò)使用“PARTITION BY LIST"(expr)來(lái)實(shí)現(xiàn),其中expr 是某列值或一個(gè)基于某個(gè)列值、并返回一個(gè)整數(shù)值的表達(dá)式,然后通過(guò):VALUES IN (value_list)”的方式來(lái)定義某個(gè)分區(qū),其中“value——list“是一個(gè)通過(guò)逗號(hào)分隔的整數(shù)列表。
3、Hash分區(qū)
這種模式允許DBA通過(guò)對(duì)表的一個(gè)或多個(gè)列的Hash Key進(jìn)行計(jì)算,最后通過(guò)這個(gè)Hash碼不同的數(shù)值對(duì)應(yīng)的數(shù)據(jù)區(qū)域進(jìn)行分區(qū)。
hash分區(qū)的目的是將數(shù)據(jù)均勻分步到預(yù)先定義的各個(gè)分區(qū)中,保證各分區(qū)的數(shù)據(jù)的數(shù)據(jù)量大致一致。在RANGE和LIST分區(qū)中,必須明確指定一個(gè)給定的列值或列值集合應(yīng)該保存在哪一個(gè)分區(qū)中;而在RANGE和LIST分區(qū)中MySQL自動(dòng)完成這個(gè)動(dòng)作,用戶所要定一個(gè)列值或者表達(dá)式,以及指定被分區(qū)的表將要被分割成分區(qū)的數(shù)量。
4、Key分區(qū)
Key分區(qū)和Hash相似,不同在于hash分區(qū)是用戶自定義函數(shù)進(jìn)行分區(qū),Key分區(qū)使用mysql數(shù)據(jù)庫(kù)提供的分區(qū)進(jìn)行分區(qū),NDB clust使用MD5函數(shù)進(jìn)行分區(qū),對(duì)于其他存儲(chǔ)引擎mysql使用內(nèi)部的hash函數(shù)。
MySQL分表和分區(qū)有什么區(qū)別
1、實(shí)現(xiàn)方式上
1、mysql的分表是真正意義上的分表,一張表分成很多表以后,每一個(gè)小表都是完整的一張表,都對(duì)應(yīng)三個(gè)文件,一個(gè)是MYD數(shù)據(jù)文件,MYI索引文件,frm表結(jié)構(gòu)文件
2、分區(qū)不一樣,一張大表進(jìn)行分區(qū)后,他還是一張表,不會(huì)變成二張表,但是他存放數(shù)據(jù)的區(qū)塊變多了。
2、在數(shù)據(jù)上
1、分表后,數(shù)據(jù)都是存放在分表里,總表只是一個(gè)外殼,存放數(shù)據(jù)發(fā)生在一個(gè)一個(gè)的分表里。
2、分區(qū)呢,不存在分表的概念,分區(qū)只不過(guò)把存放數(shù)據(jù)的文件分成許多的小塊,分區(qū)后的表呢,還是一張表,數(shù)據(jù)處理還是有自己完成。
3、提高性能上
1、分表后,單表的并發(fā)能力提高了,磁盤IO性能提高了。
為什么并發(fā)提高了,因?yàn)椴樵円淮嗡ǖ臅r(shí)間變短了,如果出現(xiàn)高并發(fā)的花,總表可以根據(jù)不同的查詢,將并發(fā)壓力分到不同的小表里面。
2、mysql提出了分區(qū)的概念,主要是想突破磁盤的IO瓶頸,提高磁盤的讀寫能力,提高磁盤的讀寫能力來(lái)增加mysql的性能。
在這一點(diǎn)上,分區(qū)和分表的側(cè)重點(diǎn)不同,分表重點(diǎn)是存取數(shù)據(jù)時(shí),如何提高mysql并發(fā)能力上,而分區(qū)是突破磁盤的讀寫能力,從而達(dá)到提高mysql性能的目的。
4、實(shí)現(xiàn)難易程度上
1、分表的方法有很多,用merge來(lái)分表,是最簡(jiǎn)單的一種方式。這種方式跟分區(qū)的難以程度差不多,并且對(duì)程序代碼來(lái)說(shuō)可以做到透明。如果是用其他分表方式就比分區(qū)麻煩了。
2、分區(qū)實(shí)現(xiàn)是比較簡(jiǎn)單的,建立分區(qū)表,跟建平常的表沒(méi)有什么區(qū)別,并且對(duì)開(kāi)代碼端來(lái)說(shuō)是透明的。
mysql分表和分區(qū)有什么聯(lián)系
1、都是提高mysql的性能,在高并發(fā)的狀態(tài)下都有一個(gè)良好的表現(xiàn)
2、分表和分區(qū)不矛盾,可以相互配合的,對(duì)于那些大訪問(wèn)量,并且表數(shù)據(jù)比較多的表。我們可以采取分區(qū)的方式,訪問(wèn)量不大,但是表數(shù)據(jù)較多的表,我們可以采取分區(qū)的方式等。
3、分表技術(shù)是比較麻煩的,需要手動(dòng)去創(chuàng)建子表,app服務(wù)端讀寫的時(shí)候需要計(jì)算子表名。采用merge好一些,但也要?jiǎng)?chuàng)建子表和配置子表間的union關(guān)系。
4、表分區(qū)相當(dāng)于分表,操作方便,不需要?jiǎng)?chuàng)建子表。
轉(zhuǎn)載于:https://blog.51cto.com/13214087/2149994
《新程序員》:云原生和全面數(shù)字化實(shí)踐50位技術(shù)專家共同創(chuàng)作,文字、視頻、音頻交互閱讀總結(jié)
以上是生活随笔為你收集整理的MySQL分区分表 原理详解的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 豪华电动汽车品牌“歌昂” 即将登场,背后
- 下一篇: mongodb查询数据库中某个字段中的值