mysql数据库建新分区_mysql数据库分区
日常開發(fā)中我們經(jīng)常會遇到大表的情況,所謂的大表是指存儲了百萬級乃至千萬級條記錄的表。這樣的表過于龐大,導(dǎo)致數(shù)據(jù)庫在查詢和插入的時候耗時太長,性能低下,如果涉及聯(lián)合查詢的情況,性能會更加糟糕。分表和表分區(qū)的目的就是減少數(shù)據(jù)庫的負(fù)擔(dān),提高數(shù)據(jù)庫的效率,通常點(diǎn)來講就是提高表的增刪改查效率。
什么是分表?
分表是將一個大表按照一定的規(guī)則分解成多張具有獨(dú)立存儲空間的實體表,我們可以稱為子表,每個表都對應(yīng)三個文件,MYD數(shù)據(jù)文件,.MYI索引文件,.frm表結(jié)構(gòu)文件。這些子表可以分布在同一塊磁盤上,也可以在不同的機(jī)器上。app讀寫的時候根據(jù)事先定義好的規(guī)則得到對應(yīng)的子表名,然后去操作它。
什么是分區(qū)?
分區(qū)和分表相似,都是按照規(guī)則分解表。不同在于分表將大表分解為若干個獨(dú)立的實體表,而分區(qū)是將數(shù)據(jù)分段劃分在多個位置存放,可以是同一塊磁盤也可以在不同的機(jī)器。分區(qū)后,表面上還是一張表,但數(shù)據(jù)散列到多個位置了。app讀寫的時候操作的還是大表名字,db自動去組織分區(qū)的數(shù)據(jù)。
mysql分表和分區(qū)有什么聯(lián)系呢?
1.都能提高mysql的性高,在高并發(fā)狀態(tài)下都有一個良好的表現(xiàn)。
2.分表和分區(qū)不矛盾,可以相互配合的,對于那些大訪問量,并且表數(shù)據(jù)比較多的表,我們可以采取分表和分區(qū)結(jié)合的方式(如果merge這種分表方式,不能和分區(qū)配合的話,可以用其他的分表試),訪問量不大,但是表數(shù)據(jù)很多的表,我們可以采取分區(qū)的方式等。
3.分表技術(shù)是比較麻煩的,需要手動去創(chuàng)建子表,app服務(wù)端讀寫時候需要計算子表名。采用merge好一些,但也要創(chuàng)建子表和配置子表間的union關(guān)系。
4.表分區(qū)相對于分表,操作方便,不需要創(chuàng)建子表。
分區(qū)又可以分為兩種:
水平分區(qū)(Horizontal Partitioning)
這種形式分區(qū)是對表的行進(jìn)行分區(qū),通過這樣的方式不同分組里面的物理列分割的數(shù)據(jù)集得以組合,從而進(jìn)行個體分割(單分區(qū))或集體分割(1個或多個分區(qū))。所有在表中定義的列在每個數(shù)據(jù)集中都能找到,
所以表的特性依然得以保持。
舉個簡單例子:一個包含十年發(fā)票記錄的表可以被分區(qū)為十個不同的分區(qū),每個分區(qū)包含的是其中一年的記錄。(注:這里具體使用的分區(qū)方式我們后面再說,可以先說一點(diǎn),一定要通過某個屬性列來分割,譬如這里使用的列就是年份)
垂直分區(qū)(Vertical Partitioning)
這種分區(qū)方式一般來說是通過對表的垂直劃分來減少目標(biāo)表的寬度,使某些特定的列被劃分到特定的分區(qū),每個分區(qū)都包含了其中的列所對應(yīng)的行。
舉個簡單例子:一個包含了大text和BLOB列的表,這些text和BLOB列又不經(jīng)常被訪問,這時候就要把這些不經(jīng)常使用的text和BLOB了劃分到另一個分區(qū),在保證它們數(shù)據(jù)相關(guān)性的同時還能提高訪問速度。
分區(qū)表的原理
分區(qū)表是由多個相關(guān)的底層表實現(xiàn),這些底層表也是由句柄對象表示,所以我們也可以直接訪問各個分區(qū),存儲引擎管理分區(qū)的各個底層表和管理普通表一樣(所有的底層表都必須使用相同的存儲引擎),分區(qū)表的索引只是在各個底層表上各自加上一個相同的索引,從存儲引擎的角度來看,底層表和一個普通表沒有任何不同,存儲引擎也無須知道這是一個普通表還是一個分區(qū)表的一部分。
在分區(qū)表上的操作按照下面的操作邏輯進(jìn)行:
select查詢:
當(dāng)查詢一個分區(qū)表的時候,分區(qū)層先打開并鎖住所有的底層表,優(yōu)化器判斷是否可以過濾部分分區(qū),然后再調(diào)用對應(yīng)的存儲引擎接口訪問各個分區(qū)的數(shù)據(jù)
insert操作:
當(dāng)寫入一條記錄時,分區(qū)層打開并鎖住所有的底層表,然后確定哪個分區(qū)接受這條記錄,再將記錄寫入對應(yīng)的底層表
delete操作:
當(dāng)刪除一條記錄時,分區(qū)層先打開并鎖住所有的底層表,然后確定數(shù)據(jù)對應(yīng)的分區(qū),最后對相應(yīng)底層表進(jìn)行刪除操作
update操作:
當(dāng)更新一條數(shù)據(jù)時,分區(qū)層先打開并鎖住所有的底層表,mysql先確定需要更新的記錄在哪個分區(qū),然后取出數(shù)據(jù)并更新,再判斷更新后的數(shù)據(jù)應(yīng)該放在哪個分區(qū),然后對底層表進(jìn)行寫入操作,并對原數(shù)據(jù)所在的底層表進(jìn)行刪除操作
雖然每個操作都會打開并鎖住所有的底層表,但這并不是說分區(qū)表在處理過程中是鎖住全表的,如果存儲引擎能夠自己實現(xiàn)行級鎖,如:innodb,則會在分區(qū)層釋放對應(yīng)的表鎖,這個加鎖和解鎖過程與普通Innodb上的查詢類似。
在下面的場景中,分區(qū)可以起到非常大的作用:
A:表非常大以至于無法全部都放在內(nèi)存中,或者只在表的最后部分有熱點(diǎn)數(shù)據(jù),其他都是歷史數(shù)據(jù)
B:分區(qū)表的數(shù)據(jù)更容易維護(hù),如:想批量刪除大量數(shù)據(jù)可以使用清除整個分區(qū)的方式。另外,還可以對一個獨(dú)立分區(qū)進(jìn)行優(yōu)化、檢查、修復(fù)等操作
C:分區(qū)表的數(shù)據(jù)可以分布在不同的物理設(shè)備上,從而高效地利用多個硬件設(shè)備
D:可以使用分區(qū)表來避免某些特殊的瓶頸,如:innodb的單個索引的互斥訪問,ext3文件系統(tǒng)的inode鎖競爭等
E:如果需要,還可以備份和恢復(fù)獨(dú)立的分區(qū),這在非常大的數(shù)據(jù)集的場景下效果非常好
F:優(yōu)化查詢,在where字句中包含分區(qū)列時,可以只使用必要的分區(qū)來提高查詢效率,同時在涉及sum()和count()這類聚合函數(shù)的查詢時,可以在每個分區(qū)上面并行處理,最終只需要匯總所有分區(qū)得到的結(jié)果。
mysql數(shù)據(jù)庫的分區(qū)總是把null當(dāng)作比任何非null更小的值,這和數(shù)據(jù)庫中處理null值的order by操作是一樣的,升序排序時null總是在最前面,因此對于不同的分區(qū)類型,mysql數(shù)據(jù)庫對于null的處理也各不相同。對于range分區(qū),如果向分區(qū)列插入了null,則mysql數(shù)據(jù)庫會將該值放入最左邊的分區(qū),注意,如果刪除分區(qū),分區(qū)下的所有內(nèi)容都從磁盤中刪掉了,null所在分區(qū)被刪除,null值也就跟著被刪除了。在list分區(qū)下要使用null,則必須顯式地定義在分區(qū)的散列值中,否則插入null時會報錯。hash和key分區(qū)對于null的處理方式和range,list分區(qū)不一樣,任何分區(qū)函數(shù)都會將null返回為0.
分區(qū)
分區(qū)就是將數(shù)據(jù)庫或其構(gòu)成元素劃分為不同的獨(dú)立部分
--是一種預(yù)先組織表存儲的方法
mysql支持水平分區(qū)
將特定表行分配為行的子集
分區(qū)的分布是跨物理存儲進(jìn)行的
--根據(jù)用戶在需要時設(shè)置的指定規(guī)則
--每個分區(qū)存儲為其自己的單元
數(shù)據(jù)的劃分
--根據(jù)分區(qū)功能將數(shù)據(jù)劃分為子集
--分區(qū)類型和表達(dá)式是表定義的一部分
--表達(dá)式可以是整數(shù)或返回整數(shù)值的函數(shù)。
--此值根據(jù)定義確定將每條記錄存儲在哪個分區(qū)中
1.primary key和unique key必須包含在分區(qū)key的一部分,否則在創(chuàng)建primary key和unique index時會報”ERROR 1503 (HY000)“
2.范圍分區(qū)添加分區(qū)只能在最大值后面追加分區(qū)
3.所有分區(qū)的engine必須一樣
4.范圍分區(qū)分區(qū)字段:integer、數(shù)值表達(dá)式、日期列,日期函數(shù)表達(dá)式(如year(),to_days(),to_seconds(),unix_timestamp())
分表的幾種方式:
1、mysql集群
它并不是分表,但起到了和分表相同的作用。集群可分擔(dān)數(shù)據(jù)庫的操作次數(shù),將任務(wù)分擔(dān)到多臺數(shù)據(jù)庫上。集群可以讀寫分離,減少讀寫壓力。從而提升數(shù)據(jù)庫性能。
2、自定義規(guī)則分表
分區(qū)的類型
range 根據(jù)屬于指定范圍的列值將行分配到分區(qū)
list 根據(jù)與離散值集之一匹配的列將行分配到分區(qū)
hash 基于由用戶定義的表達(dá)式返回的值而選擇的分區(qū),對要插入表中的行的列值進(jìn)行操作
key 與hash類似,不同之處在于僅提供要評估的一個或多個列
Composite(復(fù)合模式) –以上模式的組合使用
InnoDB foreign keys and MySQL partitioning are not compatible. Partitioned InnoDB tables cannot have foreign key references, nor can they have columns referenced by foreign keys. InnoDB tables which have or which are referenced by foreign keys cannot be partitioned.
分區(qū)的幾種方式實踐:
Range:
create table range(
id int(11),
money int(11) unsigned not null,
date datetime
)partition by range(year(date))(
partition p2007 values less than (2008),
partition p2008 values less than (2009),
partition p2009 values less than (2010)
partition p2010 values less than maxvalue
);
List:
create table list(
a int(11),
b int(11)
)(partition by list (b)
partition p0 values in (1,3,5,7,9),
partition p1 values in (2,4,6,8,0)
);
Hash:
create table hash(
a int(11),
b datetime
)partition by hash (YEAR(b)
partitions 4;
Key:
create table t_key(
a int(11),
b datetime)
partition by key (b)
partitions 4;
分區(qū)管理
新增分區(qū)
ALTER TABLE sale_data
ADD PARTITION (PARTITION p201010 VALUES LESS THAN (201011));
刪除分區(qū)
--當(dāng)刪除了一個分區(qū),也同時刪除了該分區(qū)中所有的數(shù)據(jù)。
ALTER TABLE sale_data DROP PARTITION p201010;
分區(qū)的合并
下面的SQL,將p201001 - p201009 合并為3個分區(qū)p2010Q1 - p2010Q3
ALTER TABLE sale_data
REORGANIZE PARTITION p201001,p201002,p201003,
p201004,p201005,p201006,
p201007,p201008,p201009 INTO
(
PARTITION p2010Q1 VALUES LESS THAN (201004),
PARTITION p2010Q2 VALUES LESS THAN (201007),
PARTITION p2010Q3 VALUES LESS THAN (201010)
);
轉(zhuǎn)載鏈接:https://www.zhihu.com/question/38418707/answer/579911085
總結(jié)
以上是生活随笔為你收集整理的mysql数据库建新分区_mysql数据库分区的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 淘宝 oracle mysql_Orac
- 下一篇: linux cmake编译源码,linu