SQLite 简介
SQLite簡介
常見的關系型數據庫有SQLite,MySQL,SQL Server等,通常學習關系型數據庫時不會使用SQLite,但是SQLite 是世界上使用最廣泛的數據庫引擎。SQLite 內置于所有手機和大多數計算機中,并捆綁在人們每天使用的無數其他應用程序中。SQLite 是一個由C語音開發的嵌入式庫,具有小型、 快速、 自包含、 高可靠、 功能齊全等特點。
文章以3.32.2版本為例講述SQLite的一些基本知識
SQLite常用命令和示例
在命令行中使用SQLite命令,需要先執行sqlite3命令,進入SQLite提示符。
創建或打開數據庫
有兩種方法可以創建或打開數據庫,一個是在sqlite3命令后面加上數據庫路徑,另一個是使用點命令.open
sqlite3 /…/xxx.db法
通過執行這個命令進入SQLite提示符時,如果數據庫文件已經存在,則直接打開對應數據庫,否則不會立即在對應路徑創建xxx.db文件。要等到執行了添加數據表,視圖等數據庫對象的命令之后。
-
示例
先執行如下命令,此時沒有創建出comms_ease.db文件
? 再執行如下命令創建一張表,在當前目錄出現comms_ease.db文件
.open /…/xxx.db法
使用.open是一個點命令,使用它需要先執行sqlite3命令進入SQLite提示符。.open命令的使用方式也是在命令后面追加數據庫路徑,不過和sqlite3 /.../xxx.db法不同的是,執行.open命令后,數據庫文件會被直接創建出來,不需要再創建數據庫對象。
創建表
SQLite的創建語句為CREATE TABLE,完整的創建表語句內容豐富,除了創建普通表外,還能具備判斷表是否已經存在,創建臨時表等能力。常見的創建普通表的句式為。
CREATE TABLE 表名 (列1名稱 列類型 以空格隔開的一個或多個列約束, 列2名稱 列類型 以空格隔開的一個或多個列約束,... );默認情況下,一張表的最大列數為2000,每一行能存下的最大字節數為十億,能滿足絕大多數的需求,創建普通表的示例如下
CREATE TABLE table_comms_ease (id INTEGER NOT NULL PRIMARY KEY AUTOINCREMENT,value VARCHAR );例子中,創建了一個名為table_comms_ease的數據表,包含兩列,第一列是id,類型是整形,不能為空,而且是表的主鍵,并可以自動生成; 第二列是value,類型為字符串
在表名已經存在的情況下,調用CREATE TABLE 表名語句會報錯,要避免,可以使用CREATE TABLE IF NOT EXISTS 表名語句。如果不存在,則創建表,如果存在,則什么都不做。示例如下
CREATE TABLE IF NOT EXISTS table_comms_ease (id INTEGER NOT NULL PRIMARY KEY AUTOINCREMENT,value VARCHAR );如果希望臨時存儲一些數據,而且只對當前連接有效,可以試試臨時表。臨時表的創建語句為CREATE TEMP TABLE。臨時表只對當前數據庫連接有效,重新建立連接或者同時存在的其他連接都無法訪問到。示例如下
CREATE TEMP TABLE temp_table_comms_ease (id INTEGER NOT NULL PRIMARY KEY AUTOINCREMENT,value VARCHAR );其它常用點命令
點命令是SQLite數據庫獨特的命令形式,它們通常比較簡單,而且不需要以分號結尾,常見的點命令如下表所示
| .backup | 備份數據庫到文件 | .backup comms_ease_backup |
| .databases | 列出數據庫的名稱及其所依附的文件 | .databases |
| .exit | 退出SQLite提示符 | .exit |
| .help | 幫助 | .help |
| .quit | 退出SQLite提示符 | .quit |
| .show | 各種設置的值 | .show |
| .schema | 查看創建命令。以LIKE`的模式匹配參數,如果沒有參數,則查看所有表格的創建命令 | .schema .schema table% |
| .tables | 搜索表名。以LIKE`的模式匹配參數,如果沒有參數,則搜索所有表名(臨時表不會出現在結果中) | .tables .tables table% |
增
向表內添加一行,即為每一列構建一個值,并填入新的一行中。添加行的命令是INSERT,添加方式有三種,一種是指定值添加;二是添加Select語句的結果;三是默認添加。
指定值添加就是指定部分或者所有列的值,剩下列使用默認值的方式,對于沒有通過DEFAULTE,AUTOINCREMENT等方式聲明默認值的列,如果沒有指定NOT NULL則填入NULL,否則報錯。至少需要指定一列的值,如需全部填寫默認值,可以使用默認添加方式。需要注意的是,值的順序要和列的順序保持一致。示例如下:
INSERT INTO table_comms_ease (value) VALUES ('value of 1'); INSERT INTO table_comms_ease (value, id) VALUES ('value of 2', 2);如果需要指定填入所有列的值,也可以不把列名列舉出來,將值按創建表時各個列的順序列舉出來即可。示例如下:
INSERT INTO table_comms_ease VALUES (3, 'value of 3');通過添加加Select語句的結果添加一行的格式為INSERT INTO 表名 SELECT ...通過此方法添加一行時,默認值不會被自動填充,SELECT語句查出的數據量必須和表的列數一致。假設已經存在表operator包含列key和description而且某一行的key為’.backup’,description為備份數據庫到文件,給出示例如下:
INSERT INTO table_comms_ease SELECT 4, description FROM operator WHERE key IS '.backup';默認添加的格式為INSERT INTO 表名 DEFAULT VALUES;為每一列都填入默認值,如果沒有特別聲明默認值,則填入NULL。示例如下:
INSERT INTO table_comms_ease DEFAULT VALUES;通過創建表章節的示例語句創建出數據表,再依次調用上述示例語句,則數據表內會出現5行數據,如下
| 1 | value of 1 |
| 2 | value of 2 |
| 3 | value of 3 |
| 4 | 備份數據庫到文件 |
| 5 |
刪
刪除表內的一行,命令是DELETE,常用格式為
DELETE FROM 表名 WHERE 過濾語句刪除命令本身比較簡單,指定表名和刪除條件即可刪除一列,如下示例表示如果value列中的值有value of開頭,則刪除。
DELETE FROM table_comms_ease WHERE value LIKE 'value of %';如上命令操作后,table_comms_ease表還剩的數據為
| 4 | 備份數據庫到文件 |
| 5 |
改
修改表內數據的命令為UPDATE,其常用格式為
UPDATE 表名 SET 一個或多個列的賦值 WHERE 過濾語句修改多列內容時可以采用先寫出列名,再按順序賦值的方式,也可以采用一列一列修改的方式。如果要更新id為4的所在行的值,設置id為123,value為new value,兩種修改方式分別如下
UPDATE table_comms_ease SET (id, value)= (123, 'new value') WHERE id = 4;或者
UPDATE table_comms_ease SET id=123, value='new value' WHERE id = 4;修改后,table_comms_ease表中的數據為
| 5 | |
| 123 | new value |
修改單列的方法和修改多列的方法相似,比如將id為5這一行的value也修改為new value,可以如下操作
UPDATE table_comms_ease SET (value)=('new value') WHERE id = 5;或者
UPDATE table_comms_ease SET value='new value' WHERE id = 5;修改后,table_comms_ease表中的數據為
| 5 | new value |
| 123 | new value |
查
查詢語句的命令是SELECT,它不會修改數據庫,結果的行數在自然數范圍內,每一行代表一個查詢結果。SELECT命令的常用格式為
SELECT 去重策略 列名列表 FROM 表名或者子查詢語句 WHERE 過濾語句 ORDER BY 排序策略 LIMIT 數量限制查詢語句中可用的配置比較多,但是大都不是必須的。查詢table_comms_ease表的所有內容只需要如下命令即可
SELECT * FROM table_comms_ease;上面命令中的*表示所有列,命令相當于
SELECT id,value FROM table_comms_ease;結果為
| 5 | new value |
| 123 | new value |
另外,可以通過VALUES語句構建一個查詢結果,結果的列名為column1, column2, column3等等。比如
VALUES (1,2,3),('a','b','c');的結果為
| 1 | 2 | 3 |
| a | b | c |
去重策略
去重策略有兩種,一種是默認策略ALL,代表不去重;另一種是DISTINCT,代表去重。table_comms_ease表中value列的值相同,使用ALL和DISTINCT分別查詢value列時,命令和結果如下:
ALL命令
SELECT ALL * FROM table_comms_ease;結果為
| new value |
| new value |
DISTINCT命令
SELECT DISTINCT value FROM table_comms_ease;結果為
| new value |
可以看出在有重復結果時,ALL策略會保留所有結果,而DISTINCT策略只保留其中一個
表名或者子查詢語句
查詢語句的FROM關鍵字后面可以跟表名或者子查詢語句,用于限制查詢范圍。當填寫表名時,可以填寫多個表名,用逗號或者連接運算符分隔。當填寫查詢語句時,可以視為先查詢出一張表,再從此表中查詢出數據。
假設還有一張表table_comms_ease_1,列信息和table_comms_ease表相同,值為
| 1 | value of 1 in table_comms_ease_1 |
| 2 | value of 2 in table_comms_ease_1 |
則此字段填寫table_comms_ease,table_comms_ease_1時得到如下命令
SELECT * FROM table_comms_ease, table_comms_ease_1;結果為
| 5 | new value | 1 | value of 1 in table_comms_ease_1 |
| 5 | new value | 2 | value of 2 in table_comms_ease_1 |
| 123 | new value | 1 | value of 1 in table_comms_ease_1 |
| 123 | new value | 2 | value of 2 in table_comms_ease_1 |
當此字段填寫兩個子查詢語句,如一個是id為5,另一個是id為123時,則得到如下命令
SELECT * FROM (SELECT * FROM table_comms_ease WHERE iD=5), (SELECT * FROM table_comms_ease WHERE iD=123);結果為
| 5 | new value | 123 | new value |
將子查詢語句的結果視為一張表,則可以統一對兩種填寫格式的理解。另外查詢命令也支持混合填寫表名和查詢語句。
排序條件
排序條件決定了結果的排列順序,常用格式如下
ORDER BY 列名 COLLATE 比較方式 排序方式 NULL值的排序方式比較方式有三種,分別為BINARY, NOCASE和 RTRIM
- BINARY:使用標準C庫中的memcmp()函數逐字節比較
- NOCASE:先把ASC II碼中的大寫字母轉為小寫字母,再按照BINARY方式比較
- RTRIM:去掉末尾空格后按照BINARY方式比較
通過下面命令為表table_comms_ease添加幾條數據,
INSERT INTO table_comms_ease VALUES (6, 'A'), (7, 'new value '), (8, 'Z');則表中的數據變為
| 5 | new value |
| 6 | A |
| 7 | new value |
| 8 | Z |
| 123 | new value |
注意:id為7的一行對應的value的末尾有一個空格
如下示例展示了三種不同比較方式的區別
BINARY命令
SELECT * FROM table_comms_ease ORDER BY table_comms_ease.value COLLATE BINARY;結果:
| 6 | A |
| 8 | Z |
| 5 | new value |
| 123 | new value |
| 7 | new value |
NOCASE命令
SELECT * FROM table_comms_ease ORDER BY table_comms_ease.value COLLATE NOCASE;結果:
| 6 | A |
| 5 | new value |
| 123 | new value |
| 7 | new value |
| 8 | Z |
RTRIM命令
SELECT * FROM table_comms_ease ORDER BY table_comms_ease.value COLLATE RTRIM;結果:
| 6 | A |
| 8 | Z |
| 5 | new value |
| 7 | new value |
| 123 | new value |
數量限制
數量限制語句可以限制查詢結果的行數,常用格式如下
LIMIT 數量 OFFET 偏移量設數量為n,偏移量為o,則上面格式的意義是從第o+1條開始,取最多n條數據,如果沒有符合條件的數據,則結果為空。
限制數量為3,得到如下表達式
SELECT * FROM table_comms_ease LIMIT 3;結果為
| 5 | new value |
| 6 | A |
| 7 | new value |
由于表的總行數是5,所以如果限制數量≥5,則會查出整張表。
如果限制數量為3,同時指定偏移量為1,得到如下表達式
SELECT * FROM table_comms_ease LIMIT 3 OFFSET 1;結果過濾掉第一條數據(5, newvalue),并向后取3條,得到
| 6 | A |
| 7 | new value |
| 8 | Z |
如果限制數量為3,同時指定偏移量為3,得到如下表達式
SELECT * FROM table_comms_ease LIMIT 3 OFFSET 3;結果過濾掉前三條數據,并向后取3條,但是后面只有2條,所以得到
| 8 | Z |
| 123 | new value |
如果偏移量≥5,則什么都查不到
SQLite常見限制
| 字符串長度 | 1億 | 由宏SQLITE_MAX_LENGTH定義,可以提高或降低限制,最大到231-1 |
| 單行最大字節數 | 1億 | 由宏SQLITE_MAX_LENGTH定義 |
| 最大列數 | 2000 | 由宏SQLITE_MAX_COLUMN定義,可以提高或降低限制,最大到32767 |
| 語句最大長度 | 10億 | 由宏SQLITE_MAX_SQL_LENGTH定義,可以降低限制 |
| 連接中最大表數 | 64 | 不可改變 |
| 表達式樹的最大深度 | 1000 | 由宏SQLITE_MAX_EXPR_DEPTH定義,可以降低或消除限制 |
| 函數的最大參數數 | 100 | 由宏SQLITE_MAX_FUNCTION_ARG定義,可以提高,最大到 127 |
| 復合 SELECT 語句中的SELECT數 | 500 | 由宏SQLITE_MAX_COMPOUND_SELECT定義,可以降低 |
| 庫文件最大頁數 | 1073741823 | 由宏SQLITE_MAX_PAGE_COUNT定義,可以提高或降低限制,最大到4294967294。 |
| 最大數據庫大小 | 281TB | 結合最大頁數4294967294和最大頁面大小65536,得到最大數據庫大小為281TB,但是這是個理論值,未經官方驗證過。 |
| 表中的最大行數 | 2^64 | 無法達到,會先達到281TB的數據庫大小限制 |
數據庫中的B樹
B樹與B+樹簡介
B樹是一種平衡多路查找樹,每個結點包含三個部分:鍵,值,指向子結點的指針。假設一個B樹結點中有n個鍵,則它同時有n個值。如果這是一個葉子結點,則它沒有指向子結點的指針,否則有n+1個指向子結點的指針。下圖為n==2時的結點情況。
圖中鍵1和鍵2兩個值需要滿足鍵1<鍵2。 值1和值2分別與鍵1和鍵2對應;三個指向子結點的指針,分別指向具有不同范圍的鍵的子結點。子結點1中的鍵都小于鍵1;子結點2中的鍵都大于鍵1,且小于鍵2;子結點3中的鍵都大于鍵2。如下圖提供了一個3路B樹的示例。
上圖中每個結點有三排,第一排是鍵;第二排是值;第三排是指向子結點的指針。根節點有50和100兩個鍵,因此它的左子樹中結點的鍵都小于50;中子樹中結點的鍵都大于50且小于100;右子樹中結點的鍵都大于100。
B+樹和B樹類似,但是B+樹的內部結點中只有鍵和指向子結點的指針,而葉子結點具有鍵、值和指向下一組值的指針,即只在葉子結點上存儲數據。因此父結點中的鍵還會再出現在子結點上。而且B+樹的葉子結點的指向下一組值的指針,將所有值都串成了一個鏈表。由于內部結點不需要存儲值,B+樹可以存儲更多的鍵。下圖用5路B+樹存儲了上面3路B樹的內容。
B樹頁
數據庫文件由一頁或多頁組成。同一個數據庫中,每頁的大小相同,都是 在512 和 65536 之間,并且為2的整數次冪。數據庫的頁分為鎖定字節(lock-byte)頁、freelist頁、B樹頁、負載溢出頁和指針映射頁。
B樹算法為SQLite提供了鍵值存儲模式,而且保證了鍵的有序性和唯一性。SQLite數據庫中B樹的結點就是一個頁面,所以指向的子結點的指針實際上是對應頁面的頁碼。SQLite數據庫使用了兩種B樹變體,在葉子節點存儲數據的表B樹和不存儲數據的索引B樹。一顆完整的樹只能是完全的表B樹或者完全的索引B樹。
表B樹和索引B樹
表B樹類似B+樹,只將值存放在葉子結點中;索引B樹是一顆沒有值的樹,鍵就是數據本身,因此索引B樹其實類似于B樹。下表列出了它們之間的一些差異。
| 鍵長度(byte) | 8 | 最長2147483647的隨機值 |
| 值存放點 | 葉子結點 | 沒有值,鍵就是數據 |
| 值長度 | 最長2147483647 | 沒有值,鍵就是數據 |
| 葉子結點結構 | 鍵 | 鍵和值 |
| 主要使用場景 | rowid表 | 索引、WITHOUT_ROWID表 |
總結
- 上一篇: 视频“双录”全新发布,助力金融业务办理高
- 下一篇: 大道至简,SQL也可以实现神经网络