日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > 数据库 >内容正文

数据库

一、全国计算机三级数据库考试——理论知识总结(选择题)

發(fā)布時間:2023/12/9 数据库 30 豆豆
生活随笔 收集整理的這篇文章主要介紹了 一、全国计算机三级数据库考试——理论知识总结(选择题) 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

上一篇博客:https://blog.csdn.net/weixin_44940488/article/details/119349219


說明:

一、數(shù)據(jù)庫分析與設(shè)計

  • 在數(shù)據(jù)庫應(yīng)用系統(tǒng)分析與設(shè)計中,數(shù)據(jù)庫應(yīng)用系統(tǒng)的數(shù)據(jù)處理需求可以表示為事務(wù)規(guī)范事務(wù)規(guī)范包括了事務(wù)名稱、事務(wù)描述、事務(wù)所訪問的數(shù)據(jù)項事務(wù)用戶。
  • 數(shù)據(jù)庫應(yīng)用系統(tǒng)規(guī)劃與分析階段的內(nèi)容包括:
    • 任務(wù)陳述(可行性分析:技術(shù)、經(jīng)濟、操作、開發(fā)方案的選擇
    • 確定任務(wù)目標;
    • 確定系統(tǒng)范圍和邊界;
    • 確定用戶視圖。
  • 數(shù)據(jù)庫應(yīng)用系統(tǒng)(DBAS)的實施階段主要包括以下工作:
    • 創(chuàng)建數(shù)據(jù)庫
    • 裝載數(shù)據(jù)
    • 編寫與調(diào)試應(yīng)用程序
    • 數(shù)據(jù)庫試運行
  • 數(shù)據(jù)庫應(yīng)用系統(tǒng)實現(xiàn)與部署工作包括???????:
    • 建立數(shù)據(jù)庫結(jié)構(gòu)
    • 數(shù)據(jù)加載
    • 事務(wù)和應(yīng)用程序的編碼及測試
    • 系統(tǒng)集成、測試及運行;
    • 系統(tǒng)部署。
  • 數(shù)據(jù)庫物理設(shè)計內(nèi)容包括
    • 數(shù)據(jù)庫邏輯模式描述
    • 文件組織與存取設(shè)計
    • 數(shù)據(jù)分布設(shè)計:數(shù)據(jù)分布設(shè)計的任務(wù)是按照實際情況:將各種數(shù)據(jù)合理安排在不同存儲介質(zhì)中;將各種數(shù)據(jù)通過水平劃分或垂直劃分,分布存儲在各局部數(shù)據(jù)庫中,以提高數(shù)據(jù)訪問效率和數(shù)據(jù)可靠性;合理調(diào)整關(guān)系模式的規(guī)范化程度。注意,"合理調(diào)整"規(guī)范化。
    • 確定系統(tǒng)配置
    • 物理模式評估。
  • 數(shù)據(jù)安全設(shè)計主要有五個方面:
    • 安全性保護(防止非法用戶對數(shù)據(jù)庫非法的使用,其中一種主要方式即是用戶權(quán)限設(shè)計);
    • 完整性保護
    • 并發(fā)控制
    • 數(shù)據(jù)庫的備份與恢復(fù)
    • 數(shù)據(jù)加密傳輸
  • 數(shù)據(jù)庫應(yīng)用系統(tǒng)優(yōu)化內(nèi)容創(chuàng)建新的索引、模式調(diào)整。
  • 數(shù)據(jù)庫應(yīng)用系統(tǒng)日常維護內(nèi)容備份與恢復(fù)、完整性維護、安全性維護、存儲空間管理并發(fā)控制。
  • 數(shù)據(jù)庫應(yīng)用系統(tǒng)升級工作內(nèi)容改變數(shù)據(jù)庫應(yīng)用系統(tǒng)體系結(jié)構(gòu)升級DBMS版本修改程序以適應(yīng)新需求
  • 需求分析建模方法 UML、 DFD、 IDEFO
  • DFD方法由四種基本元素組成:數(shù)據(jù)流處理、數(shù)據(jù)存儲外部項。
  • IDEFO需求建模方法,描述功能活動示意圖中矩形框代表功能動,寫在矩形框內(nèi)的動詞短語描述功能活動的名稱,活動的編號按照要求寫在矩形框右下角指定的位置。左邊的輸入箭頭表示完成活動需要的數(shù)據(jù);矩形框上方的控制箭頭描述了影響這個活動執(zhí)行的事件或約束條件右邊的輸出箭頭說明由活動產(chǎn)生的結(jié)果及信息,下方進入的機制箭頭表示實施該活動的物理手段或完成活動需要的資源(計算機系統(tǒng)、人或組織)。
  • IDEFIX側(cè)重分析、抽象和概括應(yīng)用領(lǐng)域中的數(shù)據(jù)需求,被稱為數(shù)據(jù)建模方法。在IDEFIX中一個非確定聯(lián)系又稱為多對多關(guān)系m:n聯(lián)系
  • 在IDEFIX建模方法中,兩個實體集之間的多對多聯(lián)系可以通過引入第三個實體集轉(zhuǎn)化為兩個一對多聯(lián)系,則這兩個一對多聯(lián)系屬于標定型聯(lián)系
  • 如果子女實體集中的每一個實例都能被唯一地確認而無須了解與之相聯(lián)系的雙親實體集的實例,該聯(lián)系就被稱為"非標定型聯(lián)系”,使用一條虛線進行連接,用實心圓點表示聯(lián)系的基數(shù)是n(一對多)。
  • 在IDEF1X建模方法中,不會產(chǎn)生從屬實體集的是非標定型聯(lián)系。
  • 數(shù)據(jù)庫物理設(shè)計階段,將根據(jù)數(shù)據(jù)庫中存儲的數(shù)據(jù)量、用戶對數(shù)據(jù)庫的使用要求和使用方式,選擇數(shù)據(jù)存儲方案(如對表進行分區(qū)或者拆分/合并表)以加快數(shù)據(jù)檢索速度(如建立索引)。減少了操作,檢索速度相應(yīng)的就會提高。
  • 關(guān)系模式的設(shè)計、規(guī)范化處理屬于數(shù)據(jù)庫邏輯結(jié)構(gòu)設(shè)計的內(nèi)容。
  • 對關(guān)系模式進行去規(guī)范化處理屬于數(shù)據(jù)庫物理結(jié)構(gòu)設(shè)計的內(nèi)容
  • 為減少表連接操作而將兩個表合并為一個表,這屬于數(shù)據(jù)庫的物理結(jié)構(gòu)設(shè)計(調(diào)整)
  • 設(shè)置事務(wù)執(zhí)行時的隔離性級別,該任務(wù)屬于數(shù)據(jù)庫應(yīng)用系統(tǒng)設(shè)計步驟中的物理設(shè)計
  • 從功能角度數(shù)據(jù)庫應(yīng)用系統(tǒng)可以劃分為四個層次來實現(xiàn):
    • 表示層負責(zé)用戶交互,用于顯示數(shù)據(jù)和接收用戶輸入的數(shù)據(jù)。(一般為Windows應(yīng)用程序Web應(yīng)用程序)。
    • 業(yè)務(wù)邏輯層梳理DBAS各項業(yè)務(wù)活動,將其表示為各種系統(tǒng)構(gòu)件。核心業(yè)務(wù)邏輯在本層實現(xiàn)。是表示層和數(shù)據(jù)訪問層之間的橋梁,主要負責(zé)數(shù)據(jù)的傳遞和處理。
    • 數(shù)據(jù)訪問層使用事件進行信息交換,負責(zé)與DBMS系統(tǒng)進行交互,提取或存入應(yīng)用系統(tǒng)所需的數(shù)據(jù)。數(shù)據(jù)庫應(yīng)用系統(tǒng)的數(shù)據(jù)訪問層的主要任務(wù)是進行事務(wù)設(shè)計。事務(wù)概要設(shè)計內(nèi)容包括事務(wù)名稱事務(wù)所訪問的關(guān)系表及關(guān)系屬性、事務(wù)處理邏輯、事務(wù)用戶(指使用、啟動、調(diào)用該事務(wù)的軟件模塊或系統(tǒng))。
    • 數(shù)據(jù)持久層負責(zé)保存和管理應(yīng)用系統(tǒng)數(shù)據(jù),而數(shù)據(jù)的完整性維護屬于數(shù)據(jù)持久層功能中的數(shù)據(jù)管理的內(nèi)容。根據(jù)事務(wù)-基本表交叉引用矩陣來調(diào)整數(shù)據(jù)文件組織結(jié)構(gòu),這一任務(wù)涉及數(shù)據(jù)持久層。
  • 事務(wù)中為了降低死鎖的發(fā)生,通??紤]以下法則:
    • 按同一順序訪問資源;避免事務(wù)中的用戶交互;
    • 采用小事務(wù)模式,盡量縮短事務(wù)的長度,
    • 減少占有鎖的時間
    • 盡量使用記錄級別的鎖(行鎖),少使用表級別的鎖;
    • 使用綁定連接,使同一應(yīng)用程序所打開的兩個或多個連接可以相互合作。
  • 多個小事務(wù)合并成大事務(wù),會增加占有鎖的時間,可能會造成大量阻塞事務(wù),甚至?xí)?/span>產(chǎn)生死鎖
  • 事務(wù)的隔離性是指多個并發(fā)事務(wù)同時訪問一個數(shù)據(jù)庫時,一個事物不應(yīng)被另一個事物所干擾,即保證并發(fā)讀取數(shù)據(jù)的正確性,降低發(fā)生數(shù)據(jù)不一致的可能性。
  • 降低事務(wù)隔離級別可以提高事務(wù)的吞吐量,提高活鎖的可能性,降低發(fā)生死鎖、發(fā)生阻塞的可能性。
  • 關(guān)鍵字unique表示唯一索引,clustered表示聚集索引,所以idx1既是唯一索引,也是聚集索引。
  • 在數(shù)據(jù)流圖中,一個處理至少有一個輸入流和一個輸出流。
  • 關(guān)系模式計算關(guān)系模式個數(shù) = 實體集數(shù)+多對多關(guān)系數(shù)。
  • 考慮到表中數(shù)據(jù)規(guī)模有可能很大,決定將表改為分區(qū)表,這一調(diào)整操作涉及到數(shù)據(jù)庫的物理結(jié)構(gòu)。
  • 完整性約束條件的作用對象分為列、元組和關(guān)系三種級別,其中對列的約束主要指對其值類型、范圍、精度、排序等的約束條件。對元組的約束主要指對記錄中各個屬性之間的聯(lián)系的約束條件。對關(guān)系的約束是指對若干紀錄間、關(guān)系集合上以及關(guān)系之間聯(lián)系的約束條件。
  • 在數(shù)據(jù)文件的非主屬性上建立的索引稱為輔索引。
  • 論證是否具備數(shù)據(jù)庫應(yīng)用系統(tǒng)開發(fā)所需的人力資源,這屬于數(shù)據(jù)庫應(yīng)用系統(tǒng)的操作可行性分析。
  • 數(shù)據(jù)庫應(yīng)用系統(tǒng)生命周期中,成本估算屬于可行性分析中的經(jīng)濟可行性,是項目規(guī)劃中的一個環(huán)節(jié)。
  • 在數(shù)據(jù)庫應(yīng)用系統(tǒng)生命周期中,根據(jù)軟件開發(fā)模型,分解和定義項目所包括的任務(wù)和活動,屬于項目規(guī)劃。
  • 需求分析具體包括數(shù)據(jù)需求分析、功能需求分析、性能需求分析、其他需求分析(數(shù)據(jù)存儲需求分析、安全性需求分析、備份和恢復(fù)需求分析)。
  • 允許并發(fā)訪問的最大用戶數(shù),是指在保證單個用戶查詢相應(yīng)時間的前提下,系統(tǒng)最多允許多少用戶同時訪問數(shù)據(jù)庫。系統(tǒng)性能越強,允許的用戶數(shù)量就越多,這屬于性能需求分析。
  • 業(yè)務(wù)邏輯層概要設(shè)計
    • 一個構(gòu)件或模塊只負責(zé)完成一項任務(wù),也就是單一責(zé)任原則。
    • 各個構(gòu)件均應(yīng)具有獨立的功能,并最大限度地減少與其他構(gòu)件功能重疊。
    • 構(gòu)件之間的接口應(yīng)盡量簡單明確。
    • 如果兩個構(gòu)件間的關(guān)系比較復(fù)雜,應(yīng)考慮進一步進行模塊劃分。
    • 如果構(gòu)件過于復(fù)雜,可以考慮將其細分。
  • 性能需求分析——DBAS的性能指標主要包括:數(shù)據(jù)操作響應(yīng)時間、系統(tǒng)吞吐量、允許并發(fā)訪問的最大用戶數(shù)、每TPS代價值
  • 二、UML與數(shù)據(jù)庫應(yīng)用系統(tǒng)

  • UML用例模型用例圖組成,用例圖由系統(tǒng)、角色、用例三種模型元素及其之間的關(guān)系組成。橢圓表示用例,位于系統(tǒng)邊界內(nèi)部。
  • 通信圖和順序圖都是交互圖,從不同的側(cè)面描述系統(tǒng)的動態(tài)結(jié)構(gòu)。順序圖強調(diào)的是時間通信圖強調(diào)的是空間
  • 在UML中,用類圖來描述系統(tǒng)的靜態(tài)結(jié)構(gòu),而用順序圖和通信圖來表示系統(tǒng)的動態(tài)結(jié)構(gòu)
  • 狀態(tài)圖只能有一個起始狀態(tài)可以有多個結(jié)束狀態(tài)
  • 包圖可以表達系統(tǒng)中不同的元素彼此間的關(guān)系
  • 對象圖、狀態(tài)機圖時間圖均是微觀設(shè)計的表達方法包圖用于宏觀設(shè)計
  • 元元模型層組成了UML的最基本的元素"事物",代表要定義的所有事物。
  • 用例用于描述從系統(tǒng)用戶的角度來觀察,系統(tǒng)應(yīng)該具有哪些功能,幫助分析人員理解系統(tǒng)的行為。用例是需求搜索及整理的工具,主要應(yīng)用在項目開發(fā)的需求分析階段。用例之間包括擴展、使用組合三種關(guān)系。
  • 角色與系統(tǒng)進行交互的外部實體,可以是系統(tǒng)用戶也可以是其他系統(tǒng)或者硬件設(shè)備。
  • 系統(tǒng)是在邊界線以內(nèi)的區(qū)域(即用例的活動區(qū)域)抽象地表示能夠?qū)崿F(xiàn)的所有基本功能。
  • 一個角色可以執(zhí)行多個用例,反過來,一個用例也可以被多個角色使用。
  • 根據(jù)事務(wù)-基本表交叉引用矩陣可以確定哪些事務(wù)對哪些表列執(zhí)行了何種操作,基于該矩陣可以幫助數(shù)據(jù)庫設(shè)計人員建立合適的索引。
  • 數(shù)據(jù)庫安全性保護的主要保護方式有用戶身份鑒別、權(quán)限控制、視圖機制
  • 三、高級查詢

    ?四、數(shù)據(jù)庫后臺編程技術(shù)

  • 每當對游標執(zhí)行一次FETCH語句,系統(tǒng)都會自動對@@FETCH-STATUS賦一次值。
  • FETCH NEXT表示先將游標當前行指針移動到下一行,并提取所指向的行數(shù)據(jù)。
  • 存儲過程,實際上是存儲在數(shù)據(jù)庫中供所有用戶程序調(diào)用的子程序。
  • 存儲過程是存儲在數(shù)據(jù)庫服務(wù)器端的可以被調(diào)用執(zhí)行的代碼
  • 存儲過程可以接受多個輸入?yún)?shù),也可以接受多個輸出參數(shù)參數(shù)類型隨意。存儲過程的返回結(jié)果可以是一個集合。
  • 調(diào)用存儲過程時,只需要聲明參數(shù)的類型,不能指明參數(shù)為輸出參數(shù)。只有再執(zhí)行時才能指明參數(shù)為輸出參數(shù)。
  • 存儲過程的好處是允許模塊化程序設(shè)計、改善性能、減少網(wǎng)絡(luò)流量、增強應(yīng)用程序的安全性。
  • 觸發(fā)器通常用于保證業(yè)務(wù)規(guī)則和數(shù)據(jù)完整性
  • 在一個表上針對同一個數(shù)據(jù)操作只能定義一個前觸發(fā)器。
  • forafter指的是后觸發(fā)器instead of前觸發(fā)器。insert指的是引發(fā)觸發(fā)器執(zhí)行的操作是插入操作。
  • 觸發(fā)器是在對表中數(shù)據(jù)進行UPDATE、INSERT、DELETE操作時自動觸發(fā)的。
  • 數(shù)據(jù)庫創(chuàng)建可以手工縮小數(shù)據(jù)文件和日志文件的空間。
  • 角色分為服務(wù)器級角色和數(shù)據(jù)庫級角色。db_datawriter角色屬于數(shù)據(jù)庫級角色,具有插入、刪除更改數(shù)據(jù)庫中所有用戶數(shù)據(jù)的權(quán)限。
  • ?五、數(shù)據(jù)庫及數(shù)據(jù)庫對象

  • model數(shù)據(jù)庫用作SQL Server實例上創(chuàng)建的所有數(shù)據(jù)庫的模板。對model數(shù)據(jù)庫進行的修改(如數(shù)據(jù)庫大小、排序規(guī)則、恢復(fù)模式和其他數(shù)據(jù)庫選項)將應(yīng)用于以后創(chuàng)建的所有用戶數(shù)據(jù)庫,當用戶創(chuàng)建一個數(shù)據(jù)庫時,系統(tǒng)自動將model數(shù)據(jù)庫中的全部內(nèi)容復(fù)制到新建數(shù)據(jù)庫中。
  • 數(shù)據(jù)庫創(chuàng)建后,允許自動或手動擴大數(shù)據(jù)文件和日志文件的空間。
  • 數(shù)據(jù)庫文件,用戶可以自行指定數(shù)據(jù)文件日志文件的存放位置。數(shù)據(jù)庫所包含的文件與文件存儲位置信息均保存在主要數(shù)據(jù)文件中。一個文件組中的數(shù)據(jù)文件可以存放在不同磁盤上。
  • 數(shù)據(jù)文件分為主要數(shù)據(jù)文件(每個數(shù)據(jù)庫有且只有一個)、次要數(shù)據(jù)文件(可無可有,個數(shù)無限制)
  • 每個數(shù)據(jù)庫必須至少有一個事務(wù)日志文件,也可以有多個事務(wù)日志文件。
  • 日志文件不包括在文件組內(nèi),日志文件和數(shù)據(jù)文件是分開管理的。一個文件不能有多個文件組。如果文件組中有多個文件,則它們在所有文件被填滿前不會自動增長,而填滿后這些文件會循環(huán)增長。
  • tempdb是臨時數(shù)據(jù)庫,用于保存臨時對象或中間結(jié)果集,并為數(shù)據(jù)的排序等操作提供一個臨時工作空間。每次啟動SQL Server時都會重新創(chuàng)建tempdb數(shù)據(jù)庫。
  • 架構(gòu)(Schema,也稱為模式)是數(shù)據(jù)庫下的一個邏輯命名空間,可以存放表、視圖等數(shù)據(jù)庫對象。一個數(shù)據(jù)庫可以包含一個或多個架構(gòu),架構(gòu)由特定的授權(quán)用戶所擁有;在同一個數(shù)據(jù)庫中,架構(gòu)名必須唯一;架構(gòu)名可以是顯示的,也可以由DBMS提供默認名。
  • 唯一索引不允許兩行具有相同的索引鍵值。
  • 唯一索引的作用保證索引鍵值的不重復(fù)。在多列唯一索引的情況下,可以確保索引列中每個值的組合都是唯一的。唯一索引和非聚集索引之間沒有限定關(guān)系。
  • 聚集索引鍵值的邏輯順序決定表中對應(yīng)行的物理順序。一個表或視圖只允許同時有一個聚集索引,以及多個非聚焦索引。
  • 如果數(shù)據(jù)文件中的數(shù)據(jù)記錄的排列順序與索引文件中索引項的排列順序一致,那么該索引文件就成為聚集索引
  • 非聚集索引數(shù)據(jù)行的物理排序獨立于索引排序。
  • 分離數(shù)據(jù)庫時需要停用被分離的數(shù)據(jù)庫,但是不需要停用SQL Server服務(wù)。正在被用戶訪問的數(shù)據(jù)庫不能被分離。
  • 分區(qū)表是將表中的數(shù)據(jù)按水平方式劃分成不同的子集,這些數(shù)據(jù)子集存儲在數(shù)據(jù)庫的一個或多個文件組中。分區(qū)表是從物理上將一個大表分成幾個小表,但從邏輯上來看還是一個大表。對于用戶而言,所面對的仍然是一個大表,用戶只要對大表進行操作就可以了,數(shù)據(jù)庫管理系統(tǒng)會自動對小表進行操作。
  • ?六、安全管理

  • 因在U1后面缺少WITH GRANT OPTION語句,U1無權(quán)將SELECT權(quán)限轉(zhuǎn)授予其他角色或用戶。
  • guest是SQL Server中一個特殊的數(shù)據(jù)庫用戶。
  • CRANT UPDATE ON TI TO U1語句的作用是用戶U1具有對表11各列數(shù)據(jù)進行修改的權(quán)利,在SQL Server中,擁有UPDATE權(quán)限的用戶并不意味著一定擁有SELECT權(quán)限
  • 角色是一組具有相同權(quán)限的用戶集合。用戶定義的角色屬于數(shù)據(jù)庫一級的角色,用戶定義的角色的成員可以是數(shù)據(jù)庫的用戶,也可以是用戶定義的角色。只要權(quán)限沒有被拒絕過,則角色中成員的權(quán)限就是其所在角色的權(quán)限加上他們自己所具有的權(quán)限。
  • 授權(quán)語句格式是"GRANT 可以授予的權(quán)限 ON 表名 TO 用戶名?",授權(quán)時一個語句中可以授予多個權(quán)限,也可以一次授予一個權(quán)限。
  • Oracle的安全控制機制可分為數(shù)據(jù)庫級的安全控制、表級行級列級的安全控制。
  • SQL Server 2008的身份驗證模式有"windows身份驗證模式"和"混合身份驗證模式"兩種。混合身份驗證模式是指SQL Server允許Windows授權(quán)用戶和SQL授權(quán)用戶登錄到SQL Server數(shù)據(jù)庫服務(wù)器。
  • 除guest用戶外,所有的數(shù)據(jù)庫用戶都必須對應(yīng)一個登錄賬戶
  • 一個登錄賬戶可以對應(yīng)多個數(shù)據(jù)庫用戶。
  • 授權(quán)是將合法訪問數(shù)據(jù)庫或數(shù)據(jù)庫對象的權(quán)限授予用戶的過程(即做任何操作,都需要有相應(yīng)的授權(quán))。
  • 數(shù)據(jù)庫用戶一般都來自于服務(wù)器上已有的登錄賬戶,讓登錄用戶成為數(shù)據(jù)庫用戶的操作稱為映射。
  • db_datereader角色是數(shù)據(jù)庫級角色,具有查詢數(shù)據(jù)庫中所有用戶數(shù)據(jù)的權(quán)限。
  • db_datawriter角色是固定數(shù)據(jù)庫角色之一,具有插入、刪除和更改數(shù)據(jù)庫中所有用戶數(shù)據(jù)的權(quán)限
  • 系統(tǒng)管理員在數(shù)據(jù)庫服務(wù)器上具有全部的權(quán)限。每個數(shù)據(jù)庫管理系統(tǒng)在安裝好之后都有自己默認的系統(tǒng)管理員,SQL Server 2008默認的系統(tǒng)管理員是"sa"。在安裝好之后也可以授予其他用戶具有系統(tǒng)管理員的權(quán)限。
  • ?七、運行維護與優(yōu)化

  • SQL Server提供了一套綜合的工具,用于監(jiān)視SQLServer中的事件和優(yōu)化物理數(shù)據(jù)庫的設(shè)計。
  • 數(shù)據(jù)庫重組是指按照系統(tǒng)設(shè)計要求對數(shù)據(jù)庫存儲空間進行全面調(diào)整,如調(diào)整磁盤分區(qū)方法和存儲空間、重新安排數(shù)據(jù)的存儲、整理回收碎塊等,以提高數(shù)據(jù)庫性能。
  • 數(shù)據(jù)庫的重構(gòu)是指由于數(shù)據(jù)庫應(yīng)用環(huán)境的不斷變化,增加了新的應(yīng)用或新的實體,取消了某些應(yīng)用,有的實體與實體間的聯(lián)系也發(fā)生了變化等,使得原有的數(shù)據(jù)庫設(shè)計不能滿足新的需求,此時需要調(diào)整數(shù)據(jù)庫的模式和內(nèi)模式。
  • 數(shù)據(jù)庫的重組并不修改數(shù)據(jù)庫原有設(shè)計的邏輯結(jié)構(gòu)和物理結(jié)構(gòu),而數(shù)據(jù)庫的重構(gòu)則不同,它可以部分修改數(shù)據(jù)庫的模式和內(nèi)模式
  • 數(shù)據(jù)庫性能優(yōu)化對數(shù)據(jù)庫管理員的要求比較高,調(diào)整一個數(shù)據(jù)庫應(yīng)用系統(tǒng)的性能要求熟悉系統(tǒng)環(huán)境、數(shù)據(jù)庫管理系統(tǒng)、應(yīng)用程序以及應(yīng)用程序所使用的數(shù)據(jù)。
  • 數(shù)據(jù)庫性能優(yōu)化是對數(shù)據(jù)庫管理員的嚴峻考驗,有時候?qū)?yīng)用程序的修改需要應(yīng)用開發(fā)人員配合才能完成。
  • 數(shù)據(jù)庫優(yōu)化有以下幾方面外部調(diào)整、調(diào)整內(nèi)存分配、調(diào)整磁盤1/0、調(diào)整競爭。外部調(diào)整中除了CPU調(diào)整外,還有網(wǎng)絡(luò)調(diào)整。
  • 數(shù)據(jù)庫優(yōu)化中,如果數(shù)據(jù)庫服務(wù)器中運行隊列數(shù)量超過邏輯CPU數(shù)量說明CPU已經(jīng)飽和。
  • 除了刪除或創(chuàng)建索引,以及非聚簇索引和聚簇索引的相互轉(zhuǎn)換外,通過重建索引可以改進系統(tǒng)的性能。
  • 調(diào)整索引,優(yōu)化查詢效率屬于數(shù)據(jù)庫性能的改進
  • 寄數(shù)據(jù)庫存儲介質(zhì)由RAID5改為RAID1以滿足越來越多的寫操作需求,這一活動屬于數(shù)據(jù)庫應(yīng)用系統(tǒng)運行管理與維護中的性能優(yōu)化調(diào)整。
  • 根據(jù)監(jiān)控分析實現(xiàn)的方法不同,監(jiān)控分析機制分為兩種,一種是由數(shù)據(jù)庫系統(tǒng)建立的自動監(jiān)控機制,另一種是由管理員手動實施的監(jiān)控機制。
  • (模式調(diào)整)派生性冗余列是指表中增加的列由表中的一些數(shù)據(jù)項經(jīng)過計算生成。它的作用是在查詢時減少連接操作,避免使用聚合函數(shù)。由于增加了派生性冗余字段,破壞了規(guī)范化規(guī)則(不符合第三范式要求)
  • 水平分割是根據(jù)數(shù)據(jù)行的使用特點進行分割,分割之后所得的所有表的結(jié)構(gòu)都相同,而存儲的數(shù)據(jù)不同。水平分割會給應(yīng)用增加復(fù)雜度,特別在查詢所有數(shù)據(jù)時需要Union(并)操作;大部分情況是局部使用,只有很少情況才全局查詢時適合使用此方法。
  • 垂直分割是根據(jù)列的特點進行分割,分割之后所得的所有表中除了都含有主碼列外其余列都不同,其查詢時會減少1/0次數(shù),但其缺點是查詢所有數(shù)據(jù)時需要Join(連接)操作。
  • 數(shù)據(jù)庫應(yīng)用系統(tǒng)投入運行標志系統(tǒng)開發(fā)任務(wù)的基本完成和系統(tǒng)運行維護工作的開始。
  • 數(shù)據(jù)庫系統(tǒng)運行需要依賴服務(wù)器、操作系統(tǒng)、存儲、網(wǎng)絡(luò)等多種因素。單純地增加數(shù)據(jù)庫CPU數(shù)量并不一定會提高數(shù)據(jù)庫查詢速度。RAID1提高了讀速度,加強了系統(tǒng)的可靠性,但是磁盤的利用率低,冗余度高,寫的速度并未提高。數(shù)據(jù)庫管理員進行優(yōu)化時需要對數(shù)據(jù)庫系統(tǒng)有深入了解,對業(yè)務(wù)系統(tǒng)也要深入了解。
  • 數(shù)據(jù)庫設(shè)計階段,主要強調(diào)的是高效率利用存儲空間,減少數(shù)據(jù)的元余,減少數(shù)據(jù)的不一致,這個過程也就是規(guī)范化的過程。規(guī)范化關(guān)系解決了數(shù)據(jù)維護的異常,并使冗余最小化,然而,可能會出現(xiàn)數(shù)據(jù)處理性能下降的問題。
  • 在大多數(shù)情況下,數(shù)據(jù)庫系統(tǒng)需要考慮的第二個目標是高效率的數(shù)據(jù)處理,反規(guī)范化處理,如增加派生冗余列,增加冗余列,重新組表、分割表和新增匯總表可以有效地提高查詢效率。
  • 數(shù)據(jù)庫設(shè)計過程中,為了提高查詢效率會進行反規(guī)范化,但由此會帶來數(shù)據(jù)冗余。
  • 索引的使用要恰到好處,其使用原則一般如下:
    (1)
    經(jīng)常在查詢中作為條件被使用的列,應(yīng)為其建立索引。
    (2)
    頻繁進行排序或分組的列,應(yīng)為其建立索引。
    (3)
    一個列的值域很大時,應(yīng)為其建立索引。
    (4)如果待排序的列有多個,應(yīng)在這些列上建立復(fù)合索引。
    (5)可以使用系統(tǒng)工具來檢查索引的完整性,必要時進行修復(fù)。另外,當數(shù)據(jù)庫表更新大量數(shù)據(jù)后,刪除并重建索引也可以提高查詢速度。
  • 建立索引的目的就是為了提高查詢效率,查詢的性能在很大程度上取決于存在什么樣的索引來加快選擇和連接的處理。
  • 如果在索引碼上執(zhí)行大量刪除操作,索引頁可能會出現(xiàn)空間的浪費,而這些被浪費的空間需要在重建索引后才能提高數(shù)據(jù)庫的性能。
  • 當數(shù)據(jù)庫表更新大量數(shù)據(jù)后刪除并重建索引可以提高查詢速度。
  • 數(shù)據(jù)庫運行維護工作主要包括數(shù)據(jù)庫的轉(zhuǎn)儲和恢復(fù)數(shù)據(jù)庫的安全性和完整性控制數(shù)據(jù)庫性能的監(jiān)控分析和改進數(shù)據(jù)庫的重組和重構(gòu)。其中新建數(shù)據(jù)庫用戶屬于數(shù)據(jù)庫的安全性和完整性控制的一項功能。
  • 數(shù)據(jù)庫運行維護工作:數(shù)據(jù)庫軟件升級、調(diào)整索引、數(shù)據(jù)庫管理系統(tǒng)補丁安裝、檢查數(shù)據(jù)庫空間使用情況、數(shù)據(jù)庫管理軟件漏洞修復(fù)。
  • 數(shù)據(jù)庫設(shè)計過程中,數(shù)據(jù)庫的一致性設(shè)計往往以犧牲效率為代價
  • 結(jié)合數(shù)據(jù)庫安全設(shè)計的五個方面可知,實現(xiàn)安全性需要額外實施一些工作,會降低數(shù)據(jù)庫性能。
  • ?將數(shù)據(jù)文件和索引文件放置在同一磁盤上不利于提高查詢效率。
  • 根據(jù)監(jiān)控對象的不同,監(jiān)控分析可以分為兩種
    (1)對數(shù)據(jù)庫架構(gòu)體系的監(jiān)控

    主要監(jiān)控內(nèi)容:空間基本信息、空間使用率與剩余空間大小、空間是否具有自動擴展的能力、哪些表的擴展將引起空間的擴展,以及段的占用空間與區(qū)間數(shù)等。
    (2)對數(shù)據(jù)庫性能的監(jiān)控

    主要監(jiān)控內(nèi)容:數(shù)據(jù)緩沖區(qū)的命中率、庫緩沖、用戶鎖、鎖與等待、回滾段、臨時段使用情況、索引的使用情況、等待事件和共享池等。
  • 八、故障管理、備份與恢復(fù)

  • 在制定備份策略時,除考慮使用備份恢復(fù)時丟失的數(shù)據(jù)量外,還需考慮數(shù)據(jù)庫備份所需的時間。檢查點技術(shù)大幅度減少了數(shù)據(jù)庫完全恢復(fù)時所必須執(zhí)行的日志部分。靜態(tài)轉(zhuǎn)儲雖然保證了數(shù)據(jù)的有效性,但是卻是以降低數(shù)據(jù)庫的可用性為代價;動態(tài)轉(zhuǎn)出雖然提高了數(shù)據(jù)庫的可用性,但數(shù)據(jù)的有效性卻可能得不到保障。差量轉(zhuǎn)儲和增量轉(zhuǎn)儲相比,速度慢,占用空間較多,但恢復(fù)速度比增量轉(zhuǎn)儲快。
  • 數(shù)據(jù)庫備份設(shè)備可以是磁帶也可以是磁盤,數(shù)據(jù)庫備份設(shè)備可以為本地設(shè)備,也可以使用遠程網(wǎng)絡(luò)設(shè)備。SQL Server支持兩種備份方式,一種是先建立備份設(shè)備,然后再將數(shù)據(jù)庫備份到備份設(shè)備上,這樣的備份設(shè)備稱為永久備份設(shè)備;另一種是直接將數(shù)據(jù)庫備份到物理文件上,這樣的備份設(shè)備稱為臨時備份設(shè)備。創(chuàng)建備份設(shè)備的T-SQL存儲過程為spaddumpdevice。
  • 純?nèi)罩緜浞?strong>只包括一定時間間隔內(nèi)的事務(wù)日志,不包含大容量操作日志記錄。
  • 日志文件記錄每個事務(wù)對數(shù)據(jù)庫的修改操作,主要用來實現(xiàn)數(shù)據(jù)恢復(fù)。
  • 每個數(shù)據(jù)庫必須至少有一個日志文件,也可以有多個日志文件。
  • 對于非預(yù)期的事物內(nèi)部故障,在保證該事務(wù)對其他事務(wù)沒有影響的條件下,利用日志文件撤銷其對數(shù)據(jù)庫的修改,使數(shù)據(jù)庫恢復(fù)到該事物運行之前的狀態(tài)。事務(wù)故障的恢復(fù)是由系統(tǒng)自動完成的,對用戶是透明的。
  • 可預(yù)期的事務(wù)內(nèi)部故障可以通過將事務(wù)回滾,使數(shù)據(jù)庫達到一致性狀態(tài)。
  • 通常,對于用戶數(shù)據(jù)庫,簡單恢復(fù)模式只用于測試和開發(fā)數(shù)據(jù)庫,或用于主要包含只讀數(shù)據(jù)的數(shù)據(jù)庫(如數(shù)據(jù)倉庫),這種模式并不適合生產(chǎn)系統(tǒng),因為對生產(chǎn)系統(tǒng)而言,丟失最新的更改是無法接受的。
  • SQL Server 2008支持數(shù)據(jù)庫、數(shù)據(jù)文件兩個級別的數(shù)據(jù)恢復(fù)。
  • 在SQL Server 2008系統(tǒng)數(shù)據(jù)庫中,只有tempdb數(shù)據(jù)庫不需要備份,其他的都需要備份。tempdb只是一個臨時數(shù)據(jù)庫,每次SQL Server啟動時都會重新新建tempdb數(shù)據(jù)庫。
  • model數(shù)據(jù)庫是用戶數(shù)據(jù)庫模板,每次大量更新后必須備份。
  • 修改數(shù)據(jù)庫作業(yè)后,建議備份msdb數(shù)據(jù)庫。
  • 對于大型數(shù)據(jù)庫,差異備份的間隔通常比完整數(shù)據(jù)庫備份的時間更短,這可降低數(shù)據(jù)丟失風(fēng)險
  • 結(jié)尾日志備份是恢復(fù)計劃中的最后一個備份。
  • 清理事務(wù)日志之后,建議對用戶數(shù)據(jù)庫進行備份。
  • 大容量日志恢復(fù)模式下可以進行日志備份。
  • 完整恢復(fù)模式完整地記錄所有的事務(wù),并將事務(wù)日志記錄保留到對其備份完畢為止。
  • 利用事務(wù)日志備份進行恢復(fù)時要求日志鏈是完整的。
  • 事務(wù)日志備份并不備份數(shù)據(jù)庫本身,它只備份日志記錄,而且只備份從上次備份之后到當前備份時間發(fā)生變化的日志內(nèi)容。
  • 靜態(tài)轉(zhuǎn)儲保證了數(shù)據(jù)的有效性,卻是以降低數(shù)據(jù)庫的可用性為代價的(可以不使用日志文件);而動態(tài)轉(zhuǎn)儲雖然提高了數(shù)據(jù)庫的可用性,但數(shù)據(jù)的有效性卻可能得不到保證。為了既能保證數(shù)據(jù)的有效性又不會降低數(shù)據(jù)庫的可用性,需要引入日志文件,用它記錄轉(zhuǎn)儲期間各事務(wù)對數(shù)據(jù)庫的修改活動記錄,然后使用動態(tài)轉(zhuǎn)儲的備份副本加上日志文件就可以將數(shù)據(jù)庫恢復(fù)到某一時刻的正確狀態(tài)。
  • 靜態(tài)轉(zhuǎn)儲可以保證數(shù)據(jù)的有效性,但是卻降低數(shù)據(jù)庫的可用性,動態(tài)轉(zhuǎn)儲可以提高數(shù)據(jù)庫的可用性,但數(shù)據(jù)的有效性得不到保證。為了保證數(shù)據(jù)的一致性,需使用日志文件和動態(tài)轉(zhuǎn)儲結(jié)合使用。在制定備份策略時,需要考慮備份空間、時間等因素。
  • 增量轉(zhuǎn)儲和差量轉(zhuǎn)儲相比速度快,存儲空間占用少。
  • 完整數(shù)據(jù)庫備份的備份空間占用較大。完全數(shù)據(jù)庫備份備份了數(shù)據(jù)庫中的全部信息,每次備份需要消耗比較長的時間和資源,但是恢復(fù)時間最短。
  • 對于大型數(shù)據(jù)庫,差異備份的間隔通常比完整數(shù)據(jù)庫備份的時間更短,這可降低數(shù)據(jù)丟失風(fēng)險。
  • 備份策略的制定包括定義備份的類型和頻率、備份所需硬件的特性和速度、備份的測試方法以及備份媒體的存儲位置和方法。
  • 創(chuàng)建數(shù)據(jù)庫后,由于尚未寫入數(shù)據(jù),無須備份。
  • 九、大規(guī)模數(shù)據(jù)庫建構(gòu)

  • 范圍劃分是按照關(guān)系中某個屬性的取值范圍將數(shù)據(jù)文件劃分為n部分,分別存放到磁盤上。范圍劃分有利于范圍查詢以及點查詢,但是也可能引起數(shù)據(jù)分布不均勻,導(dǎo)致并行處理能力下降。
  • 輪轉(zhuǎn)法保證了元組在多個磁盤上平均分配,適合掃描整個關(guān)系的應(yīng)用,負載均衡,并行性好,但是點查詢和范圍查詢效率很低
  • 散列劃分使用散列函數(shù),根據(jù)一個或多個屬性進行散列,適合點查詢,對于順序掃描也非常高效,但是對散列函數(shù)的優(yōu)劣依賴很大。
  • 聚集函數(shù)的并行化計算可以采取"先分后合"的方法。
  • 數(shù)據(jù)分片有四種基本方法
    (1)水平分片是在關(guān)系中從行的角度(元組)依據(jù)一定條件劃分為不同的片斷,
    關(guān)系中的每一行必須至少屬于一個片斷,以便在需要時可以重構(gòu)關(guān)系。
    (2)垂直分片是在關(guān)系中從列的角度(屬性)依據(jù)一定條件分為不同的片斷,
    各片斷中應(yīng)該包含關(guān)系的主碼屬性,以便通過連接方法恢復(fù)關(guān)系。
    (3)導(dǎo)出分片是導(dǎo)出水平分片,分片的依據(jù)不是本關(guān)系屬性的條件,而是其他關(guān)系屬性的條件。
    (4)混合分片指以上三種方法的混合。
  • 使分布式數(shù)據(jù)庫具有分布式透明性的主要因素:位置獨立性、數(shù)據(jù)分片獨立性數(shù)據(jù)復(fù)制獨立性。
  • 分布式數(shù)據(jù)庫最基本特征是本地自治非集中式管理高可用性
  • 分片透明性最高級別的透明性,是指數(shù)據(jù)分片用戶無需考慮的,完全透明的,在編寫程序時用戶只需要對全局關(guān)系進行操作。
  • 分布透明性有如下幾種級別
    (1)分片透明性。分片透明性是
    最高級別的透明性,位于全局模式與分片模式之間
    (2)位置透明性。位置透明性是指數(shù)據(jù)分片的分配位置對用戶是透明的,用戶編寫程序時只需要考慮數(shù)據(jù)分片情況,
    不需要了解各分片在各個場地的分配情況。
    (3)局部數(shù)據(jù)模型透明性。局部數(shù)據(jù)模型透明性處于分配模式與局部概念模式之間。全局外模式是全局應(yīng)用的用戶視圖,即終端用戶看到的邏輯上并未分布的表、視圖等。
  • 分布透明三種級別從高到低的排序是:分片透明性、位置透明性局部透明性。
  • 集中式數(shù)據(jù)庫系統(tǒng)中,查詢代價主要是由CPU代價和1/0代價來衡量的,在分布式數(shù)據(jù)庫系統(tǒng)中,由于數(shù)據(jù)分布在多個不同的場地上,使得查詢處理中還要考慮站點間傳輸數(shù)據(jù)的通信代價(使得查詢執(zhí)行的通信代價最省)。
  • Saas,即Software as a Service,中文意思是軟件即服務(wù)。
  • Paas,即Platform as a Service,中文意思是平臺即服務(wù)。
  • 共享磁盤結(jié)構(gòu)所有的處理機擁有獨立的內(nèi)存,通過互聯(lián)網(wǎng)共享磁盤。這種結(jié)構(gòu)可以克服共享內(nèi)存結(jié)構(gòu),但是由于是通過互聯(lián)網(wǎng)實現(xiàn)處理器之間的信息交換,會產(chǎn)生一定的通信代價。
  • 與傳統(tǒng)數(shù)據(jù)庫相比,XML數(shù)據(jù)庫具有以下優(yōu)勢
    (1)
    XML數(shù)據(jù)庫能夠?qū)Π虢Y(jié)構(gòu)化數(shù)據(jù)進行有效的存取和管理。如網(wǎng)頁內(nèi)容就是一種半結(jié)構(gòu)化數(shù)據(jù),而傳統(tǒng)的關(guān)系數(shù)據(jù)庫對于類似網(wǎng)頁內(nèi)容這類半結(jié)構(gòu)化數(shù)據(jù)無法進行有效的管理。 (2)提供對標簽和路徑的操作。傳統(tǒng)數(shù)據(jù)庫語言允許對數(shù)據(jù)元素的值進行操作,但不能對元素名稱進行操作,半結(jié)構(gòu)化數(shù)據(jù)庫提供了對標簽名稱的操作,包括對路徑的操作。
    (3)當數(shù)據(jù)本身具有層次特征時,由于XML數(shù)據(jù)格式能夠清晰表達數(shù)據(jù)的層次特征,因此
    XML數(shù)據(jù)庫便于對層次化的數(shù)據(jù)進行操作。XML數(shù)據(jù)庫適合管理復(fù)雜數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)集。
    現(xiàn)階段在現(xiàn)實環(huán)境中,一邊使用的是原有的關(guān)系數(shù)據(jù)庫廠商在其傳統(tǒng)商業(yè)產(chǎn)品中進行了相關(guān)的擴充,使其能夠處理XM,數(shù)據(jù)的產(chǎn)品。
  • BigTable表的索引是行關(guān)鍵字、列關(guān)鍵字和時間戳,每個單元由行關(guān)鍵字、列關(guān)鍵字和時間戳共同定位。在BigTable中,不僅可以隨意地增減行的數(shù)量,同在一定的約束條件下,還可以對列的數(shù)量進行擴展。
    BigTable數(shù)據(jù)模型的特點是:
    (1)表中的行關(guān)鍵字可以是任意的字符串。
    (2)列族是由列關(guān)鍵字組成的集合,是訪問控制的基本單位。
    (3)時間戳記錄了BigTable中每一個數(shù)據(jù)項所包含的不同版本的數(shù)據(jù)的時間標識。
  • 并行數(shù)據(jù)庫系統(tǒng)結(jié)構(gòu)有四種結(jié)構(gòu)
    (1)共享內(nèi)存結(jié)構(gòu):通過互聯(lián)網(wǎng)共享一個公共的主存儲器,與單機系統(tǒng)的區(qū)別是以多個處理器代替單個處理器并行執(zhí)行事務(wù),通過共享內(nèi)存?zhèn)魉拖⒑蛿?shù)據(jù),實現(xiàn)對一個或多個磁盤的訪問。
    只共享內(nèi)存,并沒有共享磁盤空間
    (2)共享磁盤結(jié)構(gòu)
    所有處理機擁有獨立的主存儲器,通過互聯(lián)網(wǎng)共享磁盤。只是共享磁盤,并沒有共享內(nèi)存,所以各處理器有獨立的內(nèi)存。
    (3)無共享結(jié)構(gòu):每個處理機擁有獨立的主存儲器和磁盤,不共享任何資源。無共享結(jié)構(gòu)
    通過最小化共享資源來降低資源競爭的概率,因此具有很好的拓展性。
    (4)層次結(jié)構(gòu):前三種的結(jié)合,分兩層,
    頂層無共享結(jié)構(gòu),底層共享內(nèi)存或共享磁盤。
  • 并行數(shù)據(jù)庫中的數(shù)據(jù)劃分與并行算法中,范圍劃分會引起數(shù)據(jù)分布不均勻,導(dǎo)致并行處理能力下降。
  • 并行數(shù)據(jù)庫僅僅依靠采用多處理器、共享硬件資源等手段無法實現(xiàn)真正意義上的并行處理,只有當數(shù)據(jù)分布合理、易于并行處理,才能將并行數(shù)據(jù)庫的性能最優(yōu)化。
  • 并行數(shù)據(jù)庫系統(tǒng)經(jīng)常通過負載均衡的方法來提高數(shù)據(jù)庫系統(tǒng)的業(yè)務(wù)吞吐率。
  • 十、數(shù)據(jù)倉庫與數(shù)據(jù)挖掘

  • 快照是關(guān)于指定數(shù)據(jù)集合的一個完全可用拷貝,該拷貝包括相應(yīng)數(shù)據(jù)在某個時間點(拷貝開始的時間點)的映像??煺湛梢允瞧渌硎镜臄?shù)據(jù)的一個副本,也可以是數(shù)據(jù)的一個復(fù)制品。它反映的是某個時間點內(nèi)的數(shù)據(jù),該數(shù)據(jù)具有不可以改變性。
  • 各商品銷售明細表、電信公司通話詳單是屬于一個動態(tài)信息表,每個時刻的信息都不一樣,因此各商品銷售明細表不適合用快照方式更新。
  • 元數(shù)據(jù)關(guān)于數(shù)據(jù)的數(shù)據(jù),或者叫做描述數(shù)據(jù)的數(shù)據(jù),它描述了數(shù)據(jù)的結(jié)構(gòu)、內(nèi)容、鏈和索引等項的內(nèi)容。
  • 建立數(shù)據(jù)倉庫的主要目的在于根據(jù)決策需求對企業(yè)的數(shù)據(jù)采取適當?shù)氖侄芜M行集成,形成一個綜合的、面相分析的數(shù)據(jù)環(huán)境,用于支持企業(yè)的信息型、決策型的分析應(yīng)用
  • 數(shù)據(jù)倉庫是服務(wù)于決策支持的數(shù)據(jù)集合。
  • 數(shù)據(jù)倉庫中數(shù)據(jù)特征包括
    • 面向主題性從實際需求出發(fā),具有較高的抽象性,數(shù)據(jù)可用性比OLTP較為寬松。
    • 集成性:需要將數(shù)據(jù)抽取、轉(zhuǎn)換、清理、裝載。
    • 不可更新性:是面向決策支持應(yīng)用主題的,數(shù)據(jù)進入數(shù)據(jù)倉庫后不允許修改。
    • 時間特性數(shù)據(jù)需要定期更新。
  • 聚類方法包括統(tǒng)計方法、機器學(xué)習(xí)方法、神經(jīng)網(wǎng)絡(luò)方法和面向數(shù)據(jù)庫的方法等。在機器學(xué)習(xí)中,聚類稱作無監(jiān)督(或無教師)歸納。與分類相比,分類的例子或數(shù)據(jù)對象均有類別標記,而聚類的例子則沒有標記,需要由聚類算法來自動確定。聚類的核心就是將一個數(shù)據(jù)集中的數(shù)據(jù)進行分組,使得每一組內(nèi)的數(shù)據(jù)盡可能的相似而不同組間的數(shù)據(jù)盡可能不同。
  • 有監(jiān)督學(xué)習(xí)根據(jù)樣本數(shù)據(jù),采用分類算法,訓(xùn)練分類器。
  • 分類器的構(gòu)造方法統(tǒng)計方法、機器學(xué)習(xí)方法神經(jīng)網(wǎng)絡(luò)方法等。
  • 統(tǒng)計方法包括貝葉斯法非參數(shù)法機器學(xué)習(xí)方法包括決策樹算法規(guī)則歸納算法神經(jīng)網(wǎng)絡(luò)方法主要是BP神經(jīng)網(wǎng)絡(luò)算法K-means屬于聚類算法。
  • 決策支持系統(tǒng)是指輔助需要決策的人或系統(tǒng)進行決策的系統(tǒng)。
  • 機器學(xué)習(xí)是指機器采用一些方法或模型從數(shù)據(jù)中習(xí)得知識的過程。
  • 數(shù)據(jù)挖掘可以簡單地理解為從大量數(shù)據(jù)中提取或挖掘知識,是數(shù)據(jù)庫知識發(fā)現(xiàn)的一個步驟。
  • 粒度高的數(shù)據(jù)是由粒度低的數(shù)據(jù)綜合而成的。粒度越大,綜合程度越高;粒度越小,綜合程度越低。粒度影響數(shù)據(jù)倉庫的數(shù)據(jù)量以及系統(tǒng)能回答的查詢的類型。粒度越小,細節(jié)程度越高,能回答的查詢就越多。但是,因為需要存儲低粒度級的細節(jié)數(shù)據(jù),數(shù)據(jù)量就比較大,空間代價也大。
  • 封鎖粒度越大,數(shù)據(jù)庫系統(tǒng)能夠封鎖的數(shù)據(jù)單元就越少,封鎖開銷也就越小,并發(fā)度也就隨之降低。
  • 數(shù)據(jù)集成是將源自不同數(shù)據(jù)源的數(shù)據(jù)經(jīng)過抽取、轉(zhuǎn)換、清理、裝載等操作載入數(shù)據(jù)倉庫的過程,是實施數(shù)據(jù)倉庫的重要步驟。由于對大量的原始數(shù)據(jù)要加以提煉,要減輕分析工作給處理業(yè)務(wù)數(shù)據(jù)的服務(wù)器帶來的壓力,要規(guī)范各源數(shù)據(jù),以及要處理那些難以直接使用的數(shù)據(jù),數(shù)據(jù)集成在數(shù)據(jù)倉庫設(shè)計中是必不可少的一環(huán),ETL是實現(xiàn)數(shù)據(jù)集成的主要技術(shù)。
  • ETL工具是指從OLTP系統(tǒng)或其他數(shù)據(jù)環(huán)境中抽取數(shù)據(jù)的工具。在實踐中,人們RETLI具從OLTP系統(tǒng)抽取出數(shù)據(jù)再進行分析利用,而不是在OLTP系統(tǒng)中直接進行數(shù)據(jù)分析利用的最主要原因是解決分析型應(yīng)用程序與OLT應(yīng)用程序之間的性能沖突問題。
  • 水平分片是在關(guān)系中從行的角度(元組)依據(jù)一定條件劃分為不同的片斷,關(guān)系中的每一行必須至少屬于一個片斷,以便在需要時可以重構(gòu)關(guān)系。
  • 垂直分片是在關(guān)系中從列的角度(屬性)依據(jù)一定條件分為不同的片斷,各片斷中應(yīng)該包含關(guān)系的主碼屬性,以便通過連接方法恢復(fù)關(guān)系。垂直分片后,每個分片都包含主鍵。

  • 下一篇博客https://blog.csdn.net/weixin_44940488/article/details/119417955

    總結(jié)

    以上是生活随笔為你收集整理的一、全国计算机三级数据库考试——理论知识总结(选择题)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。