大部分?jǐn)?shù)據(jù)庫從業(yè)人員都知道關(guān)系數(shù)據(jù)庫有三個(gè)基本的范式,即:第一范式,第二范式,第三范式。當(dāng)然也有牛人知道BC范式,第四范式,第五范式,第六范式,甚至還有個(gè)DK范式。本人對(duì)數(shù)據(jù)庫的范式概念也是一知半解的,想想有些可笑,搞數(shù)據(jù)庫的竟然不了解關(guān)系數(shù)據(jù)庫的基礎(chǔ)——范式。這不最近查閱了不少資料,今天把這些東東總結(jié)一下。 范式:英文名稱是 Normal Form,它是英國(guó)人 E.F.Codd(關(guān)系數(shù)據(jù)庫的老祖宗)在上個(gè)世紀(jì)70年代提出關(guān)系數(shù)據(jù)庫模型后總結(jié)出來的,范式是關(guān)系數(shù)據(jù)庫理論的基礎(chǔ),也是我們?cè)谠O(shè)計(jì)數(shù)據(jù)庫結(jié)構(gòu)過程中所要遵循的規(guī)則和指導(dǎo)方法。目前有跡可尋的共有8種范式,依次是:1NF,2NF,3NF,BCNF,4NF,5NF,DKNF,6NF。通常所用到的只是前三個(gè)范式,即:第一范式(1NF),第二范式(2NF),第三范式(3NF)。下面就簡(jiǎn)單介紹下這三個(gè)范式。 ◆ 第一范式(1NF):強(qiáng)調(diào)的是列的原子性,即列不能夠再分成其他幾列。 考慮這樣一個(gè)表:【聯(lián)系人】(姓名,性別,電話) 如果在實(shí)際場(chǎng)景中,一個(gè)聯(lián)系人有家庭電話和公司電話,那么這種表結(jié)構(gòu)設(shè)計(jì)就沒有達(dá)到 1NF。要符合 1NF 我們只需把列(電話)拆分,即:【聯(lián)系人】(姓名,性別,家庭電話,公司電話)。1NF 很好辨別,但是 2NF 和 3NF 就容易搞混淆。 ◆ 第二范式(2NF):首先是 1NF,另外包含兩部分內(nèi)容,一是表必須有一個(gè)主鍵;二是沒有包含在主鍵中的列必須完全依賴于主鍵,而不能只依賴于主鍵的一部分。 考慮一個(gè)訂單明細(xì)表:【OrderDetail】(OrderID,ProductID,UnitPrice,Discount,Quantity,ProductName)。 因?yàn)槲覀冎涝谝粋€(gè)訂單中可以訂購多種產(chǎn)品,所以單單一個(gè) OrderID 是不足以成為主鍵的,主鍵應(yīng)該是(OrderID,ProductID)。顯而易見 Discount(折扣),Quantity(數(shù)量)完全依賴(取決)于主鍵(OderID,ProductID),而 UnitPrice,ProductName 只依賴于 ProductID。所以 OrderDetail 表不符合 2NF。不符合 2NF 的設(shè)計(jì)容易產(chǎn)生冗余數(shù)據(jù)。 可以把【OrderDetail】表拆分為【OrderDetail】(OrderID,ProductID,Discount,Quantity)和【Product】(ProductID,UnitPrice,ProductName)來消除原訂單表中UnitPrice,ProductName多次重復(fù)的情況。 ◆ 第三范式(3NF):首先是 2NF,另外非主鍵列必須直接依賴于主鍵,不能存在傳遞依賴。即不能存在:非主鍵列 A 依賴于非主鍵列 B,非主鍵列 B 依賴于主鍵的情況。 考慮一個(gè)訂單表【Order】(OrderID,OrderDate,CustomerID,CustomerName,CustomerAddr,CustomerCity)主鍵是(OrderID)。 其中 OrderDate,CustomerID,CustomerName,CustomerAddr,CustomerCity 等非主鍵列都完全依賴于主鍵(OrderID),所以符合 2NF。不過問題是 CustomerName,CustomerAddr,CustomerCity 直接依賴的是 CustomerID(非主鍵列),而不是直接依賴于主鍵,它是通過傳遞才依賴于主鍵,所以不符合 3NF。 通過拆分【Order】為【Order】(OrderID,OrderDate,CustomerID)和【Customer】(CustomerID,CustomerName,CustomerAddr,CustomerCity)從而達(dá)到 3NF。 第二范式(2NF)和第三范式(3NF)的概念很容易混淆,區(qū)分它們的關(guān)鍵點(diǎn)在于,2NF:非主鍵列是否完全依賴于主鍵,還是依賴于主鍵的一部分;3NF:非主鍵列是直接依賴于主鍵,還是直接依賴于非主鍵列。 ------------------------- 書上講了好多, 歸結(jié)起來3句話:
1NF:字段不可分; 2NF:有主鍵,非主鍵字段依賴主鍵; 3NF:非主鍵字段不能相互依賴; 解釋: 1NF:原子性 字段不可再分,否則就不是關(guān)系數(shù)據(jù)庫; 2NF:唯一性 一個(gè)表只說明一個(gè)事物; 3NF:每列都與主鍵有直接關(guān)系,不存在傳遞依賴; 不符合第一范式的例子(關(guān)系數(shù)據(jù)庫中create不出這樣的表): 表:字段1, 字段2(字段2.1, 字段2.2), 字段3 ...... 存在的問題: 因?yàn)樵O(shè)計(jì)不出這樣的表, 所以沒有問題; 不符合第二范式的例子: 表:學(xué)號(hào), 姓名, 年齡, 課程名稱, 成績(jī), 學(xué)分; 這個(gè)表明顯說明了兩個(gè)事務(wù):學(xué)生信息, 課程信息; 存在問題: 數(shù)據(jù)冗余,每條記錄都含有相同信息; 刪除異常:刪除所有學(xué)生成績(jī),就把課程信息全刪除了; 插入異常:學(xué)生未選課,無法記錄進(jìn)數(shù)據(jù)庫; 更新異常:調(diào)整課程學(xué)分,所有行都調(diào)整。 修正: 學(xué)生:Student(學(xué)號(hào), 姓名, 年齡); 課程:Course(課程名稱, 學(xué)分); 選課關(guān)系:SelectCourse(學(xué)號(hào), 課程名稱, 成績(jī))。 滿足第2范式只消除了插入異常。 不符合第三范式的例子: 學(xué)號(hào), 姓名, 年齡, 所在學(xué)院, 學(xué)院聯(lián)系電話,關(guān)鍵字為單一關(guān)鍵字"學(xué)號(hào)"; 存在依賴傳遞: (學(xué)號(hào)) → (所在學(xué)院) → (學(xué)院地點(diǎn), 學(xué)院電話) 存在問題: 數(shù)據(jù)冗余:有重復(fù)值; 更新異常:有重復(fù)的冗余信息,修改時(shí)需要同時(shí)修改多條記錄,否則會(huì)出現(xiàn)數(shù)據(jù)不一致的情況 刪除異常 修正: 學(xué)生:(學(xué)號(hào), 姓名, 年齡, 所在學(xué)院); 學(xué)院:(學(xué)院, 地點(diǎn), 電話)。 作者:sunxing007 |
|