2. Tập PTH tối thiểu
• Tập PTH F là tối thiểu nếu thỏa các điều kiện sau
– Mọi PTH của F chỉ có một thuộc tính ở vế phải.
– Không thể thay X A thuộc F bằng Y A với Y X
mà tập mới tương đương với F.
– Nếu bỏ đi một PTH bất kỳ trong F thì tập PTH còn lại
không tương đương với F.
• Phủ tối thiểu (Minimal Covers) của tập PTH E là
tập PTH tối thiểu F tương đương với E.
• Nhận xét
– Mọi tập PTH có ít nhất một phủ tối thiểu.
2
3. Thuật toán tìm phủ tối thiểu (Bernstein, 1976)
Thuật toán 3.3:
Nhập: tập PTH E.
Xuất: phủ tối thiểu F của E.
Phương pháp :
– B1: F := .
– B2: (Tách các PTH để có vế phải là 1 thuộc tính)
Với mọi X Y E, Y = {A1, …, Ak}, Ai U
F := F {X {Ai}}.
– B3: (Loại bỏ các thuộc tính dư thừa vế trái)
Với mỗi X {A} F, X = {B1, …, Bl}, Bi U
Với mỗi Bi, nếu A (X - {Bi})F+ thì
F := (F - {X {A}}) {(X - {B}) {A}}.
– B4: (Loại bỏ các PTH dư thừa)
Với mỗi X {A} F
G := F - {X {A}}
Nếu A XG+ thì F := F - {X {A}}.
3
4. Ví dụ tìm phủ tối thiểu
Tìm phủ tối thiểu của E = {A BC, A B, B C,
AB C}
– B1: F = .
– B2: F = {A B, A C, B C, AB C}.
– B3: Xét AB C
(B)F+ = C
F = {A B, A C, B C}.
– B4: A C thừa.
F = {A B, B C}.
4
5. Chuẩn hóa lược đồ CSDL
Các dạng chuẩn
– Dạng 1 (1 Normal Form - 1NF).
– Dạng 2 (2 Normal Form - 2NF).
– Dạng 3 (3 Normal Form - 3NF).
– Dạng Boyce - Codd
(Boyce - Codd Normal Form - BCNF).
5
6. Dạng chuẩn 1
Định nghĩa 3.5: Quan hệ r(U) được gọi thuộc dạng chuẩn 1 nếu
và chỉ nếu mọi thuộc tính của r là thuộc tính đơn.
PHONG
TenP
MaP
TrPhg
CacTruso
Kinh doanh 5
333445555 Go Vap,
Thu Duc
Hanh chinh 4
987654321 Go Vap
Không thuộc
dạng chuẩn 1
PHONG
TenP
MaP
TrPhg
Truso
Kinh doanh 5
333445555 Go Vap
Kinh doanh 5
333445555 Thu Duc
Hanh chinh 4
987654321 Go Vap
Thuộc dạng chuẩn 1
Nhận xét: Dạng chuẩn 1 có thể dẫn đến sự trùng lặp dữ
liệu. Do đó gây ra các dị thường về cập nhật dữ liệu
6
7. Dạng chuẩn 2 theo khóa chính (1)
Định nghĩa 3.6: Quan hệ r(U) được gọi là thuộc dạng chuẩn 2 nếu mọi
thuộc tính không khóa của r phụ thuộc đầy đủ vào khóa chính của r.
r(U), K U là khóa chính của r
– A U là thuộc tính không khóa nếu A K.
– X Y là PTH đầy đủ nếu A X thì (X - {A}) Y không đúng trên r.
Ngược lại X Y là PTH bộ phận.
Ví dụ
Thuộc tính không khóa
PTH đầy đủ
NVIEN_DUAN
MaNV MaDA SoGio TenNV TenDA Diadiem
FD1
PTH bộ phận
FD2
FD3
7
8. Dạng chuẩn 2 theo khóa chính (2)
NVIEN_DUAN
MaNV MaDA SoGio TenNV TenDA Diadiem
FD1
FD2
FD3
NV_DA1
NV_DA2
MaNV MaDA
FD1
SoGio
MaNV
FD2
NV_DA3
TenNV
MaDA
TenDA
Diadiem
FD3
3 lược đồ NV_DA1, NV_DA2, NV_DA3 thuộc dạng chuẩn 2
8
9. Dạng chuẩn 2 theo khóa chính (3)
NHANVIEN_PHONGBAN
TenNV MaNV NgSinh
DChi
MaPB TenPB TrPhong
FD1
FD2
Thuộc dạng
chuẩn 2
Nhận xét
– Mọi lược đồ quan hệ thuộc dạng chuẩn 2 cũng thuộc
dạng chuẩn 1.
– Còn xuất hiện sự trùng lặp dữ liệu. Do đó gây ra các dị
thường về cập nhật dữ liệu.
9
10. Dạng chuẩn 3 theo khóa chính (1)
Định nghĩa 3.7: Quan hệ r(U) được gọi là thuộc dạng chuẩn 3 nếu
– r thuộc dạng chuẩn 2.
– Mọi thuộc tính không khóa của r không phụ thuộc bắc cầu vào khóa
chính của r.
Cho r(U)
– X Y là PTH bắt cầu nếu Z U, Z không là khóa và cũng không là tập
con của khóa của r mà X Z và Z Y đúng trên r.
Ví dụ
NHANVIEN_PHONGBAN
PTH bắt cầu
TenNV MaNV NgSinh
DChi
MaPB TenPB TrPhong
FD1
FD2
FD3
10
11. Dạng chuẩn 3 theo khóa chính (2)
Thuộc dạng
chuẩn 3
NV_PB1
TenNV MaNV
NV_PB2
NgSinh
Diachi MaPB
MaPB TenPB TrPhg
Nhận xét
– Mọi lược đồ quan hệ thuộc dạng chuẩn 3 cũng thuộc
dạng chuẩn 2.
– PTH bắt cầu là nguyên nhân dẫn đến trùng lặp dữ liệu.
– Dạng chuẩn 3 là dạng chuẩn tối thiểu trong thiết kế
CSDL.
11
12. Dạng chuẩn 2 tổng quát
Định nghĩa 3.8: Lược đồ quan hệ R được gọi là thuộc dạng
chuẩn 2 nếu mọi thuộc tính không khóa của R phụ thuộc
đầy đủ vào các khóa của R.
Cho R(ABCDEF) có 2 khóa là A và BC.
R
A
B
C
D
E
F
FD1
FD2
FD3
FD4
FD5
Lược đồ R không thuộc dạng chuẩn 2
12
13. Dạng chuẩn 3 tổng quát
Định nghĩa 3.9: Lược đồ quan hệ R được gọi là thuộc dạng
chuẩn 3 nếu PTH X A đúng trên R thì
– X là siêu khóa của R, hoặc
– A là thuộc tính khóa của R.
R1(ABCDE) có 2 khóa là A và BC.
R1
A
FD1
FD2
FD4
FD5
B
C
D
E
Lược đồ bên
thuộc dạng
chuẩn 2,
nhưng không
thuộc dạng
chuẩn 3
13
14. 3.4 Phân rã lược đồ quan hệ
Lược đồ quan hệ R(A1, …, An)
– Tập hợp tất cả các thuộc tính của các thực thể.
Xác định tập PTH F trên R.
Phân rã
– Sử dụng các thuật toán chuẩn hóa để tách R thành tập
các lược đồ D = {R1, …, Rm}.
Yêu cầu
– Bảo toàn thuộc tính.
– Các lược đồ Ri phải ở dạng chuẩn 3 hoặc BoyceCodd.
14
15. Phân rã bảo toàn PTH
Tính chất bảo toàn PTH
– Xét lược đồ R và tập PTH F. Giả sử R được phân rã
thành D = {R1, …, Rm}.
• Đặt Ri(F) = {X Y F+ : X Y Ri}.
• D được gọi là phân rã bảo toàn phụ thuộc hàm đối với F nếu
(R1(F) … Rm(F))+ = F+.
R11
Ví dụ
A
R111
A
B
C
D
C
D
FD1
FD1
FD2
R112
FD5
B
D
FD5
15
16. Thuật toán phân rã lược đồ DC3
và bảo toàn PTH (Berstein 1976)
Thuật toán 3.6
Nhập: R(U), U = {A1, …, An} và tập PTH F.
Xuất: D = {R1, …, Rm}, Ri ở dạng chuẩn 3.
– B1: Tìm phủ tối thiểu G của F.
– B2: Với mỗi X Aj G, xây dựng lược đồ Ri(Ui),
Ui = X {Aj}. Khóa chính của Ri là X.
– B3: Giả sử xong B2 ta có các lược đồ R1, …, Rm.
Nếu U1 … Um U thì xây dựng thêm lược đồ
Rm+1(Um+1), Um+1 = U - (U1 … Um).
Khóa của Rm+1 là Um+1.
– B4: Xuất các lược đồ Ri.
16
17. Ví dụ phân rã bảo toàn PTH (1)
Cho
– R(ABCDEFG)
– F = {B A, D C, D EB, DF G}
Tách về dạng chuẩn 3, bảo toàn PTH
– B1:
• Phủ tối thiểu G = {B A, D C, D B, D E, DF G}.
– B2:
R(ABCDEFG)
R1(BA)
R(DC)
R(DB)
R(DE)
R3(DFG)
R2(DBCE)
– B3:
• Xuất D = {R1, R2, R3}.
17
18. Ví dụ phân rã bảo toàn PTH (2)
Cho
– R(ABCDEFGHI)
– F = {B A, D C, D EB, DF G}
Tách về dạng chuẩn 3, bảo toàn PTH
– B1:
• Phủ tối thiểu G = {B A, D C, D B, D E, DF G}.
– B2:
R(ABCDEFG)
R1(BA)
R2(DBCE)
R3(DFG)
– B3:
• Vì U1 U2 U3 = {ABCDEFG} nên đặt R4(HI).
– B4:
• D = {R1, R2, R3, R4}.
18
19. Bài tập 1:
Cho lược đồ quan hệ R(ABCDE) và tập phụ
thuộc hàm:
F = {A -> B; CD -> E; B -> C}
1. Tìm một khóa của lược đồ.
2. Tìm tất cả các khóa của lược đồ.
3. Cho biết dạng chuẩn cao nhất của lược đồ
trên? Nếu chưa đạt dạng chuẩn 3 hãy tìm
một phép phân rã thành các lược đồ con
đạt dạng chuẩn 3 và bảo toàn thông tin.
19
20. Tìm một khóa
Áp dụng các bước tìm bao đóng của tập các
thuộc tính:
•
•
•
•
•
Lặp 1: (BCDE)F+ = BCDE K = ABCDE.
Lặp 2: (ACDE)F+ = ABCDE K = ACDE.
Lặp 3: (ADE)F+ = ADEBC K = ADE.
Lặp 4: (AE)F+ = AEBC K = ADE.
Lặp 5: (AD)F+ = ADBCE K = AD.
AD là khoá.
20
21. - Khóa là AD, R không đạt 2NF vì A B
- Tìm một phép phân rã tách lược đồ trên thành các lược đồ
con đạt dạng chuẩn 3.
Cho lược đồ quan hệ R(ABCDE) và tập phụ thuộc hàm:
F=Ftt = {A -> B; CD -> E; B -> C}
R(ABCDE)
R1(BC)
R2(ADEB)
{A -> B}
R21(AB)
R22(ADE)
21
22. - Khóa là AD, R không đạt 2NF vì A B
- Tìm một phép phân rã tách lược đồ trên thành các lược đồ
con đạt dạng chuẩn 3.
Cho lược đồ quan hệ R(ABCDE) và tập phụ thuộc hàm:
F=Ftt = {A -> B; CD -> E; B -> C}
22
23. Bài tập 2
Cho lược đồ quan hệ R(A,B,C,D,E,G,H,I,J,K) và tập
các phụ thuộc hàm:
F = {A -> B ; C -> D,H,I ; I,J -> K ; B,C -> A ; H,C -> E}
1. Tìm một khóa của lược đồ.
2. Tìm tất cả các khóa của lược đồ.
3. Cho biết dạng chuẩn cao nhất của lược đồ trên?
Nếu chưa đạt dạng chuẩn 3 hãy tìm một phép phân
rã thành các lược đồ con đạt dạng chuẩn 3 và bảo
toàn thông tin.
23
24. 1. Tìm một khóa của lược đồ
Áp dụng các bước tìm bao đóng của tập các thuộc
tính:
•
•
•
•
•
•
•
•
•
•
Lặp 1: (ABCDEGHIJK)F+ = R K = BCDEGHIJK
Lặp 2: (BCDEGHIJK) F+ R K = BCDEGHIJK
Lặp 3: (BDEGHIJK) F+ R K = BCDEGHIJK
Lặp 4: (BCEGHIJK) F+ = R K = BCEGHIJK.
Lặp 5: (BCGHIJK ) F+ = R K = BCGHIJK
Lặp 6: (BCGHIJK ) F+ R K = BCGHIJK
Lặp 7: (BCGIJK ) F+= R K = BCGIJK
Lặp 8: (BCGJK ) F+ = R K = BCGJK
Lặp 9: (BCGK ) F+ R K = BCGJK
Lặp 10: (BCGJ ) F+ = R K = BCGJ
24
25. 2. Tìm tất cả các khóa của lược đồ
Có 2 khóa:
K1=(BCGJ)
K2=(ACGJ)
25
26. Cho biết dạng chuẩn cao nhất
R không đạt 2NF vì C D
26
27. Bài tập
Cho lược đồ quan hệ R(A,B,C,D,E,G) và tập các phụ
thuộc hàm:
F = {A -> D ; E->B ;A,E->G ; B->C}
1. Tìm một khóa của lược đồ.
2. Tìm tất cả các khóa của lược đồ.
3. Cho biết dạng chuẩn cao nhất của lược đồ trên?
Nếu chưa đạt dạng chuẩn 3 hãy tìm một phép phân
rã thành các lược đồ con đạt dạng chuẩn 3 và bảo
toàn thông tin.
27
28. a.,b. AE là khóa
c. Phân rã: F = {A -> D ; E->B ;A,E->G ; B->C}
- R không đạt 2NF vì có PTH A->D, D không phụ
thuộc đầy đủ vào khóa.
R(ABCDEG)
R1(BC)
R2(ABDEG)
{A -> D ; E->B ;A,E->G}
R21(EB)
R22(ADEG)
{A -> D ; A,E->G}
R221(AD) R222(AEG)
28
29. Bài tập ví dụ:
Cho lược đồ quan hệ R(A,B,C,D,E)
và tập các phụ thuộc hàm:
F = {AB -> C ; AB->D ;D->A ; BC-D,BC->E}
Cho biết dạng chuẩn cao nhất của lược đồ trên?
Nếu chưa đạt dạng chuẩn 3 hãy tìm một phép phân
rã thành các lược đồ con đạt dạng chuẩn 3, bảo toàn
thông tin, bảo toàn PTH.
29
30. Cho lược đồ quan hệ R(A,B,C,D,E)
và tập các phụ thuộc hàm:
F = {AB -> C ; AB->D ;D->A ; BC-D,BC->E}
- Q.hệ R không đạng dạng chuần 2 vì tồn tại
PTH D->A trong đó thuộc tính A không
phụ thuộc đầy đủ vào khóa BD
30
31. - Tìm phủ tối thiểu của F
B2: (Tách các PTH để có vế phải là 1 thuộc tính)
PTH ={AB->C, AB->D, D->A, BC->D, BC->E}
f1
f2
f3
f4
f5
B3: (Loại bỏ các thuộc tính dư thừa vế trái)
- Xét: AB->C:
- Bỏ A: (B)PTH+=B không xác định được C
- Bỏ B: (A)PTH+=A không xác định được C
Không loại bỏ được PTH AB -> C
- Xét: AB->D:
- Bỏ A: (B)PTH+=B không xác định được D
- Bỏ B: (A)PTH+=A không xác định được D
Không loại bỏ được PTH AB -> D
Xét tương tự cho các phụ thuộc hàm còn lại
31
32. Tập PTH tìm được sau bước 3:
PTH ={AB->C, AB->D, D->A, BC->D, BC->E}
f1
f2
f3
f4
f5
B4: (Loại bỏ các PTH dư thừa)
- Với f1= AB->C
F1= PTH {f1}
- (AB)F1+=ABD
không xác định được C
Không loại bỏ được f1
- Với f2= AB->D
F2= PTH {f2}
- (AB)F2+=ABCDE xác định được D
Loại bỏ được f2
PTH ={AB->C, D->A, BC->D, BC->E}
f1
f3
f4
f5
- Với f3= D->A
F3= PTH {f3}
- (D)F3+=D không xác định được A
Không loại bỏ được f3
-
Tương tự với f3,f4,f5
32
33. Phủ tối thiểu tìm được:
PTT ={AB->C, D->A, BC->D, BC->E}
f1
f3
f4
f5
Lược đồ R phân rã thành 3 lược đồ con:
–- R1(ABC) Khóa AB (AB->C)
–- R2(AD)
Khóa D (D->A)
–- R3(BCDE) Khóa BC (BC->DE)
33