Tải bản đầy đủ (.pdf) (51 trang)

Phép tách không mất thông tin trong mô hình dữ liệu dạng khối

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (658.79 KB, 51 trang )

B ộ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI
HỌC
s ư PHẠM
HÀ NỘI
2





PHAN THỊ THU HÀNG

PHÉP TÁCH KHÔNG MẤT THÔNG TIN
TRONG MÔ HÌNH DỮ LIỆU DẠNG KHỐI

LUẬN
VĂN THẠC
Sĩ KHOA HỌC
MÁY TÍNH




HÀ NỘI, 2015


B ộ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI
HỘC
S ư PHẠM


HÀ NỘI
2





PHAN THỊ THU HẰNG


PHÉP TÁCH KHÔNG MẤT THÔNG TIN
TRONG MÔ HÌNH DỮ LIỆU DẠNG KHÓI
Chuyên ngành: Khoa học máy tính
Mã số: 60 48 01 01

LUẬN
VĂN THẠC
Sĩ KHOA HỌC
MÁY TÍNH



Người hướng dẫn khoa học: TS. Lê Văn Phùng

HÀ NỘI, 2015


LỜI CẢM ƠN

Để hoàn thành luận văn này tôi đã nhận được sự giúp đỡ tận tình của

thầy hướng dẫn khoa học, của các thầy cô trường Đại học Sư phạm Hà Nội 2.
Tôi xin chân thành cảm ơn các thầy cô trường Đại học Sư phạm Hà Nội 2 đã
tạo điều kiện học tập, nghiên cứu và giúp đỡ tôi rất nhiều trong quá trình làm
luận văn. Đặc biệt tôi xin cảm ơn thầy TS Lê Văn Phùng đã tận tình hướng
dẫn, chỉ bảo tôi ưong suốt quá trình học tập, nghiên cứu đề tài và giúp đỡ tôi
hoàn thành bản luận văn này.
Vĩnh Phúc, ngày 10 tháng 12 năm 2015
Học viên

Phan Thị Thu Hằng


LỜI CAM ĐOAN

Tôi xin cam đoan đây là kết quả nghiên cứu của tôi dưới sự hướng dẫn
khoa học của TS Lê Văn Phùng.
Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được
ai công bố trong bất kỳ công trình nào khác.Tôi cũng xin cam đoan rằng mọi
sự giúp đỡ cho việc thực hiện luận văn này đã được cảm ơn và các thông tin
trích dẫn trong luận văn đã được chỉ rõ nguồn gốc

Học viên

Phan Thị Thu Hằng


MỤC LỤC
LỜI CẢM ƠN
LỜI CAM ĐOAN
DANH MỤC CÁC BẢNG BIỂU, HÌNH VẼ

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
MỞ ĐẦU............................................................................................................. 1
1. Lý do chọn đề tài.......................................................................................... 1
2. Mục đích nghiên cứu.................................................................................... 1
3. Nhiệm vụ nghiên cứu................................................................................... 1
4. Đối tượng và phạm vi nghiên cứ u...............................................................2
5. Phương pháp nghiên cứu............................................................................. 2
6

. Những đóng góp mới của đề tà i..................................................................2

7. Cấu trúc của luận văn.................................................................................. 2
CHƯƠNG 1. CÁC MÔ HÌNH DỮ LIỆU.......................................................... 4
1.1. Mô hình thực thể - liên k ết.......................................................................4
1.2. Mô hình dữ liệu quan hệ........................................................................... 4
1.3. Mô hình dữ liệu dạng khối....................................................................... 5
1.3.1. Các khái niệm chung nhất về khối và lược đồ khối.......................... 5
1.3.2. Đại số quan hệ trên khối.................................................................... 8
1.3.3.Các thuật toán cài đặt........................................................................ 15
Kết luận chương 1.......................................................................................... 21
CHƯƠNG 2. PHÉP TÁCH KHÔNG MẤT THÔNG TIN TRONG MÔ HÌNH
DỮ L Ệ U DẠNG KHỐI...................................................................................22
2.1 Các dạng chuẩn cho lược đồ khối.............................................................22
2.1.1 Dạng chuẩn 1.....................................................................................22
2.1.2 Dạng chuẩn 2 .....................................................................................22
2.1.3 Dạng chuẩn 3 .....................................................................................23
2.1.4.

Dạng chuẩn Boye-Codd.............................................................. 23



2.2 Các dạng tựa chuẩn................................................................................. 24
2.2.1 Dạng tựa chuẩn 2 .............................................................................. 24
2.2.2 Dạng tựa chuẩn 3 .............................................................................. 24
2.2.3 Dạng tựa chuẩn boye - Codd........................................................... 25
2.3 Phép tách không mất thông tin .............................................................. 26
2.3.1. Khái niệm phép tách không mất thông tin.......................................26
2.3.2. Phương pháp tách không mất thông tin ...........................................26
2.3.3. Thuật toán tách bảo toàn tập phụ thuộc hàm và chuyển về dạng tựa
chuẩn b a ..................................................................................................... 30
Kết luận chương 2 ..........................................................................................31
CHƯƠNG 3. CHƯƠNG TRÌNH THỬ NGHỆM

PHÉPTÁCH KHÔNG

MẤT THÔNG TIN TRONG MÔ HÌNH DỮ L Ệ U DẠNG KHỐI................32
3.1. Mô tả bài toán.........................................................................................32
3.2.Kết quả thử nghiệm và đánh giá..............................................................35
3.2.1. Môi trường thử nghiệm....................................................................35
3.2.2. Chương trình thử nghiệm kiểm tra phép tách có mất thông tin hay
không.......................................................................................................... 35
KẾT LUẬN....................................................................................................... 42
TÀI LIỆU THAM KHẢO................................................................................ 43


DANH MỤC CÁC BẢNG BIỂU HÌNH VẼ
DANH MỤC HÌNH
Hình 1.1. Biểu diễn khối điểm học viên DiemHV

............................................. 6


Hình 1.2. Biểu diễn 2 khối r, s khả hợp.................................................................. 8
Hình 1.3. Biểu diễn các khối r, s, r^J s ................................................................... 9
Hình 1.4. Biểu diễn các khối r, s, r Pi s .................................................................. 10
Hình 1.5. Biểu diễn các khối: r , s , s \ r ........................................................ 11
Hình 3.1 Minh họa bài toán với 10 phân xưởng (n=10)......................................... 33
DANH MỤC BẢNG
Bảng 1.1. Biểu diễn lát cắt r(RHọckỳi)-

7


DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIÉT TẮT

Luận văn này dùng thống nhất các ký hiệu và chữ viết tắt sau:
Ký hiệu

Ý nghĩa

Dom(A)

miền giá trị của thuộc tính A

r hoặc r(R)

khối r trên tập R

Rx

lát cắt của r(R) tại điểm X.


x(i) = (x, Ai)

các thuộc tính chỉ số của lược đồ khối (x e id, i = 1.

id(i)= {x(i)lx
Fh

e

id} tập các thuộc tính chỉ số của lược đồ khối.
Tập các phụ thuộc hàm trên R


1

M Ở ĐÀU

1. Lý do chọn đề tài
Trong những năm gần đây, việc nghiên cứu nhằm mở rộng mô hình
quan hệ đã được nhiều nhà khoa học quan tâm. Theo hướng nghiên cứu này
một mô hình dữ liệu mới đã được đề xuất, đó là mô hình dữ liệu dạng khối.
Mô hình dữ liệu này có thể xem là phần mở rộng của mô hình dữ liệu quan
hệ. Đã có một số loại mô hình được sử dụng trong các hệ thống cơ sở dữ liệu
trong đó mô hình quan hệ được quan tâm hơn cả. Sở dĩ mô hình quan hệ được
quan tâm như vậy là vì nó được xây dựng trên một cơ sở toán học chặt chẽ đó là lí thuyết toán học về các quan hệ có áp dụng rộng rãi các công cụ đại số
và logic.
Tôi mạnh dạn chọn đề tài cho luận văn thạc sĩ của mình là “Phép tách
không mất thông tin trong mô hình dữ liệu dạng khối” để phần nào mô tả chi
tiết hơn về mô hình dữ liệu dạng khối. Trên cơ sở đó có thể đưa mô hình này

ứng dụng vào các bài toán quản lý hệ thống thông tin quản lý theo mô hình dữ
liệu dạng khối.
2. Mục đích nghiên cứu
Nghiên cứu về phép tách đảm bảo không mất thông tin trong mô hình
dữ liệu dạng khối
3. Nhiệm vụ nghiên cứu
1. Tổng quan về lý thuyết phép phân rã một sơ đồ quan hệ trong mô
hình dữ liệu quan hệ
2. Nghiên cứu về các dạng chuẩn và tựa chuẩn trong mô hình dữ liệu
dạng khối
3. Nghiên cứu về phép tách một lược đồ khối bảo đảm không mất thông
tin


2

4.

Vận dụng kết quả nghiên cứu cho một bài toán quản lý hệ thống

thông tin quản lý theo mô hình dữ liệu dạng khối
4. Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu của đề tài là sơ đồ khối trong mô hình dữ liệu
dạng khối
Phạm vi nghiên cứu của đề tài là phép tách sơ đồ khối bảo đảm không
mất thông tin
5. Phương pháp nghiên cứu
- Phương pháp tổng hợp phân tích các vấn đề liên quan đến đề tài,
- Phương pháp thống kê kết hợp với phương pháp chuyên gia
- Phương pháp kết hợp lý thuyết vói thực nghiệm trên máy tính

6.

Những đóng góp mói của đề tài
- Tổng quan về mô hình dữ liệu dạng khối
- Tổng hợp về các loại chuẩn, tựa chuẩn trong mô hình dữ liệu dạng

khối
- Xây dựng được quy trình tách một lược đồ khối phức tạp thành nhiều
lược đồ khối đơn giản hơn nhưng vẫn bảo toàn dữ liệu
- Góp phần làm đơn giản quá trình giải quyết bài toán thực tế có mô
hình dữ liệu khối
7. Cấu trúc của luân văn
Luận văn gồm: Lời mở đầu, ba chương nội dung, phần kết luận và tài
liệu tham khảo.
Chương 1: Trình bày các khái niệm cơ bản nhất về các mô hình dữ liệu: Mô
hình thực thể - liên kết, mô hình dữ liệu quan hệ, mô hình dữ liệu dạng khối,
các khái niệm chung nhất về khối và lược đồ khối, đại số quan hệ ưên khối,
và các thuật toán cài đặt
Chương 2: Trình bày về phép tách không mất thông tin trong mô hình dữ liệu


3

dạng khối: Các dạng chuẩn cho lược đồ khối, các dạng tựa chuẩn, khái niệm
về phép tách không mất thông tin và phương pháp tách không mất thông tin.
Chương 3: Chương trình thử nghiệm phép tách không mất thông tin trong mô
hình dữ liệu dạng khối.


4


CHƯƠNG 1
CÁC MÔ HÌNH D ữ LIỆU
1.1. Mô hình thực thể - liên kết
Thuật ngữ “thực thể” (entity) không có một định nghĩa hình thức, cũng
giống như các thuật ngữ “điểm” và “đường” ừong hình học ngầm được định
nghĩa bằng các tiên đề về các đặc tính của chúng. Ta có thể nói rằng: thực thể
là một sự yật tồn tại và phân biệt được, nghĩa là có thể phân biệt thực thể này
với thực thể khác.
Một nhóm bao gồm tất cả các thực thể “tương tự” tạo ra một tập thực thể
(entity set). Tính “tương tự” ít nhất cũng đòi hỏi rằng có thể tìm được một tập
các đặc tính chung cho tất cả các phần tử của một tập thực thể.
Các đặc tính của tập thực thể gọi là các thuộc tính.
Ngoài ra trong mô hình còn có nhiều khái niệm cơ bản khác như: hóa,
phân cấp isa, mối liên hệ, sơ đồ thực thể - liên kết... Mục đích của mô hình
này là cho phép mô tả lược đồ khái niệm của một tổ chức mà không cần chú ý
đến tính hiệu quả hoặc các chi tiết thiết kế cơ sở dữ liệu vật lý.
1.2. Mô hình dữ liệu quan hệ
Khái niệm toán học làm nền tảng cho mô hình quan hệ là các quan hệ theo
lí thuyết tập hợp. Đó là tập con của tích Đề Các của một danh sách các miền,
mỗi miền đơn giản là một tập các giá trị. Ta có thể xem một quan hệ như một
bảng, trong đó mỗi hàng là một bộ và mỗi cột là một
thuộc tính.
Ta có thể biểu diễn một sơ đồ thực thể - liên kết trong mô hình quan hệ.
Khi đó các dữ liệu của mô hình thực thể - liên kết được biểu diễn bởi hai loại
quan hệ :


5


- Một tập thực thể E có thể được biểu diễn bởi một quan hệ mà lược đồ
quan hệ của nó chứa tất cả các thuộc tính của tập thực thể đó. Mỗi bộ của
quan hệ biểu diễn một thực thể trong thể hiện của E.
- Mối liên hệ giữa các tập El, E2 ...., Ek được biểu diễn bởi một quan hệ có
lược đồ quan hệ chứa các thuộc tính trong các khóa của El, E2 .... , Ek. Bằng
cách đặt lại tên cho các thuộc tính nếu cần, ta đảm bảo rằng không có hai tập
thực thể trong danh sách có các thuộc tính cùng tên, ngay cả khi hai tập thực
thể này chỉ là một.
1.3. Mô hình dữ liệu dạng khối
1.3.1. Các khái niệm chung nhắt về khối và lược đồ khối
Khái niệm toán học làm nền tảng cho mô hình cơ sở dữ liệu dạng khối
(gọi tắt là mô hình khối) là các khối hiểu theo nghĩa của lý thuyết tập họp.
Khối được định nghĩa như sau:
Định nghĩa 1.1
Gọi R = (id;Al,A2,...An) là một bộ hữu hạn các phàn tử, trong đó id là
tập chỉ số hữu hạn khác rỗng, Aị(i = \...n) là các thuộc tính. Mỗi thuộc tính
Aị(i = 1...rì) có miền giá tri tương ứng là dom(Aị). Một khối r trên tập R , kí
hiệu r(R) gồm một số hữu hạn phần tử mà mỗi phần tử là một họ các ánh xạ
từ tập chỉ số id đến các miền trị của các thuộc tính Aị,(i = l...n). Nói một
cách khác: t G r(R) <^>t = {t*: id —» dom(Aj) } i=1 n.
Ta kí hiệu khối đó là r(R)hoặcr(id;Aí,A2,...,An), đôi khi nếu không
sợ nhàm lẫn ta kí hiệu đơn giản là r .
Khi đó khối r(R) được gọi là có lược đồ khối R . Như vậy trên cùng
một lược đồ khối p ta có thể xây dựng được nhiều khối khác nhau.
Ví dụ 1.1 :Ta xây dựng khối điểm học viên kí hiệu DiemHV (R) hình 1.1


6

để quản lý điểm của học viên ứong một trường học như sau:

Cho lược đồ khối R = (id;Ah A2,A3,A4,A5) , trong đó: id = {Học kỳ I , Học
kỳ I I .... . và các thuộc tính là Aị= MaHV (mã học viên), A2= TenHV (tên
học viên), A3= GT (giói tính), A4 = Triet (triết), Aỹ= Anh (anh)
Với khối DiemHV (/?). ở hình 1.1, ta thấy nó gồm 3 phần tử: tị, *2>*3 •

MaHV TenH V G T Triet
V

y

\|/

\|/

Anh
Ф

SOI— A — ĩ --- 7.9 — 7 3
/I
/ị/ ị
/ị
/]
■SOI ị Ấ - , - F
\ -7;4 I 6.9 Ị
15 0 2 — ^ —=—

—!—5 !,0 - — 6,5

> S02 ! s l | _ J r -lf-s jo lj- 6 ,4 1
/-* I1 S ỉ .....8,8-1

о о -I J6 , 4
I .SO?I С
'/
Ị /
/•• Ị /
/ 3 ------»
503— С ---- Mr— 8,7— 6 , 8 <

h—

— H ọc kỳ I I
H ọc kỳ ỉ

^.

Hình 1.1. liiểu diễn khểi điểm học viên DiemHV
Khi đó ta có:
* Điểm Triet của học viên t2 ở thời điểm Học kỳ ỉ là:
í2 (Học kỳ I , Triet) = 5 ,0 .
* Tên của học viên tị ở Học kỳ II là:
^(Học kỳ II, TenHV) = A.
* Điểm Anh của học viên Í3 ở thời điểm Học kỳ II là:
í3 (Học kỳ I I , Anh) = 6 ,4 .


7

* Mã số của học viên Ц ở thòi điểm Học kỳ / là:
?3 (Học


kỳ / , MaHV) =503.

Định nghĩa 1.2
Cho R = {ỉd\A^,A2,...,An) , r(R) là một khối trên R . Với mỗi x& id ta
kí hiệu r(Rx) là một khối vói Rx = ({x}; Aị,A2, . . . , \ ) sao cho:
tỵ G r(Rx ) ‘w ’tx

{ tx

t }ị=\ n t e r(R),
X

ở đây

4

(*) = t \ x ) vói i = l...n.

Khi đó r(Rx) được gọi là một lát cắt trên khối r(/?)tại điểm

X.

Ví dụ 1.2: Với khối DiemHV(R) đã cho ở trên, R = (id;Ah A2, A3 , Aị,A 5)
trong đó: id = {Học kỳ / , Học kỳ // }.
Aị= MaHV, A2 = TenHV, A3 = GT, Л4 = Triet, A5 = Anh.
Neu

X

^(■^Họckỳĩ)


= Học kỳ I G id thì lát cắt K^Họckỳ/) có dạng như sau:
MaHV

TenHV

GT

Triet

Anh

501

A

F

7,4

6,9

502

В

F

5,0


6,4

503

С

м

8,7

6 ,8

Bảng 1.1. Biểu diễn lát cắt r(RHọckỳjy
Nhân xét
Cho lược đồ khối R=(id; Ah A2,..., An), r(R) là một khối trên R . Với mỗi
x e id thì lát cắt r(Rx) là một quan hệ. Trong trường hợp tập chỉ số id chỉ
gồm một phàn tử thì r(R) trở thành một quan hệ.
Như vậy mỗi quan hệ r(A 1,A2 ,...,A„)là một trường họp đặc biệt của
khối, đó chính là khối r(R) vói R - ({jc}; Aị, A2,...,An).


8

Mệnh đề 1.1
Cho ỉược đồ khốiR = (id;Aị, A2 ,...,An), r(R) là một khối trên R, khi
đỏ tồn tại một họ quan hệ duy nhất biểu diễn họ ịr(Rx )X(=iđ } các ỉát cẳt của
khối r(R). Ngược lại không đúng, nghĩa là với một họ quan hệ cho trước biểu
diễn họ các lát cắt của một khổi nào đỏ thì khổi tìm được không duy nhất.
1.3.2. Đại sắ quan hệ trên khối
Cho r là một khối trên R=(id;Aị, A2t...9An) 9 ở đây ta giả thiết rằng r

là một khối gồm một tập hữu hạn các phần tử. Cũng tương tự như đại số quan
hệ trong mô hình cơ sở dữ liệu quan hệ, ở đây các phép toán của đại số quan
hệ lại được áp dụng cho các khối; bên cạnh đó còn có thêm phép toán mới
được xây dựng đó là: Tích Đề-các theo tập chỉ số.
Đối với các phép hợp, giao và trừ thì hai khối tham gia phải là khả hợp
(nghĩa là chúng có cùng một lược đồ khối).
Cho 2 khối r(R) và s(R) như hình vẽ dưới đây ta thấy hai khối này
cùng lược đồ khối: R = (iđ; Aị, A2, A3, Aậ) ; id = {x\,x2}

r

Ay

A2

A3

\ịr

^

^

С/.—

aẩ

s

лI




^3 Л



Iị

Cr— 0,4

Л h.И ' < 4 _ п

-0 .5

Ci V'h—

ì—r
ị - cH - 1- f
—Ị- h°]-~1~
j '3
a~'r— b f— èy— с

Cil

rái



A-,

x\

V — 4'

Hình 1.2. Biểu điễn 2 khối * s khả hợp.


9

a. Phép hợp.
Cho 2 khối r và s khả hợp, khi đố hợp của r và 5 , kí hiệu r u s là
một khối gồm các phần tử thuộc một trong hai khối r và s đã cho. Ta có:
r u j = { t |í € rhoặc í Gí}.
Ví dụ 1.3.Cho 2 khối r và s như sau:
ĩ

Aị



/Í3

A7



A

r


/í Ị

ị Ị



À2

Aa

I'





— ỘJ
c
c/ị— b\---- £3----/1 > 1 ‘ / I V
aĩ-i4 bi - \ c3 -\rUo./j
a:._L Àỉ.L_ C ỉ I 0.4

tií-ị- AỊ— c,—Ỉ-Ò.7
^ 4 —j! £4—; 0.3
ý
" 8—

|y s Ự
V


-7 < —

í2

------0 *8 ^ ------ -V,

/í|

.4}

Aậ

'ịl'

^

>Ị/f

ư\

b\

#3 —r

c\ — c

^3 —|- c3 —Ị—0,7

" i^ v T ^ i-Ị-o í
ậ | .ệ ^.íịj 4

«3—Ị- 4 - j - c3—

„/■tx? t i ' t

Ờ3 —ị—0 } —ị—c3 —ị—0 ,7
^v-4" ^2 "4" c2 “ |'"0,5
f P l p 1 1^1
-I—Ả..—i—c.

Hình 1.3. Biểu ãỉễn các khối r, í , r U ỉ .


10

b. Phép gỉao
Cho hai khối r và s khả hợp, khi đỗ giao của r và s là một khối, kí
hiệu r r \ s , là một khốimà các phần tử của nó thuộc đồng thời cả hai khối r
và s đã cho. Ta có: r n s ={t Ií e r và í€ ỉ} .
Ví dụ 1.4.

/Í|

Ã')

Ay

Aậ

^


\ị/r

\[f

Ф

■У Ả\



ь

Л

с

ф

?

a i - - - k ......J ; - г - 0 ,5

У 2У х У \ М
Я|— ỉ'| —ị- С-1—I—0,4
ỳ i yh"



Д4




к-т - к Ц -с Щ - 0-4
0.7

ý '1

<
4—%— cf—w

CV3 —|- /?3—Ị- С'з—Ị- 0.7
£/j—Ị- /j| I"■ ^-1*"—
- 0,4 «---- * 2

Si-ị

f±*y

Si^

Л

ị i i


ж



Clị--- lìỊ---- Cị---- 14

.. --I И
-1 , /
—[*—h ^3—г-о*7
15
—- Ỹ|*”"

— bỉ— c\— 0,4
Q
Л

A-ị

А

я



\-ỵ и

ữi — bị— C|— 0*71

5

U\----- b\—r cl—ị 0,4
pị ■■—£3 ' " ”p>7 <-Л'2
у is*'
S

ìỉị---- &3-- c3-— 0 ,7 < - X1


Hình 1.4Ш
Biểu diễn các khối

r,5,rní,

c. Phép trừ
Cho hai khối ĩ và s khả hợp, khi đó hiệu của r và 5 là một khối, kí
hiệu là r \ s , là một khối mà các phần tử của nó thuộc r nhưng không thuộc
s. Ta có: r\5 = {t|í e r và t ỂS}.
Ta có mối quan hệ giữa phép giao và phép trừ:

"\(r\s).


11

Ví dụ 1.5.

r
1'

f 2

1*

I4

Л]


^2

^3

^

vỊ'

'si'

5

ị ị ị ị

0 .4


з
^


0'7
[ .ậ

[> 5

ơ jlị-Ế | ^ ị- q —Ị—0,4

I ỳ ì a~ ỳ ĩK~ ỳ ĩ m~ y j *-*2
— 03— с-Ị— 0,7 ^—'T|

s \f

^

- A f— CỊ—

[ ..í Ạ f . ậ

í/ị—ị-/?l----q — Ị-0,4

^4

Aị

s
cl3

A')

&3;

-ỷ y -ý ^
c3

x2

Л4

ị I ị ị
Cỉị— hfìị—

\— c\— 0,4 < - .Vị
/
/
/
, /
"3— A3— ^3— 0 , 7<— Jf,

Hình 1.5. Biểu diễn cấc khối: r, s, s \ r.

d. Tích Đề các
Cho R = ụ d \ \ , A2^.,An), s = (id;Bh B2,...,Bm) , ở đây
{Aị,A2,~.,An}r>{Bị,B2,...,Bm} = 0 .
Khi đó Tích Đề-các của hai khối r(R) và s(S) là một khối, kí hiệu
rxs, khối này có khung R x S = ụ d \ \ , A2,...,An, Bị,

i phần tử

thuộc khối này là một bộ gồm n+m ánh xạ, trong đỗ n ánh xạ đầu có dạng
một phần tử thuộc r , còn m ánh xạ sau có dạng một phần tử thuộc s .
Biểu diễn hình thức của Tích Đề-các có dạng:
Jtxí= {f| t(R) e r và f(5 )es), trang đố: t = ( t \ t 2,..., tn, t n+ỉ,...,tn+m),t(R )
= (f\ t 2, t n) và t(S )= (tn+l,...,tn+m).


12

e. Tích Đề các theo tập chỉ số
Cho R=(id;Aị,A2,...,An), 5 = (^ ;Д ,А 2 ,...,Дг). Khi đó Tích Đề-các
của hai khối r(R) và £(5) theo tập chỉ số là một khối, kí hiệu r x id s, khối
này có khung R Xịd s={ỉ'dll


i2’—’A i}> với id П

là kí hiệu tích rời

rạc của hai tập chỉ số id và id '. Mỗi phần tử thuộc khối này là một bộ gồm n
ánh xạ (í1 ,í 2 ,...,í”) với i ’.id il
sinh từ

2

với ỉ-\...n , mỗi ánh xạ này được cảm

ánh xạ thứ i tương ứng của r và Î .

Cụ thể hơn, giả sử có 2 phần tử là: tr e r và tr es :
Их *

2

fílN
Is

- í„

Khi đó ta có ánh xạ cảm sinh của tr và ts, phần tử cảm sinh của tr và
ts kí hiệu là trs.
Gọi jị :id]l
trs h


e r

II

là các phép nhúng tìiì ta được:

v à Í ra j 2 e s » v à r x id s = { t Ư i G r v à t j 2 & s } .

g. Phép chiếu
Cho lược đồ khối R=(id\Aị, A2,...,An) , r là một khối ừên R .
Khi đó ta gọi p - (id'',Aịị, Aị2,...,Aịh) là lược đồ con của lược đồ R nếu
id' ç id ,A ijG{Ai ,A2,...,An},i= l...h.
Một phép chiếu của khối r trên lược đồ con p , kí hiệu П р (/) là một
khối có lược đồ p và mỗi phần tử thuộc khối này có dạng:
(til,ti2,...,tih)
iỉ

, trong đó:

e {í1,í 2 ,...,í” } với j = l..h

và (í1,í 2 ,...,í”) e r.

Biểu diễn hình thức của phép chiếu có dạng:


13

U p(r) = {(ti\ t i2,...,tih) ii


j

},

e r}

id
h. Phép chọn
Cho R = ( ỉ d \ \ , A2,...,An) và khối r(R). Cho một phép chọn nghĩa là ta
xây dựng một tập con các phần tử của khối đã cho thỏa mãn biểu thức F cho
trước. Biểu thức F được diễn tả bằng một tổ họp Boole của các toán hạng,
mỗi toán hạng là một phép so sánh đơn giản giữa hai biến là hai giá trị điểm
của hai ánh xạ thảnh phần nào đó, hoặc giữa một biến là giá trị điểm của một
ánh xạ thành phần và một hằng. Các phép so sánh ừong v là

^

còn các phép toán lôgic ưong F là: V,A,—1.
Biểu diễn hình thức của phép chọn có dạng : ơ F (r)={t e r|F(í)},
trong đó F(t) là giá trị của biểu thức Boole F tại phần tử t e r .
ỉ. Phép kết nối
Cho R ^ự diA ị, A1,...,An) và s =(id\Bị,

cùng với hai khối

r(R) và s(S) tương ứng.
Gọi T=(ỉd\Cị, C2,...,Cp ), trong đó:
{Q , C 2 ,...,C^}={A1, Ả2,...,An}^J{Bị, B2,:.,B m}.

Phép kết nối của 2 khối r và s , kí hiệu r ><


là khối tỢ ) định nghĩa

như sau: í(T)={t| 3 t r e r} và ts es sao cho {t(R)=tr, t(S)=ts }.
Phép kết nối này cũng gọi là phép kết nối tự nhiên của hai khối r(R) và
s(S), đôi khi sử dụng kí hiệu r * s .
Đặc biệt, khi các khối r(R) và s(S) có tập chỉ số id trong lược đồ
khối của chúng chỉ gồm một phần tử thì các khối này trở thành các quan hệ và


14

phép kết nối tự nhiên của hai khối lại trở thành phép kết nối tự nhiên của hai
quan hệ trong mô hình cơ sở dữ liệu quan hệ.
Nếu hai tập {Al 5A25 —>Aì} và {Bị,B2,...,Bm} không giao nhau thì
r * s trở thành Tích Đề-các của hai khối đã cho.
Mệnh đề 1.2.
Giả sử r(R),r (R),q(Q),s(S) là các khối đã cho, khi đó ta có:
* ( q >
><

* (r^Jr)> < l

><

><

X


><

*
* (Г -Г ) X

>><

><

Ta có thể mở rộng khái niệm kết nối như sau:
Giả sủAịk &{Ah A2, . . . , \ } , Bik &{Bh

Bm}vầ dom(Aịk) = dom(Bik),

1 < k< h, (ở đây Aịk và Bik không nhất thiết phân biệt).
Khi đó kết nối của r \ầ s theo Aịị, Aị2 ,...,Aịh và Bịị, Bi2,...,Bih là
khối t(T), khối này được định nghĩa là:
t(T) - {t| 3 tr e r và ts &s sao cho t(R) = tr, t(s) = ts, tf' = t f , 1 < к < h),
trong đó:
Thay cho kí hiệu r >< ở đây ta kí hiệu rõ hơn:
t(T) = r [ ậ = t f , l < k < h ] s .
k. Phép chia
Cho hai khối r(ỉ'Aịk e{A1,A2 , Ạ j } , Vk=l..h. Khi đó phép chia của khối r cho khối s , kí
hiệu r -ỉ- s , là một khối gồm các phần tử t = (í1, t2

tn~h) sao cho Vm=



15

(w\ u2, u h) , u Gs thì phần tử tu e r , ở đây phần tử tu có dạng:
tu=(tl, í2,..., tn~h,ul, u2,...,uh).
Biểu diễn hình thức của phép chia có dạng: r + s= {t\V u es,tu er}.
1.3.3.CÓC thuât
• toán cài đăt

a. Thuật toán họp
Algorithm hop
Input: hai khối khả hợp p(R) và q(R).
Output: khối r(R) = { x : x e p v x e q } .
Format: hop(p,q)
Begin
r:= create(R);
for each X in p do
add X to r;
for each y in q do
if y in p then label y in p
else add y ro r;
retum(r)
end;
b. Thuật toán giao
Algorithm giao
Input: hai khối khả hợp p(R) và q(R).
Output: Output: khối r(R) = { x : x e p A x e q } .
Format: giao(p,q)
Begin
r:= create(R);
for each X in p do



16

if X

in q then
begin
add X to r;
label Xin q;
end;

retum(r)
end;
c. Thuât toán trừ


Algorithm tiu
Input: hai khối khả hợp p(R) và q(R).
Output: Output: khối r(R) = { x : x e p A x g q } .
Format: tru(p,q)
Begin
r:= create(R);
for each X in p do
ifxy in q then label X in q
else add X ro r;

retum(r)
end;
d. Thuât toán chiếu

Algorithm chieu
Input: khối r(R) với R = ( id; Ai,A2,...,An) và
p = ( id

^ i25 ••• 5

),

A ị.e { At, A2, A n }, Vj = l..h.

Output: khối s(P) = { x.p I x e r } .
Format: chieu(r,P)


17

Begin
s:= create(P);
for each X in r do
if not (x.p in s) then add x.p to s;
return (s)
end;
ở đây phàn tử x.p có dạng: x.p = ( X 11

id’
trong đ ó

{ X 1 , X2

, * Í2


id’

x n }, j = l . . h ,

)

id’
và X =

).

e. Thuật
• toán chọn

Algoriứim chon
Input: khối r(R) và tiêu chuẩn F.
Output: khối s(R) = { xe r(R) I test (x,F) }.
Format: chon(r,F)
Begin
S:= create(R);
For each X in r do
If test(x,F) then add X to s;
Retum(s)
End;
f. Thuật toán kết nối tự nhiên
Algorithm ketìioi
Input: hai khối r(R) và s(S), R = (id; Ai, A2,.", An),

s = (id;Bi,


Bm) vói Ai = Bi,..., Ah,..., Ah = Bh.

Output: khối t(T) = { z I Z.R € r(R) A Z.S € s(S)}.


×