Tải bản đầy đủ (.doc) (27 trang)

Một số vấn đề về cây.DOC

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (188.14 KB, 27 trang )

Luận văn tốt nghiệp Phan Thanh Long
Chơng 5
Một số vấn đề về cây
I. Các khái niệm và tính chất cơ bản
1. Định nghĩa Cho đồ thị G = <X, U>, G đợc gọi là một cây nếu G liên thông và
không có chu trình, ở đây n = X > 1.
Khi đó sáu tính chất sau là tơng đơng
1) G là đồ thị liên thông và không có chu trình
2) G không có chu trình và có n - 1 cạnh
3) G liên thông và có n - 1 cạnh
4) G không có chu trình và nếu thêm vào một cạnh nối 2 đỉnh không kề nhau thì
G xuất hiện duy nhất một chu trình.
5) G liên thông và nếu bỏ đi một cạnh tuỳ ý thì đồ thị nhận đợc sẽ không liên
thông.
6) Mỗi cặp đỉnh trong G đợc nối với nhau bằng một đờng duy nhất.
Chứng minh: Ta chứng minh theo trình tự sau:
1) 2) 3) 4) 5) 6) 1). Ta sử dụng đẳng thức v(G) = m - n + p là số
chu trình độc lập của đồ thị G = <X, U>, ở đây X = n, U = m và p là số thành
phần liên thông của G.
1) 2): Vì G không có chu trình nên v(G) = m - n + p = 0. Do G liên thông nên p
=1 khi đó m - n + 1 = 0 hay số cạnh m = n - 1.
2) 3): Giả sử G không có chu trình và n - 1 cạnh ta chứng minh 3)
Thật vậy, giả sử ngợc lại G không liên thông, khi đó p 2 . Từ 2) ta có v(G) = m -
n + p = 0 và m = n -1, kết hợp ta có (n - 1) - n + p = 0 hay p = 1, trái với giả thiết p
2. Vậy G liên thông và số cạnh là n -1.
3) 4): Giả sử G là liên thông và có n - 1 cạnh, ta chứng minh 4).
Thật vậy vì G liên thông nên p = 1, mặt khác m = n - 1 nên v(G) = m - n + 1 = 0
hay G không có chu trình . Nếu thêm vào G một cạnh thì ta đợc đồ thị G' với số
cạnh là n, hay v(G') = n - n + 1 = 1 hay G' có một chu trình.
4) 5): Giả sử ngợc lại G không liên thông, tức là tồn tại cặp đỉnh x, y trong G
mà không có đờng nào nối x với y. Khi đó nối x và y bởi 1 cạnh, đồ thị nhận đợc


vẫn không có chu trình điều này mâu thuẫn với 4). Hay G là liên thông.
1
Luận văn tốt nghiệp Phan Thanh Long
Nếu bỏ đi 1 cạnh trong G mà đồ thị vẫn liên thông thì nếu khôi phục lại cạnh
này đồ thị sẽ có chu trình. Điều này mâu thuẫn với 4). Vậy ta có 5).
5) 6): Giả sử ngợc lại, nếu trong G có tồn tại cặp đỉnh x, y không nối với nhau
bằng đờng nào cả, chứng tỏ G không liên thông mâu thuẫn với 5). Vậy mỗi cặp
đỉnh đều có đờng đi nối với nhau, đờng đó là duy nhất vì nếu có nhiều hơn thì sau
khi bỏ đi 1 đờng đồ thị vẫn liên thông, trái với 5).
6) 1) Với mỗi cặp đỉnh nối với nhau bởi một đờng thì G là liên thông. Giả sử G
có chu trình thì xét cặp đỉnh x, y trên chu trình đó. Khi đó x, y có 2 cặp đờng nối
với nhau, mâu thuẫn với 6).
2. Một số khái niệm cơ bản
- Gốc: Đối với một cây T bất kỳ có thể chọn 1 đỉnh nào đó làm gốc, một cây đã
đợc chọn 1 đỉnh làm gốc thì đợc gọi là cây có gốc. Vậy một cây có thể tạo thành
nhiều cây có gốc khác nhau.
- Quan hệ cha con: Giả sử a là gốc nếu có b, c kề với a thì b, c đợc gọi là con của
a (hoặc gọi a là cha của b, c) tơng tự nếu có d, e kề với b thì b là cha của chúng
còn d, e là con của b (Xem cây T' hình 1.1).
- Trong một cây tất cả các đỉnh là cha đợc gọi là các đỉnh trong. Các đỉnh không
phải là đỉnh trong đợc gọi là lá (hay lá là đỉnh con không có con), trong cây chỉ có
gốc là đỉnh duy nhất không phải là con.
- Bậc của đỉnh là số các con của nó, bậc của cây là bậc lớn nhất của đỉnh.
- Mức của cây: Mỗi 1 đỉnh đều đợc gán bằng một mức, mức của gốc là 0, con của
gốc có mức là 1. Nếu mức của cha là i thì mức của con là i + 1. Một đỉnh x nào đó
có mức bằng độ dài đờng đi từ gốc đến x, mức cao nhất trong số các đỉnh đợc gọi
là chiều cao của cây.
Khi cây cha có gốc, cha phân chia thành các các mỗi quan hệ cha con, bậc,
mức... thì cây là cây tự do còn khi đợc phân chia gọi là cây phân cấp.
T T'

Hình 1.1
2
a
b
d
i
j
e
h
k
c
g
f
h
a
d
i
j
b
e
k
g
c
f
Luận văn tốt nghiệp Phan Thanh Long
Ví dụ nh hình 1.1 cây T là một cây tự do, nếu chọn a làm gốc thì nó trở thành
cây phân cấp T' có gốc. Với cây T' gốc a có bậc 2 và mức 0, đỉnh c có bậc là 3 và
mức 1 ... Mức cao nhất là 3 ở các đỉnh là lá nh i, j, k nên chiều cao của cây h(T')
= 3.
3. Cây m - phân

- Định nghĩa: Xét cây phân cấp T nếu mỗi đỉnh trong của nó có không quá m
con thì T đợc gọi là cây m phân. Đặc biệt nếu m = 2 thì cây đợc gọi là cây nhị
phân, cây nhị phân rất quan trọng và có nhiều ứng dụng rộng rãi.
- Cây đầy đủ: Cây m - phân T đợc gọi là cây m - phân đầy đủ nếu mỗi đỉnh trong
đều có đúng m con.
- Cây cân đối: Xét cây m - phân có chiều cao h. Nêu các lá của cây có mức h - 1
hoặc h thì cây đợc gọi là cây cân đối.
4. Các ứng dụng
4.1 Mã tiền tố
Kỹ thuật nén và mã hoá là 1 trong những lĩnh vực thờng hay đợc sử dụng trong
Tin học, cây nhị phân có nhiều ứng dụng trong việc nghiên cứu áp dụng các giải
thuật trong lĩnh vực vực này. Một trong những ứng dụng của cây nhị phân đó là
mã tiền tố. Ví dụ mã tiền tố nh là dùng các xâu nhị phân có độ dài khác nhau để
mã các ký tự để không có xâu nhị phân nào ứng với hơn một chữ cái. Trên cây nhị
phân mã hoá, các lá là các ký tự cần mã hoá và đờng đi từ cha đến con trái là 1
(hoặc 0), còn đi tới con phải là 0 (hoặc 1). Quá trình mã hoá sẽ duyệt cây đó từ
gốc tới lá, khi tới nút con sẽ tạo ra một bít 0 hoặc 1 và tới nút lá sẽ tạo ra một xâu
bít. Do vậy, mã sinh ra cho một ký tự sẽ không là phần đầu của ký tự khác.
Hình 1.2
Ví dụ nh hình 1.2 cây nhị phân biểu diễn mã tiền tố của các ký tự a, e, i, k, o, p, u
trong đó:
a : 000 k : 1100 u : 11111
e : 001 o : 1101
i : 01 p : 11110
3
0
0
0
0
0

0
1
1
1
1
1
1
1
1
a e
i
k o
p u
Luận văn tốt nghiệp Phan Thanh Long
Thuật toán mã hoá Huffman:
Một số thuật toán về mã tiền tố đã ra đời đã đợc sử dụng rộng rãi và đem lại
hiệu quả cao trong vấn đề nén và mã hoá thông tin. Một trong những thuật toán đó
là Huffman xuất hiện từ năm 1952, thuật toán này mã hoá theo phơng pháp kiểu
thống kê, tạo ra mã có độ dài thay đổi khác nhau khi đã có bảng tần số xuất hiện
của các ký tự. Quá trình mã hoá và giải mã phụ thuộc vào việc xây dựng cây nhị
phân mã hoá. Thuật toán Huffman tạo cây nhị phân từ nút lá đến nút gốc, ký tự
nào có tần số càng cao thì nút lá tơng ứng càng gần gốc hơn.
Thuật toán:
Vào: Bảng tần số xuất hiện các ký tự sắp xếp giảm dần
Ra : Cây nhị phân biểu diễn mã, nhánh phải là 1, trái là 0.
Bớc 1: Lấy hai phần tử cuối bảng tần số xuất hiện ra khỏi bảng
Bớc 2: Nếu phần tử nào cha nằm trong cây nhị phân thì tạo ra một nút lá chứa
phần tử đó, phần tử này chính là ký tự. Nối hai nút tơng ứng với hai phần tử này
với nhau thông qua việc tạo nút cha của chúng. Phần tử có tần số xuất hiện lớn
hơn là nút trái, nhỏ hơn là nút phải.

Bớc 3: Tính tổng tần số xuất hiện của 2 phần tử này chèn vào bảng sao cho phù
hợp với nguyên tắc giảm dần của bảng. Phần tử mới của bảng sẽ tơng ứng với nút
vừa đợc tạo ra ở bớc 2.
Bớc 4: Quay trở lại bớc 1 đến khi bảng chỉ còn lại 1 phần tử. Phần tử cuối cùng t-
ơng ứng với nút gốc của cây nhị phân.
Ví dụ: Ta có kết quả mã Huffman cho các ký tự ở bảng sau:
Ký tự Tần suất Mã nhị phân Chiều dài mã
a 0.3 00 2
b 0.2 10 2
c 0.2 11 2
d 0.1 011 3
e 0.1 0100 4
f 0.1 0101 4
Cây nhị phân biểu diễn nh hình 1.3
4
Luận văn tốt nghiệp Phan Thanh Long
Hình 1.3
Với thuật toán Huffman trờng hợp xấu nhất là thời gian hình thành cây nhị phân
là O(n) với n là số ký tự cần mã hoá.
Chơng trình viết bằng ngôn ngữ Pascal minh hoạ thuật toán tạo mã Huffman:
Const n = 6; {Số ký tự cần mã hoá a, b, c, .....}
Type Nod = record
S:integer; {tần suất}
Code:String; {mã nhị phân}
Name:char; {tên ký tự}
end;
Var a:array[1..n] of Nod;
i,m:integer;
Procedure InputData; {Khởi tạo bảng tần suất các ký tự}
Var i:integer;

begin
for i:=1 to n do with A[i] do
begin S:=Round(exp(n/5)/exp(i/5))+1;Name:=Char(64+i);Code:=''; end;
end;
Procedure FindCode(m:integer); {Sinh mã huffman}
Var y,z:nod;
k:integer;
Begin
if m=1 then exit;
y:=a[m-1];
a[m-1].s:=a[m-1].s+a[m].s;
5
a,e,f,d,b,c
a,e,f,d b,c
e,f,da
e,f
d
e
f
b
c
0
0
0
0
0
1
1
1
1

1
0,3
0,6
0,2
0,1
0,1
0,1
0,3
0,4
0,2 0,2
Luận văn tốt nghiệp Phan Thanh Long
k:=m-1;
While (k>1) and (a[k].s>a[k-1].s) do Begin
z:=a[k]; a[k]:=a[k-1]; a[k-1]:=z; k:=k-1;
End;
FindCode(m-1);
z:=a[k];
for i:=k to m-2 do a[i]:=a[i+1];
a[m-1]:=y;
a[m-1].code:=z.code+'1'; a[m].code:=z.code+'0';
End;
BEGIN
InputData; FindCode(n);
For i:=1 to n do writeln(a[i].code);
END.
4.2 Cây biểu diễn biểu thức
Một biểu thức toán học có thể biểu diễn bằng cây, đây cũng là vấn đề hữu ích
trong việc xử lý và lu trữ biểu thức toán học trong máy tính
Xét biểu thức đại số sau:
Có thể vẽ 1 cây nhị phân nh hình 1.4 biểu diễn biểu thức A, trong đó mỗi đỉnh

trong mang dấu của một phép tính, gốc của cây mang phép tính sau cùng của A, ở
đây là dấu nhân ký hiệu: *, mỗi lá mang 1 số hoặc một chữ đại diện cho số.
Hình 1.4
Một phép duyệt cây là tiền thứ tự nếu thăm gốc trớc rồi sau đó thăm con trái
nh là một cây con với phơng pháp thăm gốc trớc và cuối cùng thăm con phải nh là
một cây con với phơng pháp thăm gốc trớc. Duyệt cây nh vậy mang tính đệ quy.
6
( )






ì+=
2
d
cbaA
a
*
+
-
/
b
c
d
2
Luận văn tốt nghiệp Phan Thanh Long
Khi duyệt cây trên theo tiền thứ tự ta có: * + a b - c / d 2
Cách viết biểu thức theo tiền thứ tự là ký pháp Balan.

Bằng duyệt cây ta có thể tính đợc giá trị biểu thức, ngoài phơng pháp tiền thứ tự
còn có thể duyệt cây theo phơng pháp pháp khác để tính giá trị biểu thức tùy vào
yêu cầu và đặc điểm của từng bài toán.
4.3 Cây quyết định
Có những bài toán phụ thuộc vào các quyết định. Mỗi quyết định thì có thể có
nhiều kết cục và những kết cục cuối cùng chính là lời giải của bài toán. Để giải
những bài toán nh vậy, ngời ta biểu diễn mỗi quyết định bằng một đỉnh của đồ thị
và mỗi kết cục là 1 lá của quyết định. Một cây đợc xây dựng nh trên gọi là cây
quyết định. Trong nhiều bài toán Tin gặp phải, có thể dùng cây quyết định để mô
hình hoá từ đó việc cài đặt sẽ dễ dàng thuận tiện hơn.
Ví dụ:
hình 1.5 là cây quyết định biểu diễn việc sắp xếp 3 số khác nhau a, b, c
Hình 1.5
Đoạn chơng trình sau thể hiện cho cây trên:
Var a, b, c: Integer;
Function Can(x,y: Integer): Boolean;
Begin
if x > y then Can:=True
Else Can:=False;
End;
7
a ? b
a ? c b ? c
b ? c
a ? c
c<a<b
c<b<a
b<c<a
b<a<c
a<c<b

a<b<c
b<a a<b
c<a
a<c
c<b
b<c
c<b
b<c
c<a
a<c
Luận văn tốt nghiệp Phan Thanh Long
Begin
Readln(a,b,c);
If Can(a,b) then Begin
If Can(a,c) then Begin
if Can(b,c) then Writeln(c,' ',b,' ',a)
Else Writeln(b,' ',c,' ',a);
End
Else Writeln(b,' ',a,' ',c);
End
Else Begin
If Can(b,c) then Begin
if Can(a,c) then Writeln(c,' ',a,' ',b)
Else Writeln(a,' ',c,' ',b);
End
Else Writeln(a,' ',b,' ',c);
End;
End.
4.4 Cây sắp xếp và tìm kiếm
Sắp xếp và tìm kiếm là một trong những vấn đề cơ bản trong kỹ thuật lập trình,

cây nhị phân cũng có khá nhiều ứng dụng quan trọng trong vấn đề này. Ta có thể
mô hình hoá việc sắp xếp và tìm kiếm bằng cây từ đó ta có thể đánh giá các kỹ
thuật này từ góc độ về cây.
4.4.1 Sắp xếp chèn với tìm kiếm nhị phân
ý tởng đợc bắt đầu nh sau, cho 1 danh sách cha sắp xếp hãy tìm 1 phần tử x bất
kỳ nào đó trong danh sách, rõ ràng để tìm ta phải lần lợt xét từng phần tử cho tới
khi nào bắt gặp phần tử cần tìm, nếu danh sách lớn thì thời gian tìm rất lâu. Bây
giờ với một danh sách đã sắp xếp, chia đôi danh sách và lấy phần tử là t ở vị trí
chia đôi để so sánh. Nếu t = x thì dừng, nếu t < x vì danh sách đã sắp xếp nên x
chỉ có thể nằm bên nửa phải danh sách nên ta chỉ việc tìm kiếm trong 1 nửa danh
sách bên phải và giảm đi khá nhiều công việc tìm kiếm. Nếu x < t thì tơng tự, ta
chỉ việc tìm bên nửa trái, đối với việc tìm kiếm cho lần sau với các danh sách con
nửa trái hoặc nửa phải ta thực hiện tơng tự nh vậy một cách đệ quy.
a) Từ những ý tởng thuật toán ta xây dựng cây nhị phân tìm kiếm cho một danh
sách nh sau:
8
Luận văn tốt nghiệp Phan Thanh Long
- Chọn 1 phần tử bất kỳ làm gốc
- Tất cả các phần tử có giá trị gốc thì thuộc cây con trái
- Tất cả các phần tử có giá trị > gốc thì thuộc cây con phải
- Đối với các cây con thì cũng có tính chất tơng tự nh vậy
Ví dụ cây nhị phân tìm kiếm cho danh sách 12, 10, 6, 11, 15, 13, 16, 19, 18 nh
hình 1.6:
Hình 1.6
b) Sắp xếp chèn bằng việc tìm nhị phân vị trí đúng.
Có thể tạm gọi là phơng pháp sắp xếp chèn nhị phân. ý tởng nh sau: cho trớc
một danh sách đã sắp xếp A, cần chèn 1 phần tử mới x vào A sao cho danh sách
luôn đợc sắp xếp. Đầu tiên ta tìm vị trí đúng của x trong A sau đó chèn x vào
đúng vị trí này trong A, ta có danh sách A = A {x} luôn đợc sắp xếp. Để tìm đ-
ợc ví trí đúng cần chèn của x trong A ta sử dụng phơng pháp tìm kiếm nhị phân,

chèn theo cách này gọi là chèn nhị phân.
Ví dụ để sắp xếp B = x
1
, x
2
, x
3
, ... x
n
ta thực hiện nh sau:
A := ;
For i:=1 to n do Begin
- Tìm vị trí đúng của x
i
trong A theo phơng pháp tìm nhị phân
- Chèn x
i
vào A theo đúng vị trí vừa tìm đợc (A := A {x
i
})
End;
Kết quả A là danh sách sắp xếp của B.
Chơng trình Pascal sau sắp xếp tăng dần theo phơng pháp chèn nhị phân
Const n = 9;
Ds : Array[1..n] of Integer = (1,9,1,6,3,10,10,8,7);
{Ham tra lai vi tri dung cua Pt trong danh sach}
Function FindNp(l,r,Pt: Integer): Integer;
Var t: Integer;
Begin
9

12
15
18
10
6
11
13
16
19
Luận văn tốt nghiệp Phan Thanh Long
If Pt<=Ds[l] then FindNp:=l
Else If Pt>=Ds[r] then FindNp:= r + 1
Else Begin
Repeat
t:= (l + r) div 2;
If Pt = ds[t] then Begin FindNp:=t+1; Exit End
Else If Pt<ds[t] then r:=t
Else l:=t;
Until r=l+1;
FindNp:=l+1;
End;
End;
Var i, j, vt, s: Integer;
Begin
For i:=2 to n do Begin
vt:= FindNp(1,i-1,ds[i]);
{Chen dung vi tri sao cho ds luon duoc sap xep}
s:=ds[i];
For j:=i-1 Downto vt do ds[j+1]:=ds[j];
ds[vt]:=s;

End;
For i:=1 to n do Write(ds[i]:3);
End.
4.4.2 Thuật toán sắp xếp hoà nhập
Giả sử ta có danh sách cha đợc sắp 8, 2, 4, 6, 9, 7, 10, 1, 5 ,3 có thể dùng cây
nhị phân mô tả quá trình sắp xếp danh sách theo thứ tự tăng dần nh sau:
Cây nhị phân với gốc đợc gán là chính là danh sách đó. Các con của gốc đợc
gán theo nguyên tắc: Con bên trái gán nửa danh sách đầu, con bên phải gán nửa
danh sách còn lại (danh sách gán ở gốc cây con trái và cây con phải hoặc bằng
nhau về số lợng hoặc chênh lệch nhau 1 phần tử).
Cứ tiếp tục cho tới khi cây nhị phân có mỗi lá đợc gán 1 phần tử trong dãy. Đó là
cây nh hình 1.7
10

×