Tải bản đầy đủ (.pdf) (57 trang)

Hiệu suất của thuật toán xấp xỉ đối với một số bài toán tối ưu trên đồ thị

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (581.22 KB, 57 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2

NGUYỄN THỊ HỒNG HẠNH

HIỆU SUẤT CỦA THUẬT TOÁN XẤP XỈ
ĐỐI VỚI MỘT SỐ BÀI TOÁN TỐI ƯU
TRÊN ĐỒ THỊ

LUẬN VĂN THẠC SĨ TOÁN HỌC

HÀ NỘI, 2017


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2

NGUYỄN THỊ HỒNG HẠNH

HIỆU SUẤT CỦA THUẬT TOÁN XẤP XỈ
ĐỐI VỚI MỘT SỐ BÀI TOÁN TỐI ƯU
TRÊN ĐỒ THỊ
Chuyên ngành: Toán ứng dụng
Mã số : 60 46 01 12

LUẬN VĂN THẠC SĨ TOÁN HỌC

Người hướng dẫn khoa học: TS. TRẦN VĨNH ĐỨC

HÀ NỘI, 2017



LỜI CẢM ƠN

Luận văn này được thực hiện tại Trường Đại học Sư phạm Hà Nội 2.
Để hoàn thành được luận văn này, tôi đã nhận được rất nhiều sự động
viên, giúp đỡ của các cá nhân và tập thể.
Trước hết, tôi xin bày tỏ lòng biết ơn sâu sắc tới TS.Trần Vĩnh Đức.
Thầy đã tận tình hướng dẫn và giải đáp những thắc mắc của tôi, giúp
đỡ tôi hoàn thành luận văn này.
Qua đây, tôi xin chân thành cảm ơn các thầy cô giáo phòng Sau đại
học, các thầy cô giáo khoa Toán cũng như các thầy cô giáo giảng dạy
lớp thạc sĩ K19 chuyên ngành Toán ứng dụng trường Đại học Sư phạm
Hà Nội 2 đã giúp đỡ tôi trong suốt quá trình học tập.
Cuối cùng, tôi xin được gửi lời cảm ơn chân thành tới gia đình, bạn
bè, đồng nghiệp đã luôn quan tâm, động viên và tạo mọi điều kiện thuận
lợi cho tôi trong quá trình học tập và hoàn thành luận văn.
Hà Nội, tháng 12 năm 2017
Tác giả

Nguyễn Thị Hồng Hạnh


LỜI CAM ĐOAN

Tôi xin cam đoan, dưới sự hướng dẫn của TS. Trần Vĩnh Đức, luận văn
thạc sĩ chuyên ngành Toán ứng dụng với đề tài “Hiệu suất của thuật
toán xấp xỉ đối với một số bài toán tối ưu trên đồ thị” được
hoàn thành bởi chính sự nhận thức của bản thân tác giả.
Trong quá trình nghiên cứu thực hiện luận văn, tác giả đã kế thừa
những thành tựu của các nhà khoa học với sự trân trọng và biết ơn.

Hà Nội, tháng 12 năm 2017
Tác giả

Nguyễn Thị Hồng Hạnh


DANH MỤC KÍ HIỆU
n
k

Tổ hợp chập k của n

Pr (A)

Xác suất để có A

|A|

Lực lượng của tập A

log n

Lôgarit cơ số 2 của n

x

Số nguyên lớn nhất không vượt quá x

x


Số nguyên bé nhất không nhỏ hơn x

η low (G)

Số các đỉnh bậc thấp của đồ thị G

η high (G)

Số các đỉnh bậc cao của đồ thị G

ηUh.ex. (G)

Số các đỉnh bậc ngoại vi cao tương quan đến tập U ⊂ V
của đồ thị G = (V, E)

ηUh.in.ex. (G) Số các đỉnh bậc nội vi và ngoại vi cao tương quan đến
tập U ⊂ V của đồ thị G = (V, E)
degG (v)

Bậc của đỉnh u trong đồ thị G

degex.
G,U (u)

Bậc ngoại vi của đỉnh u, u ∈ U, tương quan đến tập U ⊂ V
trong đồ thị G = (V, E)

µk (G)

Số ghép cặp cực đại với k cạnh trong G


ξk (G)

Số tập khống chế gồm k đỉnh của G

ζV1 ,V2 (G)

Giá trị của (V1 , V2 )-cắt trong đồ thị G


Mục lục

Mở đầu

1

1 Kiến thức chuẩn bị

3

1.1

Một số khái niệm về đồ thị . . . . . . . . . . . . . . . . .

3

1.2

Hiệu suất của thuật toán xấp xỉ . . . . . . . . . . . . . .


6

2 Bài toán đường đi dài nhất

9

2.1

Thuật toán tham lam đối với bài toán LPATH . . . . . . .

10

2.2

Hiệu suất của thuật toán tham lam GrLPATH . . . . . . .

15

3 Bài toán ghép cặp
3.1

17

Thuật toán tham lam đối với bài toán
MIN-MAXL-MATCH . . . . . . . . . . . . . . . . . . . . . . .

3.2

Hiệu suất của thuật toán tham lam GrM


. . . . . . . .

4 Bài toán tập khống chế

18
23
25

4.1

Định nghĩa

. . . . . . . . . . . . . . . . . . . . . . . . .

25

4.2

Thuật toán tham lam đối với bài toán MIN-CDS . . . . .

29

4.2.1

29

Thuật toán MIN-CDS . . . . . . . . . . . . . . . .


4.2.2

4.3

Phân tích thuật toán . . . . . . . . . . . . . . . .

Hiệu suất của thuật toán tham lam GrCDS

. . . . . . .

5 Bài toán MAX-CUT

31
37
39

5.1

Giá trị của nhát cắt . . . . . . . . . . . . . . . . . . . . .

40

5.2

Hiệu suất của thuật toán giải bài toán MAX-CUT . . . . .

44

Kết luận

47


Tài liệu tham khảo

48


1

Mở đầu
Các bài toán tối ưu có nhiều ứng dụng trong lý thuyết và thực tế như
trong quy hoạch tuyến tính, toán học, logic. . . Khi nghiên cứu những bài
toán tối ưu, ta mong muốn tìm được nghiệm tối ưu trong thời gian đa
thức. Tuy nhiên, nhiều bài toán tối ưu quan trọng thuộc lớp NP-khó.
Đối với những bài toán này, ta không hi vọng có thuật toán tìm nghiệm
tối ưu trong thời gian đa thức, trừ phi P = NP. Vì vậy, mục tiêu đưa ra
là tìm được nghiệm càng gần tối ưu càng tốt trong thời gian đa thức.
Để đạt được điều này, người ta thường sử dụng thuật toán xấp xỉ.
Để đánh giá hiệu suất của thuật toán xấp xỉ, ta thường xem xét hiệu
suất trong trường hợp xấu nhất hoặc trong hầu hết mọi trường hợp.
Hiệu suất trong trường hợp xấu nhất cũng chính là hiệu suất trong mọi
trường hợp của bài toán. Hiệu suất này được gọi là hiệu suất tuyệt đối.
Hiệu suất được xem xét trong hầu hết mọi trường hợp cho ta thông tin
về hiệu suất đảm bảo đối với thuật toán xấp xỉ. Hiệu suất này được gọi
là hiệu suất hầu chắc chắn của thuật toán. Hiệu suất hầu chắc chắn thể
hiện một cách khái quát nhất hiệu quả thực sự của thuật toán xấp xỉ.
Luận văn này nhằm nghiên cứu các thuật toán xấp xỉ đối với một
số bài toán tối ưu trên đồ thị và đánh giá hiệu suất của chúng. Cụ thể,
luận văn nhằm:


2


• Tìm hiểu các kết quả cơ bản về thuật toán xấp xỉ đối với một số
bài toán tối ưu trên đồ thị.
• Nghiên cứu các phương pháp đánh giá hiệu suất của các thuật toán
xấp xỉ.
• Nghiên cứu hiệu suất tuyệt đối và hiệu suất hầu chắc chắn của các
thuật toán xấp xỉ đối với một số bài toán tối ưu trên đồ thị.
Luận văn không có kết quả mới. Đóng góp chính của luận văn là tổng
hợp một số kết quả gần đây liên quan đến phân tích hiệu suất của các
thuật toán xấp xỉ đối với một số bài toán tối ưu trên đồ thị.
Ngoài phần mở đầu và kết luận, luận văn gồm 5 chương. Chương 1
nhằm nhắc lại một số khái niệm cũng như các kết quả bổ trợ cần thiết
được sử dụng ở chương sau; 4 chương còn lại trình bày các kết quả liên
quan đến phân tích xác suất của các thuật toán xấp xỉ cho 4 bài toán
quan trọng trên đồ thị:
1. Bài toán đường đi dài nhất. Các tài liệu tham khảo của chương này
là [1, 6, 10, 11].
2. Bài toán ghép cặp. Các tài liệu tham khảo của chương này là [14, 5].
3. Bài toán tập khống chế. Các tài liệu tham khảo của chương này
là [15, 9, 12].
4.

Bài toán MAX-CUT. Các tài liệu tham khảo của chương này là [13, 8].


3

Chương 1
Kiến thức chuẩn bị
Trong chương này, chúng ta nhắc lại một số khái niệm cũng như các kết

quả bổ trợ cần thiết được sử dụng ở chương sau.

1.1

Một số khái niệm về đồ thị

Mục này nhằm nhắc lại một số khái niệm cơ sở của lý thuyết đồ thị.
Định nghĩa 1.1. Một đồ thị vô hướng G là một cặp thứ tự G = (V, E),
ở đây V là một tập, còn E là một đa tập gồm các tập lực lượng 2 trên V .
Các phần tử của V được gọi là các đỉnh, còn các phần tử của E được
gọi là các cạnh của đồ thị vô hướng G. Nếu e = {u, v} ∈ E thì các đỉnh
u, v được gọi là các đầu mút của cạnh e hay các đỉnh liên thuộc với e.
Khi đó, hai đỉnh u, v được gọi là kề nhau hay láng giềng của nhau. Ta
cũng thường kí hiệu cạnh {u, v} ngắn gọn là uv.
Định nghĩa 1.2. Cho v là một đỉnh của đồ thị G. Bậc của đỉnh v
trong G, kí hiệu là degG (v), được định nghĩa bởi số các cạnh của G liên
thuộc v, tức số tất cả các láng giềng của v trong G.


4

Hình 1.1: Một biểu diễn trên mặt phẳng của đồ thị

Đồ thị có thể vẽ trên mặt phẳng với các đỉnh là các điểm và các cạnh
nối là các đường thẳng hoặc đường cong nối các điểm này. Đây là một
trong những ưu điểm của lý thuyết đồ thị. Nó cho phép mô tả các lập
luận và chứng minh theo cách rất trực quan và sáng sủa.
Ví dụ 1.1. Cho đồ thị G = (V, E) với
V = {1, 2, 3, 4, 5, },
E = {{1, 2}, {1, 3}, {2, 3}, {2, 4}, {2, 5}} .

Đồ thị này được vẽ như trên Hình 1.1. Trong đồ thị này, cạnh a có hai
đỉnh liên thuộc là đỉnh 1 và 2. Đỉnh 1 có đúng hai cạnh liên thuộc là a, b
nên deg(1) = 2.
Định nghĩa 1.3. Đồ thị G = (V , E ) được gọi là đồ thị con của đồ thị
G = (V, E) nếu V ⊆ V và E ⊆ E. Đồ thị G được gọi là đồ thị con
bao trùm của G nếu V = V . Khi E chứa tất cả các cạnh của G mà hai
đỉnh liên thuộc với nó đều thuộc V thì G được gọi là đồ thị con của G
cảm sinh bởi tập đỉnh V hay đồ thị con cảm sinh bởi G = (V, E) trên
tập đỉnh V , kí hiệu là G = G[V ].


5

Hình 1.2: Một đồ thị con và đồ thị bao trùm của G

Ví dụ 1.2. Một đồ thị con và một đồ thị con bao trùm của đồ thị trong
Hình 1.1 được chỉ ra trong Hình 1.2.
Định nghĩa 1.4. Cho đồ thị G = (V, E). Một đường đi L trong G là
một dãy các đỉnh khác nhau sao cho hai đỉnh kế tiếp nhau của L đều kề
nhau trong G.
Định nghĩa 1.5. Đồ thị G được gọi là liên thông nếu giữa hai đỉnh tùy
ý của G đều có một đường đi. Trong trường hợp ngược lại, đồ thị G
được gọi là không liên thông.
Định nghĩa 1.6. Một đồ thị liên thông và không có chu trình được gọi
là cây. Các đỉnh bậc một của cây được gọi là lá hay đỉnh cuối, còn các
đỉnh bậc lớn hơn một được gọi là đỉnh trong.
Cây bao trùm của đồ thị G là một đồ thị con bao trùm của G sao
cho nó là một cây.



6

Hình 1.3: Đồ thị không liên thông và đồ thị liên thông.

1.2

Hiệu suất của thuật toán xấp xỉ

Như đã biết, nhiều bài toán tối ưu tổ hợp thuộc lớp NP-khó, có nghĩa
rằng ta không hy vọng tìm được thuật toán chạy trong thời gian đa thức,
trừ phi P=NP. Trong tình huống này, sử dụng phương pháp giải xấp xỉ
là cần thiết.
Thuật toán xấp xỉ là thuật toán tìm lời giải chấp nhận được cho các
bài toán tối ưu tổ hợp. Nó thường được sử dụng cho các bài toán NPkhó, hoặc các bài toán có thuật toán đa thức nhưng quá chậm cho dữ
liệu lớn. Từ góc độ giải xấp xỉ, các bài toán NP-khó có độ khó rất khác
nhau.
Chẳng hạn, bài toán xếp ba lô có thuật toán xấp xỉ với tỉ lệ lớn hơn
1, bài toán Clique không thể tính xấp xỉ với tỉ lệ n1−ε với mọi ε > 0.
Khi xây dựng thuật toán xấp xỉ cho bài toán tối ưu NP-khó, ngoài
yêu cầu về thời gian đa thức đối với thuật toán, ta mong sao trên mỗi
dữ kiện bất kì của bài toán, thuật toán cho ta một nghiệm chấp nhận


7

được càng gần tối ưu càng tốt. Độ chênh lệch giữa nghiệm tìm được bởi
thuật toán và nghiệm tối ưu thường được biểu thị thông qua một đại
lượng được gọi là hiệu suất của thuật toán. Hiệu suất của thuật toán
được định nghĩa như sau.
Cho một bài toán tối ưu tổ hợp Π với tập dữ kiện DΠ . Giả sử AΠ là

thuật toán xấp xỉ giải bài toán Π .
Định nghĩa 1.7. Hiệu suất RAΠ (d) của thuật toán xấp xỉ AΠ trên dữ
kiện d của bài toán cực tiểu hóa (cực đại hóa) Π là tỉ số
ứng là

OP TΠ (d)
AΠ (d) ),

AΠ (d)
OP TΠ (d)

(tương

trong đó AΠ (d) là giá trị của nghiệm chấp nhận được

mà thuật toán AΠ tìm được khi thực thi trên dữ kiện d và OP TΠ (d) là
giá trị của nghiệm tối ưu của bài toán Π đối với d.
Hiệu suất tuyệt đối RAΠ của thuật toán AΠ khi giải bài toán Π với
tập dữ kiện DΠ được định nghĩa bởi đại lượng sau:
RAΠ =inf{r ∈ R : RAΠ (d) ≤ r đối với mọi d ∈ DΠ }
trong đó, R là tập các số thực.
Hiệu suất hầu chắc chắn là hiệu suất nhằm biểu thị một cách đơn
giản hiệu suất của thuật toán xấp xỉ AΠ trên hầu hết mỗi dữ kiện của
a.s
bài toán Π . Hiệu suất hầu chắc chắn RA
được định nghĩa như sau:
Π
a.s
RA
=inf{r ∈ R : RAΠ (d) ≤ r đối với hầu hết d ∈ DΠ }

Π

trong đó R là tập các số thực, “RAΠ (d) ≤ r đối với hầu hết d ∈ DΠ ”
(n)

được hiểu theo nghĩa xác suất là Pr d ∈ DΠ : RAΠ (d) ≤ r
(n)

→ 1 khi

n → ∞ với DΠ được tạo thành từ những dữ kiện “kích cỡ” n của DΠ


8

theo một phân bố xác suất nào đó và được giả thiết là hữu hạn, nhưng
(n)



→ ∞ khi n → ∞.

Hiệu suất tuyệt đối RAΠ của thuật toán xấp xỉ AΠ có thể được xác định
bằng cách phân tích trường hợp xấu nhất của thuật toán. Hiệu suất hầu
a.s
chắc chắn RA
được xác định bằng phương pháp phân tích xác suất dựa
Π
(n)


theo một phân bố xác suất cho trước nào đó trên tập DΠ , thông thường
là theo phân bố xác suất đều. Chẳng hạn, đối với các bài toán tối ưu trên
(n)

đồ thị vô hướng, tập DΠ có thể là Gn , tập tất cả các đồ thị vô hướng
G = (V, E) với n đỉnh được gán nhãn, V = {1, 2, . . . , n}. Trong trường
n
hợp này, phân bố xác suất đều trên G được cho bởi xác suất 1/2( 2 ) ,
n

xác suất xuất hiện mỗi đồ thị của Gn , và mỗi đồ thị G = (V, E) ∈ Gn
đều được xem xét như một đồ thị ngẫu nhiên, trong đó các cạnh cho E
n
được chọn một cách độc lập với xác suất 1 . Rõ ràng, G có 2( 2 ) đồ thị.
2

n

Để thuận tiện, trong luận văn này tập Gn được viết như sau:
n
Gn = {Gi | i = 1, 2, . . . , p} với p = 2( 2 )

Theo định nghĩa, hiệu suất tuyệt đối RAΠ và hiệu suất hầu chắc chắn
a.s
RA
của thuật toán AΠ đều lớn hơn hoặc bằng 1. Chúng càng gần 1 bao
Π

nhiêu thì thuật toán AΠ càng tốt bấy nhiêu. Cùng với hiệu suất tuyệt
đối, hiệu suất hầu chắc chắn thể hiện một cách khái quát hiệu quả thực

sự của thuật toán. Các nghiên cứu chứng tỏ rằng, đối với nhiều bài toán
tối ưu NP- khó, mọi thuật toán xấp xỉ đều có hiệu suất tuyệt đối bằng
∞ , trong đó có những thuật toán đơn giản có hiệu suất hầu chắc chắn
rất nhỏ, thậm chí bằng 1. Điều này có nghĩa là, trên hầu hết mỗi dữ kiện
của bài toán, những thuật toán ấy cho ta nghiệm rất gần với tối ưu.


9

Chương 2
Bài toán đường đi dài nhất
Chương này trình bày một số kết quả liên quan đến phân tích xác suất
của thuật toán xấp xỉ cho bài toán đường đi dài nhất trên đồ thị. Kết
quả chính được lấy từ tài liệu tham khảo [1]. Bài toán được phát biểu
như sau.
Bài toán 2.1 (Bài toán Longest path, hay LPATH). Cho một đồ
thị G = (V, E). Hãy tìm trong G một đường đi dài nhất, tức một dãy
nhiều nhất các đỉnh khác nhau sao cho hai đỉnh kế tiếp nhau đều kề
nhau trong G.
Ví dụ 2.1. Xét đồ thị G trong Hình 2.1. Dãy abcdef là một đường đi
trong G và đường đi dài nhất trong G là abcdf ehkg.
Bài toán LPATH là bài toán NP-khó vì nó chứa bài toán tìm đường đi
Hamilton. Do đó, bài toán không thể giải được trong thời gian đa thức,
trừ phi P=NP. Vì vậy, đối với bài toán này, ta cần tìm kiếm một lời giải
gần đúng bằng thuật toán xấp xỉ thời gian đa thức.


10

Hình 2.1: Đồ thị có đường đi dài nhất qua tất cả các đỉnh


2.1

Thuật toán tham lam đối với bài toán LPATH

Thuật toán tham lam cho bài toán LPATH được mô tả như sau:
Trên đầu vào là đồ thị G = (V, E)
Bước 1. Chọn tùy ý một đỉnh trong V rồi đánh dấu đỉnh này.
Bước 2. Chọn tùy ý một đỉnh trong những láng giềng chưa được đánh
dấu của đỉnh vừa đánh dấu rồi đánh dấu đỉnh này và lặp lại quá
trình như vậy cho đến khi không thể.
Bước 3. Đầu ra của thuật toán là đường đi được tạo thành bởi dãy các
đỉnh được đánh dấu.
Để phân tích hiệu suất của thuật toán, ta sử dụng các tính chất liên
quan đến bậc nhỏ nhất và bậc ngoại vi của đỉnh tương quan đến một
tập đỉnh chứa đỉnh ấy đối với hầu hết mỗi đồ thị. Kết quả thu được tạo
cơ sở để thiết kế và phân tích thuật toán cho bài toán LPATH.
Kí hiệu δ (G) là bậc nhỏ nhất của đồ thị. Bây giờ, ta đánh giá δ (G)
đối với hầu hết mỗi đồ thị G.


11
n
2

Cho đồ thị G với n đỉnh. Ta coi b =






n log n như một giới hạn

đối với bậc các đỉnh của đồ thị G. Ta nói rằng đỉnh v là đỉnh bậc thấp
nếu degG (v) ≤ b. Kí hiệu η low (G) là số các đỉnh bậc thấp của G.
Để so sánh δ (G) với b, ta xét biến ngẫu nhiên ηnlow := η low (G) trên
Gn . Ta có các kết quả sau (theo [3]):
(1).

Eηnlow

=

n
2n−1

b

n−1
k

k=0

,

(2). Khi n đủ lớn Eηnlow <

√2
n


.

Từ kết quả (1) và (2) ta có định lí sau.
Định lí 2.1. Khi n đủ lớn
n

2

Pr G ∈ Gn : δ (G) >

log n
n log n > 1 − √ .
n

Chứng minh. Áp dụng bất đẳng thức Markov
Pr (ξ < t.Eξ) > 1 −
với ξ = ηnlow và t =



n/log n, ta được


Pr

1
t

ηnlow


<

n
Eηnlow
log n

log n
>1− √
n

Áp dụng kết quả (2) ta có
Pr ηnlow <

2
log n

log n
>1− √
n

Khi n đủ lớn thì 2/ log n < 1. Do đó
log n
Pr ηnlow = 0 > 1 − √
n


12

hay
Pr G ∈ Gn : δ (G) >


log n
n log n > 1 − √ .
n

n

2

Định lí được chứng minh.
Kết quả của Định lí 2.1 cho ta thấy khi n đủ lớn thì
Pr G ∈ Gn : δ (G) >

n

2

log
√n
n

→ 0. Do đó,

log n
n log n > 1 − √ → 1.
n

Điều này có nghĩa là hầu hết mỗi đồ thị đều không có đỉnh bậc thấp.
Nói cách khác, đối với hầu hết mỗi đồ thị G = (V, E) thì δ (G) >
|V |

2



|V | log |V |.

Định nghĩa 2.1 (Bậc ngoại vi của đỉnh). Cho một đồ thị G = (V, E)
với |V | = n, một tập con U ⊆ V với |U | = m và một đỉnh u ∈ U . Số
những láng giềng của u trong G thuộc V \U được gọi là bậc ngoại vi
của đỉnh u tương quan đến tập U trong đồ thị G và được kí hiệu là
degex.
G,U (u).
Để đánh giá degex.
G,U (u) đối với hầu hết các đồ thị, ta xét biến ngẫu
ex
nhiên δn,m,u
:= degex.
G,U (u) trên Gn . Khi đó ta có các kết quả sau (theo

[3]):
ex.
(1). Eδn,m,u
=

n−m
2 ,

ex.
(2). Varδn,m,u
=


n−m
4 ,

(3). Cho đồ thị G = (V, E) với U ⊂ V thỏa mãn 1 ≤ m < n, trong đó
n = |V | , m = |U |, và bất cứ một đỉnh u ∈ U . Khi n đủ lớn, ta có
Pr G ∈ Gn : b1 < degex.
G,U (u) < b2 > 1 −
trong đó b1 =

n−m
2





n
,b
log log n 2

=

n−m
2

+




n
.
log log n

log log n
4n


13

(4). Cho đồ thị G = (V, E) với U ⊂ V mà |U | = m và m thỏa mãn

n

n log n ≤ m < n − √log2nlog n , trong đó n = |V |, và bất kì một
2
đỉnh u ∈ U ta có
Pr G ∈ Gn : degex.
G,U (u) ≥ 1 > 1 −

log log n
.
4n

Từ các kết quả này cho ta thấy, khi n đủ lớn thì
Pr G ∈ Gn : degex.
G,U (u) ≥ 1 > 1 −

log log n
4n


→ 0. Do đó

log log n
→1
4n

Điều này có nghĩa là hầu hết với mỗi đỉnh cho trước đều có ít nhất một
đỉnh ngoại vi của nó. Từ đó ta có được kết quả sau.
Định lí 2.2. Khi n đủ lớn
Pr G ∈ Gn : GrLPATH (G) >

n
n
+
2 log n

>1−

log log n
.
log n

Chứng minh. Thật vậy, xét đồ thị G = (V, E) với |V | = n bất kì. Đồ thị
G có hai tính chất sau:
(T1). δ (G) >

n
2






n log n

(T2). degex.
G,U (u) ≥ 1 đối với bất kì một tập m đỉnh U ⊂ V mà

n log n ≤ m < n − √log2nlog n và bất kì đỉnh u ∈ U .

n
2



Do đó, với mỗi đầu vào là đồ thị G, thuật toán tìm được một đường đi
L chứa hai đoạn L1 và L2 tương ứng với các đặc tính (T1) và (T2) trong
quá trình thực hiện thuật toán.
Theo đặc tính (T1), trên cơ sở một đỉnh được đánh dấu ở bước 1,

thuật toán GrLPATH sẽ lựa chọn và đánh dấu được b = n2 − n log n


14

đỉnh khác. Dãy các đỉnh được đánh dấu tạo thành một đoạn L1 có độ
dài bằng b − 1. Khi đó
log n
Pr G ∈ Gn : GrLPATH trên G tìm được L1 > 1 − √

n
Tiếp theo, theo đặc tính (T2), với mỗi đỉnh u của tập đỉnh U được đánh
dấu trong L1 , ta chọn và đánh dấu thêm một đỉnh. Cùng với đỉnh cuối
cùng của L1 , dãy các đỉnh được đánh dấu tạo thành đoạn L2 .
Để đánh giá độ dài của đoạn L2 , ta đánh giá số lần thuật toán GrLPATH
có thể thực hiện được trong bước lặp của bước 2. Kết quả (4) khẳng định
rằng, thuật toán GrLPATH thực hiện được một phép lặp với xác suất lớn
hơn 1 − log log n/4n. Hơn nữa, với xác suất khá tốt, thuật toán thực
hiện được ít nhất l = 2n/ log n lần phép lặp với xác suất lớn hơn
1 − log log n/2 log n . Bởi vậy, thuật toán GrLPATH tìm thêm được đoạn
L2 với độ dài 2n/ log n với xác suất
Pr G ∈ Gn : GrLPATH trên G tạo ra L2 > 1 −

log log n
2 log n

Vì vậy, đường đi L chứa hai đoạn L1 , L2 có độ dài lớn hơn

n
2

+ logn n . Từ

đó ta có xác suất thuật toán GrLPATH tạo ra đường đi L với độ dài lớn
hơn

n
2

+


n
log n



Pr G ∈ Gn : GrLPATH trên G tạo ra L > 1 −

log log n
.
log n

hay
Pr G ∈ Gn : GrLPATH (G) >

n
n
+
2 log n

>1−

log log n
.
log n


15

Như vậy, trên hầu hết mỗi đồ thị G = (V, E) của bài toán LPATH,

thuật toán tham lam GrLPATH tìm được một đường đi với độ dài lớn hơn
|V |
2

+

|V |
log|V | .

Hiệu suất của thuật toán tham lam GrLP

2.2

ATH

Định lí (2.2) đánh giá độ dài GrLPATH (G) của đường đi tìm được bởi
thuật toán tham lam GrLPATH trên hầu hết đồ thị G. Từ đó ta có cơ sở
để đánh giá hiệu suất RGrLPATH (G) của thuật toán. Kết quả đánh giá
được cho bởi định lí sau.
Định lí 2.3. Khi n đủ lớn,
Pr G ∈ Gn : RGrLPATH (G) < 2 −

2
log n

>1−

log log n
.
log n


Chứng minh. Rõ ràng, với mọi đồ thị G gồm n đỉnh, đường đi dài nhất
có OP TLPATH
n
2

+

n
log n

n − 1 < n. Còn đối với những đồ thị G mà GrLPATH (G) >

như trong định lí trên ta có
RGrLPATH (G) =

OP TLPATH (G)
<
GrLPATH (G)

n
2

n
2
<
2

.
+ logn n

log n

Bởi vậy, theo Định lí 2.2 trên ta có điều phải chứng minh.
Điều này có nghĩa rằng thuật toán GrLPATH có hiệu suất hầu chắc chắn
không vượt quá 2.
Mặt khác, trong trường hợp xấu nhất, đồ thị G có n đỉnh mà RGrLPATH (G) =
n − 1 thì RGrLPATH (G) = ∞. Từ đó ta có kết luận sau.
Hệ quả 2.4. Thuật toán GrLPATH có


16

(i) RGrLPATH = ∞,
a.s
(ii) RGr
LPATH

2.

Như vậy, thuật toán tham lam GrLPATH trên hầu hết mỗi đồ thị G =
(V, E) của bài toán LPATH đều cho ta một đường đi có độ dài lớn hơn
|V |
2

+

|V |
log|V |

và có hiệu suất hầu chắc chắn không vượt quá 2. Do đó, tuy


bài toán LPATH là khó xấp xỉ được nhưng cũng chỉ xảy ra trong một số
rất hiếm những trường hợp xấu.


17

Chương 3
Bài toán ghép cặp
Chương này trình bày một số kết quả liên quan đến phân tích xác suất
của thuật toán xấp xỉ cho bài toán ghép cặp trên đồ thị. Kết quả được
lấy từ tài liệu tham khảo [14].
Trước khi đưa ra bài toán, ta có một số định nghĩa sau.
Định nghĩa 3.1. Cho đồ thị G = (V, E) và F là một tập con của E.
• Tập F được gọi là một ghép cặp của G nếu trong F không có hai
cạnh nào có đỉnh chung.
• Một ghép cặp F được gọi là ghép cặp cực đại (Maximal matching)
nếu không có ghép cặp nào khác trong G thực sự chứa F .
Bài toán 3.1 (Bài toán Minimum maximal matching, hay
MIN-MAXL-MATCH). Cho đồ thị G = (V, E). Tìm một ghép cặp cực đại
F của G sao cho F có lực lượng nhỏ nhất.
Ví dụ 3.1. Xét đồ thị trong Hình 3.1. Một số ghép cặp cực đại của đồ
thị là:
F1 = {a, d, f } ,

F2 = {a, m} ,

F3 = {h, e, f } ,

F4 = {b, c, f } .



18

Hình 3.1: Ghép cặp cực đại trên đồ thị

Trong đó, F2 là ghép cặp cực đại nhỏ nhất trong đồ thị.
Bài toán MIN-MAXL-MATCH là bài toán NP-khó và không thể giải được
bằng thuật toán xấp xỉ thời gian đa thức với hiệu suất tuyệt đối nhỏ
hơn 76 , trừ phi P= NP (theo [5]).

3.1

Thuật toán tham lam đối với bài toán
MIN-MAXL-MATCH

Một thuật toán xấp xỉ đơn giản cho bài toán MIN-MAXL-MATCH là thuật
toán tham lam GrM . Thuật toán GrM được mô tả như sau:
Trên đầu vào là đồ thị G = (V, E) và một tập F = ∅
Bước 1. Chọn tùy ý một cạnh trong E rồi đưa vào F và đánh dấu cạnh
này.
Bước 2. Chọn tùy ý một cạnh trong các cạnh chưa được đánh dấu. Nếu
nó không kề với cạnh nào đã đánh được dấu thì ta đánh dấu cạnh


×