Tải bản đầy đủ (.doc) (44 trang)

Tìm hiểu độ phức tạp một số thuật toán

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (280.87 KB, 44 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

-----------------------

Nguyễn Thế Quyền

TÌM HIỂU ĐỘ PHỨC TẠP MỘT SỐ THUẬT TOÁN

LUẬN VĂN THẠC SĨ KHOA HỌC

Hà Nội - 2013


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

-----------------------

Nguyễn Thế Quyền

TÌM HIỂU ĐỘ PHỨC TẠP MỘT SỐ THUẬTTOÁN
Chuyên ngành: Bảo đảm toán học cho máy tính và hệ thống tính toán
Mã số: 60.46.35

LUẬN VĂN THẠC SĨ KHOA HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS.TS. NGUYỄN HỮU NGỰ

Hà Nội - 2013



MỤC LỤC
MỞ ĐẦU...................................................................................................................... 3
CHƯƠNG 1. KIẾN THỨC CHUẨN BỊ....................................................................4
1.1. Máy Turing...............................................................................................................4
1.1.1. Máy Turing....................................................................................................4
1.1.2. Máy Turing tất định.......................................................................................5
1.1.3. Máy Turing không tất định...........................................................................7
1.2. Khái niệm thuật toán.................................................................................................8
1.2.1. Khái niệm thuật toán.....................................................................................8
1.2.2. Ví dụ về thuật toán........................................................................................9
1.2.3. Luận đề Church-Turing...............................................................................10
1.3. Độ phức tạp của thuật toán.....................................................................................11
1.3.1. Độ phức tạp về thời gian.............................................................................11
1.3.2. Ví dụ cách tính độ phức tạp........................................................................12
CHƯƠNG 2. BÀI TOÁN VÀ ĐỘ PHỨC TẠP CỦA BÀI TOÁN.........................14
2.1. Bài toán là gì?.........................................................................................................14
2.2. Một số bài toán quan trọng.....................................................................................15
2.3. Độ phức tạp của bài toán........................................................................................20
CHƯƠNG 3. PHÂN LỚP CÁC BÀI TOÁN THEO ĐỘ PHỨC TẠP..................21
3.1. Lớp các bài toán P, NP và mối quan hệ giữa lớp P và lớp NP..............................21
3.1.1. Lớp P............................................................................................................21
3.1.2. Lớp NP.........................................................................................................21
3.1.3. Mối quan hệ giữa lớp P và NP....................................................................21
3.2. Lớp các bài toán NPC.............................................................................................21
3.2.1. Phép dẫn với thời gian đa thức....................................................................21
3.2.2. Lớp các bài toán NPC.................................................................................22
3.2.3. Mối quan hệ giữa các lớp bài toán P, NP và NPC......................................22

1



3.2.4. Một số bài toán lớp NPC.............................................................................23
1) Bài toán SAT. Định lý Cook.................................................................23
2) Bài toán 3SATIFIABILITY (3SAT).....................................................30
3) Bài toán 3-DIMENSIONAL MATCHING (3DM)...............................33
4) Bài toán VERTEX COVER (VC).........................................................37
5) Bài toán CLIQUE..................................................................................39
6) Bài toán HAMILTON CIRCUIL (HC).................................................39
7) Bài toán PARTITION............................................................................39
8) Bài toán TRAVELING SALEMAN (TSP)...........................................39
KẾT LUẬN...............................................................................................................41
TÀI LIỆU THAM KHẢO........................................................................................42

2


MỞ ĐẦU
Lý thuyết độ phức tạp là một lĩnh vực trung tâm của khoa học máy tính với các
kết quả liên quan chặt chẽ với sự phát triển và sử dụng các thuật toán. Nghiên cứu về lý
thuyết độ phức tạp sẽ giúp chúng ta hiểu biết sâu sắc và khám phá ra ranh giới của
những vấn để “có thể” tính toán với các nguồn tài nguyên hợp lý.
Trong bản luận văn này, trước hết chúng tôi tìm hiểu một số khái niệm quan
trọng của lý thuyết thuật toán như thuật toán và độ phức tạp của thuật toán. Trên cơ sở
đó, chúng tôi bước đầu tìm hiểu một số khái niệm quan trọng của lý thuyết độ phức tạp
như khái niệm bài toán, độ phức tạp của bài toán. Cuối cùng là chúng tôi tìm hiểu về
các lớp phức tạp của bài toán và mối quan hệ giữa các lớp phức tạp đó. Trong đó đặc
biệt quan tâm đến lớp phức tạp NP-đầy đủ.
Nội dung của bản luận văn bao gồm ba chương:
Chương 1: Trình bày tóm tắt những kiến thức cơ bản và trọng tâm về lý thuyết

thuật toán như máy Turing đơn định, máy Turing không đơn định, thuật toán, độ phức
tạp thuật toán.
Chương 2: Gồm có ba phần chính trình bày về khái niệm bài toán, danh sách
các bài toán quan trọng và khái niệm độ phức tạp của bài toán.
Chương 3: Gồm có hai phần chính trình bày lớp các bài toán P, NP và lớp bài
toán NP-đầy đủ.
Để hoàn thành bản luận văn này, chúng tôi đã nhận được sự giúp đỡ tận tình của
thầy hướng dẫn – PGS.TS. Nguyễn Hữu Ngự và sự chỉ bảo góp ý của các thầy cô trong
Bộ môn Tin học, Khoa Toán – Cơ – Tin học và các bạn đồng nghiệp. Nhân đây, chúng
tôi cũng xin cảm ơn các thầy cô và các bạn đồng nghiệp đã giúp đỡ chúng tôi trong quá
trình làm luận văn.

3


CHƯƠNG 1. KIẾN THỨC CHUẨN BỊ
Trước khi nói về thuật toán, chúng ta hãy xem xét một mô hình tính toán thể
hiện khá tốt về các thuật toán.
1.1. Máy Turing (Turing machine)
1.1.1. Máy Turing
Gồm có:
1) Tập trạng thái trong hữu hạn
2) Băng vô hạn hai phía (về lý thuyết có thể kéo dài tuỳ ý cả hai phía)
3) Bảng tín hiệu vào, bảng tín hiệu trên băng và một đầu đọc-ghi
4) Bảng chuyển trạng thái
q

...

B


B

B

B

a1

a2

...

...

ai

...

...

an

B

B

B

...


Một bước làm việc của máy gồm:
- Đầu đọc-ghi đọc tín hiệu trên băng
- Căn cứ vào trạng thái trong và tín hiệu đọc trên băng, đầu đọc-ghi sẽ ghi một
tín hiệu trên băng, dịch chuyển sang phải hoặc sang trái một ô và chuyển sang một
trạng thái trong nào đó.
Quy ước khi máy bắt đầu làm việc thì trạng thái là trạng thái đầu của máy, với
input hữu hạn trên băng, đầu đọc-ghi nằm ở ký tự bên trái nhất của input. Các kết quả
trung gian trong khi tính toán có thể lưu trên băng hoặc có thể tổ chức lưu vào trạng
thái trong (nhưng chú ý là số trạng thái trong của một máy phải hữu hạn).

4


1.1.2. Máy Turing tất định (DTM)
Có thể định nghĩa một cách hình thức một máy Turing tất định như sau: là một
bộ:
M = <Q, Σ, Γ, F, q0, B, t1>
trong đó:
- Γ: là bảng tín hiệu trên băng (hữu hạn)
- Σ: là bảng tín hiệu vào (hữu hạn), Σ ⊂ Γ
- Q: là tập trạng thái (trong) (hữu hạn)
- F: là hàm chuyển F: Q x Γ → Q x Γ x {L,R}
- q0: trạng thái ban đầu (q0 ∈ Q)
- t1: trạng thái kết thúc (t1 ∈ Q)
- B: ký tự trắng, B ∈ Γ, B ∉ Σ
Ý nghĩa:
- Σ là các tín hiệu vào để ghi input
- Γ là các tín hiệu đọc và ghi trên băng
Hàm chuyển F(q, a) = (q', a', D) có thể cho bằng bảng như sau:

a
...
q
...

...

(q', a', D)
-

Ban đầu các tín hiệu trên băng là B, băng có thể kéo dài vô hạn ở cả hai chiều:
trái và phải.
Xâu a1a2...qai...ak được gọi là một hình trạng của máy, trong đó các a k∈ Γ, q∈Q,
có nghĩa là đầu đọc-ghi đang đọc ô thứ i, tín hiệu đang được đọc là ai.
Tại mỗi bước, máy ở trạng thái q, đầu đọc-ghi đọc tín hiệu a i tại ô trên băng,
hình trạng của máy có dạng a1a2...ai-1qai...ak. Theo hàm chuyển F(q, ai) = (q', c, D), máy

5


sẽ chuyển sang trạng thái q', ghi c lên băng (thay cho ai), đầu đọc-ghi chuyển sang phải
hay sang trái một ô tùy theo D là R hoặc L. Ta nói rằng máy M chuyển từ hình trạng:
H = a1a2...ai-1qai...ak
sang hình trạng:
H' = a1a2...q'ai-1cai+1...ak nếu D = L hoặc
H' = a1a2...ai-1cq'ai+1...ak nếu D = R
Ký hiệu H − H'.
Máy sẽ làm việc từng bước cho đến khi gặp hình trạng mà hàm chuyển F(s,a)
không xác định hoặc gặp trạng thái kết thúc t1.
Xâu x (input) trên bảng tín hiệu Σ (tức là x ∈ Σ*) gọi là được đoán nhận bởi

máy M nếu tồn tại dãy hình trạng H0, H1, ..., Hm sao cho:
H0 − H1 − ...− Hm.
H0 là hình trạng ban đầu, input x được ghi trên băng, đầu đọc-ghi nhìn vào ký tự
đầu tiên của input, trạng thái của máy là q0, tức là:
H0 = q0a1a2...ai-1ai...an với x = a1a2...ai-1ai...an.
Hm có trạng thái là t1.
Tập N các xâu (ngôn ngữ trên Σ) thuộc Σ* gọi là được đoán nhận bởi máy M
nếu N = {x | x∈Σ*, x được đoán nhận bởi máy M}.
Các bài toán có thể có nhiều loại:
- Đoán nhận một tính chất của input
- Tính toán một giá trị
- ...
Chú ý: Hàm chuyển F có thể không xác định khắp nơi. Máy sẽ dừng khi gặp
trạng thái t1 kết thúc (cho trả lời "yes") hoặc dừng ở trạng thái khác t 1 (cho trả lời "no")
hoặc gặp bộ (s, a) tại đó F(s, a) không xác định (cũng cho trả lời "no"). Tuy nhiên có
thể làm cho hàm chuyển F trở thành xác định khắp nơi nếu thêm một trạng thái kết

6


thúc phủ định qp, và với mọi bộ (s, a) tại đó F(s, a) không xác định cho máy chuyển
sang trạng thái qp
F(s, a) = (qp, , ).
Nếu không có gì khác thì ngầm định bảng tín hiệu vào là Σ = {0,1}, và chủ yếu
ta chỉ xét ví dụ trên các bài toán đoán nhận.
Ký hiệu q0 là trạng thái đầu, t1 là trạng thái kết thúc khẳng định.
Ví dụ: Máy Turing đoán nhận ngôn ngữ {x | x có độ dài chẵn}
q0
q1


0
(q1, 0, R)
(q0, 0, R)

1
(q1, 0, R)
(q0, 0, R)

B
(t1, B, ' ')
-

Với input 010110 ta có dãy hình trạng:
(q0)010110 − 0(q1)10110 − 01(q0)0110 − 010(q1)110 −
0101(q0)10 − 01011(q1)0 − 010110(q0) − 010110(t1)
trạng thái cuối cùng là trạng thái kết thúc đoán nhận t1.
1.1.3. Máy Turing không tất định (NTDM)
Định nghĩa như máy Turing tất định, trong đó hàm chuyển F là hàm đa trị nghĩa
là F: Q x Σ → 2Q x Γ x {L,R}.
Tại mỗi bước, có thể chuyển sang bước sau bằng một trong các khả năng tùy
theo hàm chuyển F. Nếu có một nhánh đoán nhận input x thì xem như máy đoán nhận
input đó.
Giả sử F(s, a) = {(si1, ai1, Di1), (si2, ai2, Di2), ..., (sim, aim, Dim)} là một tập (có thể
rỗng). Với hình trạng H với trạng thái s và tín hiệu a được đọc máy có thể chuyển đến
một trong các hình trạng:
H − Hi1, H − Hi2, ..., H − Him
trong đó Hik có trạng thái sik và tín hiệu được ghi là aik.
Có thể biểu diễn các bước làm việc của máy bằng hàng đợi hoặc bằng cây.

7



Ví dụ:
0
(q0,1,R)

q0

1

B

(q2,0,L)
(q0,1,R)

(t1,' ',' ')

(q1,1,R)

q1
q2
Với w = 010
(q0)010

1(q0)10

1(q1)10

111(q0)


111(q1)B

(t1)

(q2)100

1(q0)00

11(q0)0

11(q1)0

1.2. Khái niệm thuật toán (algorithm)
Bài toán xử lý thông tin:
Input →

Công cụ

→ Output

Với dữ liệu vào (input) công cụ sẽ tính toán và cho kết quả theo yêu cầu của bài
toán. Nói chung ta phân biệt một số loại bài toán:
- Những bài toán đoán nhận một tính chất (xét số nguyên n có phải nguyên tố
hay không,...)
- Những bài toán tính giá trị một hàm
- Những bài toán tìm một lời giải (tìm đường đi trên đồ thị, tìm chu trình
Hamilton, ...).
Để giải quyết bài toán cần thuật toán. Thuật toán là công cụ xử lý thông tin.
1.2.1. Khái niệm
Một cách không hình thức thì thuật toán là việc mô tả một cách chính xác quá

trình thực hiện trên các đối tượng để nhằm đạt được một kết quả nào đó theo một yêu
cầu cho trước.
Cần chú ý đặc trưng hữu hạn trong thuật toán:
- Đối tượng hữu hạn, thao tác hữu hạn

8


- Cho kết quả qua một số hữu hạn bước.
Ta phân biệt hai loại thuật toán: tất định và không tất định. Đối với thuật toán tất
định tại mỗi thời điểm chỉ có không quá một bước tiếp theo. Đối với thuật toán không
tất định tại mỗi thời điểm có thể có một số khả năng để lựa chọn bước tiếp theo.
Thông thường để mô tả thuật toán (tức là chỉ dẫn ở mỗi bước cần thực hiện
những công việc gì) ta dùng một văn bản hướng dẫn các bước, một sơ đồ khối, một
ngôn ngữ lập trình nào đó, hoặc một ngôn ngữ tựa Pascal, ...
1.2.2. Ví dụ về thuật toán
Ví dụ: Thuật toán sắp dãy số tăng bằng đổi chỗ trực tiếp
Input: n và dãy số n phần tử a1, a2, ..., an .
Output: Dãy số a1, a2, ..., an được sắp xếp tăng.
Mô tả cụ thể các bước:
1. i = 1
2. k = i + 1
3. Nếu ai > ak thì hoán vị ai với ak
4. k = k + 1
5. Nếu k <= n thì trở lại 3
6. i = i + 1
7. Nếu i < n thì trở lại 2.
Ngôn ngữ giả Pascal:
For i = 1 to n - 1 do
For k = i + 1 to n do

if ai > ak then hoán vị giá trị ai với ak cho nhau.

9


Sơ đồ khối:
Nhập n, dãy số a1, ..., an
i=1
k = i+1
ai>ak

Đ

hoán vị ai với ak

S
k = k+1
Đ

kS
i = i+1

Đ

iS
S

Đưa ra dãy số a1, ..., an

1.2.3. Luận đề Church-Turing
Một vấn đề được đặt ra là: liệu có bài toán nào giải được bằng một cách nào đó
(được biết cho đến nay) mà không thực hiện được trên máy Turing (hoặc trên các mô
hình thuật toán tương đương)?
Luận đề Church-Turing phát biểu như sau: những bài toán có thể giải được trên
một mô hình tính toán nào đó được biết cho đến nay đều có thể tính được trên máy
Turing.

10


1.3. Độ phức tạp của thuật toán
Để đánh giá hiệu quả của một thuật toán, ta có thể đánh giá độ phức tạp của
thuật toán về mặt thời gian, tức là thời gian máy tính làm việc và về không gian, tức là
dung lượng bộ nhớ của máy tính cần thiết để thực hiện thuật toán. Trong luận văn này,
khi nói đến độ phức tạp của thuật toán ta luôn hiểu là độ phức tạp về thời gian.
1.3.1. Độ phức tạp về thời gian
Thời gian làm việc của máy tính khi chạy một thuật toán nào đó không chỉ phụ
thuộc vào thuật toán, mà còn phụ thuộc vào máy tính được sử dụng. Vì thế, để có một
tiêu chuẩn chung, ta sẽ đo độ phức tạp của một thuật toán bằng số các phép tính phải
thực hiện. Khi thực hiện cùng một thuật toán, số các phép tính phải thực hiện còn phụ
thuộc vào cỡ của bài toán, tức là độ lớn của đầu vào. Vì thế, độ phức tạp của thuật toán
sẽ là một hàm số phụ thuộc độ lớn của đầu vào. Trong những ứng dụng thực tiễn,
chúng ta không cần biết chính xác hàm này, mà chỉ cần biết “cỡ” của chúng, tức là cần
có một ước lượng đủ tốt của chúng.
Giả sử A là một thuật toán. Ký hiệu T(X) là thời gian tính toán với đầu vào X.
Độ phức tạp của thuật tính trong trường hợp xấu nhất:
T(n) = max {T(X), X có độ dài bằng n}
Nếu A là thuật toán không tất định, thì T(n) là độ dài dài nhất trong các nhánh
làm việc với đầu vào X.

Trên thực tế còn xét đến độ phức tạp trong trường hợp trung bình:
Ttb(n) =

∑T(X), X có độ dài bằng n
số các dữ liệu có thể với độ dài n

Để ước lượng độ phức tạp của thuật toán, ta dùng khái niệm bậc O-lớn và bậc
Θ(bậc Theta).
Giả sử f(n) và g(n) là hai hàm xác định trên tập hợp các số nguyên dương. Ta
nói f(n) có bậc O-lớn của g(n), và viết f(n) = O(g(n)) hoặc f = O(g), nếu tồn tại n0 và
hằng số dương C sao cho với mọi n ≥ n0 luôn có f(n) ≤ C.g(n).

11


Nếu tồn tại n0 và các hằng số dương C 1 và C2 sao cho với mọi n ≥ n0 luôn có
C1g(n) ≤ f(n) ≤ C2g(n), thì ta ký hiệu f(n) = Θ(g(n)).
Ký hiệu O nói rằng hàm f(n) bị chặn trên bởi g(n) (sai khác một hằng số dương),
còn ký hiệu Θ nói rằng hàm f(n) tương đương với g(n) (sai khác các hằng số dương).
Nếu thuật toán A có T(n) = O(g(n)) thì g(n) mới chỉ là chặn trên của T(n), còn
nếu T(n) =Θ(g(n)) thì g(n) mới là tượng trưng chính xác cho độ phức tạp của thuật
toán. Tuy nhiên việc tính O dễ hơn việc tính θ. Nếu T(n) = O(g(n)) (hoặc tốt hơn là
Θ(g(n))) trong đó g(n) là một đa thức theo n thì ta nói rằng thuật toán làm việc với thời
gian đa thức, gọi tắt là thuật toán đa thức. Thuật toán đa thức thường được xem là tốt.
1.3.2. Ví dụ cách tính độ phức tạp
Ví dụ 1: Thuật toán tìm kiếm nhị phân
Input: dãy số tăng a1, ..., an; số x.
Output: trả lời x có thuộc dãy hay không
Dùng thuật toán đệ quy DQ(a, b) (tìm trên đoạn con [d, c])
1. Nếu d = c và a(c) = x return "yes"

2. c = (a + b)/2
3. Nếu a(c) = x return "yes"
4. Nếu x < a(c) thì gọi DQ(a, c-1) else gọi DQ(c+1, b)
Để tìm nghiệm, gọi DQ(1, n)
Đánh giá độ phức tạp: T(2*k) = T(k) + 2.
T(1) = 1
T(2) = T(1) + 2
...
T(2k) = T(2k-1) + 2
Lấy 2k xấp xỉ n,
T(n) = T(2k) (cộng từng vế và khử)
= 2*k – 1 = 2*log2n - 1 = O(logn).

12


Ví dụ 2: (tính độ phức tạp trung bình)
Máy Turing đoán nhận ngôn ngữ {X | X ∈ {0,1}* có ít nhất một chữ số 1}
Số dữ liệu có thể với độ dài n là s = 2n
Số các X không có chữ số 1 (không được đoán nhận) là 1 (duy nhất "00...0"),
thời gian T(X) = n, tỷ lệ không đoán nhận là T0(n) = n/s.
Với i ≤ n thì số các X (được đoán nhận) có X(i) = '1', và X(k) = '0' với k < i, là
2n-i, với thời gian T(X) = i.
Tổng thời gian tính với các X này là:
h = 1*2n-1 + 2*2n-2 + ... + n*2n-n
Tỷ lệ đoán nhận là T1(n) = h/s = t
t = 1*2-1 + 2*2-2 + ... + (n-1)*2-(n-1) + n*2-n
Đặt c = 1/2 (khi đó T0(n) = n/s = n*cn)
t = c + 2*c2 + ... + (n-1)*cn-1 + n*cn
c*t = c2 + 2*c3 + ... + (n-1)*cn + n*cn+1

t - c*t = c + c2 + ... + cn + n*cn+1 = c*[(1- cn)/(1- c) - n*cn]
T1(n) = t = c*[(1- cn)/(1- c) - n*cn ]/(1-c) (vì c/(1-c) = 1)
Vậy Ttb(n) = T1(n) + T0(n) = (1- cn)/(1- c) - n*cn + n*cn = 2 - 1/2n-1.
Trong khi đó độ phức tạp T(n) = n.

13


CHƯƠNG 2. BÀI TOÁN VÀ ĐỘ PHỨC TẠP CỦA BÀI TOÁN
2.1. Bài toán là gì?
Trong giới hạn của chúng ta, sẽ chỉ xem xét các bài toán là một vấn đề phù hợp
với tính toán của máy tính và một tập hợp các kết quả chính xác. Vấn đề về tìm kiếm
một bản án thích đáng dành cho bị cáo không phải là bài toán vì nó phụ thuộc vào tư
pháp và do đó nó không thích hợp cho việc xử lý của máy tính. Mặt khác, vấn đề về
việc dịch một văn bản tiếng Đức sang một ngôn ngữ khác thì phù hợp với việc xử lý
của phép tính, nhưng trong trường hợp này không rõ các kết quả có chính xác hay
không. Vì vậy vấn đề dịch thuật cũng không phải là một bài toán. Một ví dụ rõ ràng về
một bài toán là việc tính toán con đường ngắn nhất từ đỉnh s đến đỉnh t trong một đồ thị
mà trong đó mỗi cạnh được gắn với một chi phí dương (chúng ta có thể diễn giải như
khoảng cách hay thời gian di chuyển).
Một bài toán được xác định bởi:


Một mô tả tập hợp đầu vào được phép, mỗi một đầu vào có thể được thể hiện
như là một chuỗi hữu hạn trên một bảng chữ cái hữu hạn (tập hợp ký hiệu của
máy tính)



Một phát biểu về các tính chất mà câu trả lời (hoặc giải pháp) cần phải thoả

mãn.
Thông thường bài toán được mô tả như trong ví dụ sau:
Đầu vào: Một số nguyên dương n
Câu hỏi: n có nguyên tố không?
Trong mỗi trường hợp, khi chúng ta tìm kiếm một trong nhiều câu trả lời chính

xác tiềm năng, chúng ta coi bài toán như là một bài toán tìm kiếm. Nếu chúng ta tìm
kiếm một giải pháp tối ưu về mặt nào đó, chúng ta coi bài toán đó như là một bài toán
tối ưu (ví dụ như trường hợp tìm kiếm một đường đi ngắn nhất). Thông thường, tính
toán giá trị của một giải pháp tối ưu là đủ (ví dụ, độ dài của một con đường ngắn nhất).
Những biến thể này được gọi là các bài toán đánh giá. Bài toán đánh giá luôn luôn có

14


giải pháp duy nhất. Trong trường hợp đặc biệt, khi câu trả lời có thể chỉ là 0 (không) và
1 (có) và chúng ta phải quyết định khả năng nào trong hai khả năng này là chính xác,
thì lúc đó chúng ta nói về một bài toán quyết định. Các bài toán quyết định phát sinh tự
nhiên trong nhiều tình huống: Từ một cấu hình cho trước của một bàn cờ, liệu quân cờ
màu trắng có một chiến lược giành chiến thắng không? Có phải con số đưa ra là một số
nguyên tố không? Có thể thoả mãn các điều kiện đã quy định không?
Các bài toán bao gồm tất cả các vấn đề có thể xử lý được bởi máy tính và
chúng ta có thể phân biệt một cách rõ ràng giữa các giải pháp chính xác và
không chính xác. Trong số này có các bài toán tối ưu và các bài toán với các
giải pháp duy nhất như các bài toán đánh giá và các bài toán quyết định. Các
định dạng đầu vào khác nhau cho cùng một “bài toán” sẽ đưa đến các bài toán
khác nhau, nhưng thông thường những bài toán này về mặt thuật toán rất giống
nhau.
2.2. Một số bài toán quan trọng
1) Các bài toán về người bán hàng

Bài toán người bán hàng (TSP): là bài toán tìm kiếm một chu trình ngắn nhất
qua n thành phố, mỗi thành phố đúng một lần và quay trở lại điểm xuất phát của nó.
Các thành phố được ký hiệu bằng các nhãn là 1, ..., n và các khoảng cách giữa các
thành phố là di,j (1 ≤ i, j ≤ n). Các khoảng cách được chọn từ tập

∪ {∞}, và giá trị ∞

có nghĩa là không có sự kết nối trực tiếp giữa hai thành phố cụ thể. Mỗi chu trình là
một phép hoán vị π của {1, …, n}, do đó các thành phố đã đến được sắp xếp theo thứ tự
là π(1), π(2), …, π(n), π(1). Giá trị của một chu trình π được tính bởi:
dπ(1), π(2) + dπ(2), π(3) + … + dπ(n-1), π(n) + dπ(n), π(1)
và một chu trình có giá trị cực tiểu cần được tính toán. Có nhiều biến thể đối với bài
toán này. TSP (hoặc TSPOPT) là ký hiệu cho bài toán tối ưu nói chung. TSP EVAL và
TSPDEC ký hiệu cho các bài toán ước lượng và bài toán quyết định có liên quan. Đối với
bài toán quyết định, đầu vào bao gồm một giới hạn D và phải xác định có hay không

15


một chu trình có giá trị không vượt quá D. Chúng ta cũng sẽ xem xét các biến thể bị
giới hạn sau đây:


TSPSYM: các khoảng cách là đối xứng (di,j = dj,i)



TSP∆: các khoảng cách thoả mãn bất đẳng thức tam giác, có nghĩa là di,j≤di,k+dk,j




TSPd-Euclid: các thành phố là các điểm trong không gian Euclide d chiều R d và
khoảng cách tương ứng với khoảng cách Euclide (chuẩn L2)



TSPN: các khoảng cách thuộc {1, …, N} (N là một số tự nhiên xác định)



DHC (Chu trình Hamilton định hướng): khoảng cách thuộc {1, ∞}, và các định
dạng đầu vào thông thường là một đồ thị định hướng chỉ chứa những cạnh có
giá trị bằng 1.



HC = DHCSYM: biến thể đối xứng của DHC, mà định dạng đầu vào thông
thường là một đồ thị vô hướng chỉ chứa những cạnh có giá trị bằng 1.
2) Các bài toán về xếp ba lô
Làm thế nào để một hành khách thu xếp hành lý của mình trong giới hạn W∈

từ n đồ vật muốn mang theo với giả thiết rằng đồ vật thứ i (i = 1, n ) có trọng lượng wi∈
và có giá trị ui ∈

được gọi là bài toán xếp ba lô (KNAPSACK). Hành khách

không được phép mang các đồ vật có tổng trọng lượng vượt quá W. Do hạn chế này,
mục tiêu là tối đa hoá tổng giá trị của tất cả các đồ vật được chọn. Ở đây, cũng có các
biến thể mà trong đó các giá trị u i và/hoặc các trọng lượng w i đều bị chặn. Trong
trường hợp tổng quát, các đồ vật có những giá trị khác nhau trên mỗi đơn vị trọng

lượng.
KNAPSACK* biểu thị trường hợp đặc biệt với u i = wi cho tất cả các đồ vật. Mục
tiêu chỉ là để đạt tới càng gần càng tốt giới hạn trọng lượng mà không bị vượt quá mức
quy định. Hơn nữa, nếu W = (w 1 + w2 + … + wn)/2, và chúng ta xem xét bài toán quyết
định là liệu chúng ta có thể đạt được trọng lượng tối đa cho phép hay không, thì bài
toán sẽ tương đương với câu hỏi liệu tất cả các đồ vật có thể được chia thành hai nhóm

16


có tổng trọng lượng giống nhau không. Trường hợp đặc biệt này được gọi là bài toán
phân hoạch (PARTITION).
3) Các bài toán về phân hoạch
Bài toán phân hoạch (PARTITION) cũng là một trường hợp đặc biệt của bài
toán đóng thùng (BINPACKING), trong đó các thùng có kích thước b có sẵn, chúng ta
phải đóng thùng n đồ vật với các kích cỡ u 1, u2, ..., un vào càng ít thùng càng tốt. Nhưng
chúng ta cũng có thể xem BINPACKING như là một trường hợp rất đặc biệt của bài
toán lập lịch. Lớp của các bài toán lập lịch là gần như không thể đạt được về mặt tổng
quát. Trong mỗi trường hợp, các nhiệm vụ phải được phân chia giữa con người hoặc
máy móc với những hạn chế ở các mặt khác nhau. Không phải tất cả mọi người đều
thích hợp cho mọi nhiệm vụ, những người khác nhau có thể cần những khoảng thời
gian khác nhau để hoàn thành cùng một nhiệm vụ, những nhiệm vụ nhất định có thể
cần được hoàn thành theo một trình tự cụ thể, có thể xác định những thời điểm bắt đầu
sớm nhất hoặc những thời điểm hoàn thành chậm nhất (các thời hạn chót), và có thể sử
dụng các điều kiện tối ưu khác nhau.
4) Các bài toán giám sát (hoặc phủ)
Một bài toán giám sát điển hình là bài toán triển lãm nghệ thuật. Yêu cầu đưa ra
là giám sát tất cả các bức tường của một phòng triển lãm với càng ít máy quay càng tốt.
Chúng ta sẽ hạn chế trong các bài toán giám sát trên các đồ thị vô hướng, trong trường
hợp đó chúng thường được gọi là các bài toán phủ. Trong bài toán phủ đỉnh

(VERTEXCOVER), mỗi đỉnh sẽ theo dõi tất cả các cạnh liên quan tới nó, và tất cả các
cạnh được theo dõi với càng ít đỉnh càng tốt. Trong bài toán phủ cạnh
(EDGECOVER), các vai trò đảo ngược lại: mỗi cạnh theo dõi hai đỉnh liên quan đến
nó, các đỉnh sẽ được giám sát với càng ít cạnh càng tốt.
5) Các bài toán clique
Các đỉnh của đồ thị có thể được sử dụng để biểu diễn con người, các cạnh sẽ
biểu diễn mối quan hệ giữa mọi người. Một clique được định nghĩa là một nhóm trong

17


đó mỗi người thích những người khác trong nhóm. Trong bài toán phủ clique
(CLIQUECOVER), các đỉnh của một đồ thị phải được phân chia thành càng ít tập hợp
càng tốt, theo cách như vậy mỗi tập hợp tạo thành một clique. Trong bài toán clique
(ký hiệu là CLIQUE), một clique lớn nhất có thể sẽ được tính toán. Một anti-clique
(“không ai thích ai cả”, giữa hai đỉnh bất kỳ không có một cạnh nào) được gọi là một
tập hợp độc lập, và bài toán tính toán một tập hợp độc lập lớn nhất được gọi là
INDEPENTSET.
6) Các bài toán xây dựng nhóm
Xây dựng nhóm có nghĩa là phân chia những người với khả năng khác nhau vào
các nhóm hợp tác, trong đó các thành viên của mỗi nhóm phải làm việc cùng nhau. Đối
với bài toán k-DM (đối sánh k chiều, nghĩa là xây dựng các nhóm có kích thước k),
chúng ta có sẵn k nhóm người (mỗi nhóm đại diện cho một trong k khả năng), và danh
sách các nhóm k thành viên tiềm năng, trong đó mỗi người đến từ các nhóm khả năng.
Mục đích là để hình thành nên càng nhiều nhóm càng tốt với hạn chế là mỗi người chỉ
có thể được tham gia vào một nhóm. 2-DM cũng được biết đến như là bài toán hôn
nhân: hai “khả năng” được hiểu như là hai giới tính, một nhóm có tiềm năng được xem
như là một cuộc “hôn nhân bền vững”, và mục tiêu là tối đa hoá số lượng các cuộc hôn
nhân bền vững.
7) Các bài toán luồng tối ưu trong các mạng

Trong bài toán luồng qua mạng (NETWORKFLOW), người ta tìm kiếm các
luồng tối đa trong các mạng. Chúng ta chỉ quan tâm đến bài toán cơ bản mà trong đó
chúng ta tìm kiếm để tối đa hoá luồng từ s đến t trong một đồ thị có hướng. Luồng f(e)
chạy theo một cạnh e phải là số nguyên không âm bị chặn trên bởi khả năng c(e) của
cạnh đó. Luồng tổng đạt đến một đỉnh v ∉ {s, t}, nghĩa là tổng số f(e) với e = (., v) phải
bằng luồng tổng rời khỏi v, tức là tổng số f(e) với e = {v, .}. Đỉnh nguồn s không có bất
kỳ cạnh nào đi vào và đỉnh đích t không có bất kỳ cạnh nào đi qua.

18


8) Các bài toán vô địch trong các giải đấu thể thao
Bài toán vô địch (CHAMPIONSHIP) cơ bản là một bài toán quyết định. Một cổ
động viên tự hỏi tại một thời điểm cụ thể trong mùa giải liệu có thể (ít nhất là về mặt lý
thuyết) đội bóng yêu thích của mình sẽ vô địch trong giải đấu được không. Cho biết
xếp hạng hiện tại của mỗi đội chơi và có một danh sách các trận đấu còn được chơi.
Đội được chọn có thể trở thành nhà vô địch nếu có kết quả tiềm năng của các các trận
đấu còn lại sao cho đến cuối giải không đội nào khác có nhiều điểm hơn (nếu cần thiết,
đội chơi có thể cũng cần phải có hiệu số bàn thắng thua tốt nhất). Ngoài ra, một trong
những quy tắc sau đây phải chỉ rõ bao nhiêu điểm đạt được trong mỗi trận đấu:


Quy tắc a-điểm: Sau mỗi trận đấu, a điểm được tính (a ∈

), và mỗi phân chia

a thành b điểm cho đội chơi 1 và a – b điểm dành cho đội chơi 2 với 0 ≤ b ≤ a và
b∈



là có thể.

Quy tắc (0, a, b)-điểm: các khả năng chỉ là b : 0 (đội nhà chiến thắng), a : a
(hoà) và 0 : b.
Trong thực tế, ở các môn thể thao khác nhau, các quy tắc tính điểm khác nhau

được sử dụng gồm: quy tắc 1-điểm được sử dụng trong môn thể thao không cho phép
có kết quả hoà (bóng rổ, bóng chuyền, …). Quy tắc 2-điểm (tương đương với quy tắc
(0, 1, 2)-điểm) là quy tắc cổ điển trong thể thao chấp nhận tỷ số hoà (bóng ném đồng
đội, ...). Quy tắc 3-điểm được sử dụng trong giải khúc côn cầu trên băng ở Đức (DEL).
Quy tắc (0, 1, 3)-điểm hiện tại đang được sử dụng trong bóng đá.
9) Các bài toán xác minh
Đối với lớp của các bài toán xác minh, chúng ta đề cập tới lĩnh vực phần cứng.
Bài toán cơ bản là liệu đặc tả S và nhận dạng R của một chíp có mô tả cùng một hàm
số Boolean không. Tức là, chúng ta có các mô tả S và R của các hàm Boolean f và g và
tự hỏi liệu f(a) = g(a) với tất cả các yếu tố đầu vào a không. Vì chúng ta thực hiện các
thao tác bit xác minh, có thể giả sử rằng f, g: {0, 1} n → {0, 1}. Tính chất f ≠ g tương
đương với tồn tại một a mà (f ⊕ g)(a) = 1 (⊕ = XOR). Vì vậy, chúng ta đặt ra câu hỏi

19


liệu h = f ⊕ g có thể thoả được không, tức là liệu h có thể cho ra giá trị 1 không. Bài
toán quyết định này được gọi là bài toán thoả được.


SATCIR: đầu vào được biểu diễn như một mạch logic.




SAT = CNF-SAT = SATCNF: đầu vào được biểu diễn như một hội của các mệnh
đề (là tuyển của các literal), nghĩa là ở dạng chuẩn tắc hội.



DNF-SAT = SATDNF: đầu vào được biểu diễn như là một tuyển của các đơn thức
(là hội của các literal), nghĩa là ở dạng chuẩn tắc tuyển.
10)Các bài toán lý thuyết số
Mật mã học hiện đại có kết nối chặt chẽ với các bài toán lý thuyết số, trong đó

các số rất lớn được sử dụng. Đã từng được học trong trường, hầu hết chúng ta học thuật
toán về cộng các phân số đòi hỏi chúng ta phải tính toán mẫu số chung và để làm được
điều đó, chúng ta sẽ phân chia các mẫu số thành các thừa số nguyên tố. Đây là bài toán
tạo thừa số nguyên tố (FACT).
2.3. Độ phức tạp của bài toán
Đối với một bài toán có rất nhiều thuật toán để giải. Ta ký hiệu:
TA(n) = max {T(X), X đầu vào có độ dài n}
là độ phức tạp của thuật toán A.
Độ phức tạp của bài toán B được định nghĩa như sau:
TB(n) = inf {TA(n), A là thuật toán giải bải toán B}
Rất khó tính được TB(n), mà thường chỉ biết được cận dưới và cận trên của
TB(n). Nếu ta xây dựng được một thuật toán A giải bài toán B thì T B(n) ≤ TA(n), có
nghĩa là độ phức tạp của bài toán B nhỏ hơn hoặc bằng độ phức tạp của thuật toán A
(một cận trên). Để chứng tỏ TB(n) ≥ f(n) (một cận dưới) thì ta phải chứng minh rằng bất
kỳ thuật toán A nào giải bài toán B cũng đều có độ phức tạp lớn hơn hoặc bằng f(n).

20


CHƯƠNG 3. PHÂN LỚP CÁC BÀI TOÁN THEO ĐỘ PHỨC TẠP

3.1. Lớp các bài toán P, NP và mối quan hệ giữa lớp P và lớp NP
3.1.1. Lớp P
Định nghĩa:
Lớp P là lớp những bài toán giải được bằng máy tính Turing tất định trong thời
gian đa thức.
Ví dụ: Bài toán tìm ước chung lớn nhất của hai số nguyên dương, bài toán kiểm
nghiệm tính nguyên tố...
3.1.2. Lớp NP
Định nghĩa:
Lớp NP là lớp các bài toán có thể giải được bằng máy Turing không tất định
trong thời gian đa thức.
Ví dụ: Bài toán người bán hàng, bài toán chu trình Hamilton, ...
3.1.3. Mối quan hệ giữa lớp P và lớp NP
- Đến nay vẫn chỉ có thể khẳng định là P ⊆ NP mà chưa kết luận được P ≠ NP
hay không.
NP

P

Hình 1. Mối quan hệ giữa lớp P và NP.
3.2. Lớp các bài toán NP-đầy đủ (NPC)
3.2.1. Phép dẫn với thời gian đa thức
Định nghĩa:
Cho Π1 và Π2 là hai bài toán quyết định
Πi(y) là lớp các đầu vào ứng với Yes (với i ∈ {1, 2})
Πi(n) là lớp các đầu vào ứng với No

21



Một cách biến đổi f biến mỗi đầu vào của Π1 thành đầu vào của Π2 được gọi là
phép dẫn thời gian đa thức (ký hiệu là ∝) nếu nó thoả mãn:
- Biến đổi f thực hiện được trong thời gian đa thức bởi máy tính Turing tất định.
- Mỗi dữ kiện thuộc Π1(y) thành dữ kiện thuộc Π2(y)
- Mỗi dữ kiện thuộc Π1(n) thành dữ kiện thuộc Π2(n)
3.2.2. Lớp các bài toán NPC (NP-Complete, NP-đầy đủ)
Định nghĩa:
Một bài toán thuộc lớp NP mà mọi bài toán thuộc lớp NP khác đều dẫn được về
nó với thời gian đa thức được gọi là bài toán NPC.
Một bài toán Π là NPC nếu nó thoả mãn:
- Π ∈ NP
- Với ∀ Π’ ∈ NP thì Π’ dẫn được về Π với thời gian đa thức.
Như vậy để chứng minh một bài toán là NPC ta cần chứng minh hai điều:
- Bài toán đó phải thuộc lớp NP
- Mọi bài toán thuộc lớp NP đều dẫn được về bài toán đó với thời gian đa thức.
3.2.3. Mối quan hệ giữa các lớp bài toán P, NP và NPC
Do bài toán P = NP chưa được giải quyết, nếu có thể quy một bài toán NP-đầy
đủ Π2 về bài toán Π1 thì chưa có thuật toán thời gian đa thức nào cho Π1. Bởi vì nếu có
thuật toán thời gian đa thức cho Π1 thì cũng có thuật toán thời gian đa thức cho Π2.
Tương tự như vậy, do mọi bài toán trong NP đều có thể quy về các bài toán NP-đầy đủ,
nếu có thể giải được một bài toán NP-đầy đủ trong thời gian đa thức thì P = NP.
NP

NP
C

P

Hình 2. Mối quan hệ giữa lớp P, NP và NPC.


22


3.2.4. Một số bài toán lớp NPC
Cho U = {u1, u2, ..., un} là một tập các biến Boolean.
Một phép gán (truth assignment) cho U là một hàm t: U  {T,F}. Nếu t(u) = T
chúng ta nói rằng u là true theo t; nếu t(u) = F chúng ta nói rằng u là false theo t. Nếu u
là một biến trong U, thì u và u là các literal trên U.
Một mệnh đề trên U là một tập các literal trên U, ví dụ {u1,, u 3 ,u8). Một mệnh đề
biểu diễn dạng tuyển của các literal đó, và “thỏa được” bởi một phép gán nếu và chỉ
nếu có ít nhất một literal là True theo phép gán đó.
Ví dụ: Mệnh đề ở trên sẽ thỏa được theo t, ngoại trừ trường hợp t(u 1)=F,
t(u3)=T, t(u8)=F.
Tập các mệnh đề C trên U là “thỏa được” nếu và chỉ nếu tồn tại một phép gán
nào đó cho U mà “thỏa được” với tất cả mệnh đề trong C. Một phép gán như vậy được
gọi là một phép gán thỏa được cho C.
1) Bài toán SAT. Định lý Cook
Bài toán SAT được mô tả như sau:
- Đầu vào: Cho một tập các mệnh đề C trên tập các biến U.
- Câu hỏi: Có tồn tại một phép gán thỏa được cho C không?
Ví dụ: U = {u1, u2} và
C = {c1, c2} với c1 = {u1, u 2 }; c2 = { u 1 , u2}
Câu trả lời là “yes”. Một phép gán thỏa được đó là: t(u 1) = t(u2) = T.
Trong trường hợp, ta thay C bởi C’ = {{u1, u2}, {u1, u 2 }, { u 1 }} thì kết quả sẽ là
“no”, do đó C’ là không thỏa được.
Định lý Cook. SAT là NP-đầy đủ.
Chứng minh:
i) SAT thuộc NP

23



×