1
KINH TẾ HỌC VI MÔ
(Microeconomics)
1
Giảng viên: ThS. Phan Thế Công
Chương 6
LÝ THUYẾT TRÒ CHƠI
2
Giảng viên: THS. PHAN THẾ CÔNG
2
Nội dung chương 6
• Lý thuyết trò chơi
– Một số khái niệm cơ bản
– Một số ứng dụng cơ bản của lý thuyết trò
chơi
3
THS. PHAN THẾ CÔNG
Lý thuyết trò chơi
4
THS. PHAN THẾ CÔNG
3
Lý thuyết trò chơi
• Lý thuyết trò chơi là một nhánh của toán
học ứng dụng thường được sử dụng trong
phân tích kinh tế.
– Nó sử dụng các mô hình để nghiên cứu các
tình huống chiến thuật, trong đó những
người tham gia (người chơi) cố gắng để tối
đa kết quả thu được của mình có tính đến
hành động và phản ứng của các đối thủ khác
5
THS. PHAN THẾ CÔNG
Một số khái niệm cơ bản
• Trò chơi: một tình huống mà trong đó
người chơi (người tham gia) đưa ra quyết
định chiến lược có tính đến hành động và
phản ứng của các đối thủ
– Nếu tôi tin rằng các đối thủ cạnh tranh của
tôi là người có lý trí và hành động để tối đa
hóa lợi nhuận của họ thì tôi phải tính đến
hành vi của họ như thế nào khi ra quyết định
tối đa hóa lợi nhuận của mình
6
THS. PHAN THẾ CÔNG
4
Một số khái niệm cơ bản
• Người chơi:
– Những người tham gia và hành động của họ có
tác động đến kết quả của của bạn.
• Chiến lược:
– Nguyên tắc hoặc kế hoạch hành động trong khi
tiến hành trò chơi
• Kết cục:
– Giá trị tương ứng với một kết quả có thể xảy ra.
– Phản ánh lợi ích thu được của mỗi người chơi
7
THS. PHAN THẾ CÔNG
Một số khái niệm cơ bản
• Trò chơi đồng thời:
– Các đối thủ ra quyết định khi không biết đến
quyết định của đối phương
• Trò chơi tuần tự:
– Một người chơi ra quyết định trước, người
chơi tiếp theo ra quyết định căn cứ vào
quyết định của người đi trước.
8
THS. PHAN THẾ CÔNG
5
Một số khái niệm cơ bản
• Trò chơi hợp tác:
– là trò chơi mà trong đó những người chơi có
thể đàm phán những cam kết ràng buộc lẫn
nhau cho phép họ cùng lập các kế hoạch
chiến lược chung
• Trò chơi bất hợp tác:
– Các bên tham gia không thể đàm phán và
thực thi có hiệu lực các cam kết ràng buộc
9
THS. PHAN THẾ CÔNG
Các giả định để nghiên cứu
• Những người chơi là những người có lý trí
– Mục đích của những người chơi đều là tối đa hóa
kết cục của bản thân họ
– Những người chơi đều là những người biết tính
toán hoàn hảo
• Hiểu biết chung:
– Mỗi người chơi đều biết nguyên tắc của trò chơi
– Mỗi người chơi đều biết rằng người khác cũng
biết nguyên tắc của trò chơi
– Mỗi người chơi đều biết người chơi khác cũng là
người có lý trí
10
THS. PHAN THẾ CÔNG
6
Trò chơi đồng thời
• Trong khi tôi đưa ra quyết định của mình
thì bạn cũng vậy
– Tôi và bạn đều đưa ra quyết định mà không
biết đến quyết định của người khác
• Cái mà tôi quyết định có ảnh hưởng đến
kết cục của bạn và cái mà bạn quyết định
cũng ảnh hưởng đến kết cục của tôi.
• Cần phải đưa ra quyết định như thế nào?
11
THS. PHAN THẾ CÔNG
Trò chơi đồng thời
• Xác định ma trận lợi ích (ma trận kết cục):
chỉ ra tất cả các kết cục của mỗi người
chơi tương ứng với tất cả các hành động
của mỗi người.
• Xác định hành động có kết quả tốt nhất
cho cả mình và đối thủ
– Tìm ra cân bằng Nash
12
7
Cân bằng Nash
• Cân bằng Nash là một tập hợp các chiến
lược (hoặc hành động) mà mỗi người chơi
có thể làm điều tốt nhất cho mình, khi cho
trước hành động của các đối thủ.
– Mỗi người chơi không có động cơ xa rời
chiến lược Nash của mình nên đây là các
chiến lược ổn định
13
Cân bằng Nash
• Nhắc lại:
– Cân bằng Cournot chính là cân bằng Nash:
• Hai hãng ra quyết định sản lượng đồng thời.
• Mỗi hãng sản xuất ở mức sản lượng làm
hãng tối đa hóa lợi nhuận khi biết các hãng
đối thủ sản xuất bao nhiêu.
– Cân bằng Stackelberg cũng là cân bằng Nash:
• Một hãng ra quyết định sản lượng trước,
một hãng hành động theo sau
• Mỗi hãng làm điều tốt nhất cho mình khi cho
trước quyết định của đối thủ
14
8
Thể hiện một trò chơi
15
Người chơi
Chiến lược
Kết cục
Hãng
Hãng
B
B
Không
Không
Q/
Q/
c
c
á
á
o
o
Q/
Q/
c
c
á
á
o
o
Hãng
Hãng
A
A
Ko
Ko
Q/
Q/
c
c
á
á
o
o
50
50
,
,
50
50
20
20
,
,
60
60
Q/
Q/
c
c
á
á
o
o
60
60
,
,
20
20
30
30
,
,
30
30
Giải quyết trò chơi
• Phản ứng tốt nhất của hãng A
– Nếu Hãng B không quảng cáo: Quảng cáo
– Nếu Hãng B quảng cáo: Quảng cáo
Hãng A sẽ quảng cáo bất kể hãng B có quảng
cáo hay không
16
Hãng
Hãng
B
B
Ko
Ko
Q/
Q/
c
c
á
á
o
o
Q/
Q/
c
c
á
á
o
o
Hãng
Hãng
A
A
Ko
Ko
Q/
Q/
c
c
á
á
o
o
50
50
,
,
50
50
20
20
,
,
60
60
Q/
Q/
c
c
á
á
o
o
60
60
,
,
20
20
30
30
,
,
30
30
9
Chiến lược ưu thế
• Chiến lược ưu thế là một chiến lược
hoặc hành động mang lại kết cục tốt nhất
dù cho các đối thủ có quyết định làm gì đi
chăng nữa
• Nếu một trò chơi có chiến lược ưu thế:
– các đối thủ sẽ lựa chọn chiến lược ưu thế
của mình
17
Chiến lược ưu thế và cân bằng Nash
• Chiến lược ưu thế: Tôi đang làm điều tốt
nhất có thể được cho tôi, bất kể bạn có làm
điều gì đi nữa. Bạn đang làm điều tốt nhất có
thể cho bạn, bất kể tôi làm gì đi nữa.
• Cân bằng Nash: Tôi đang làm điều tốt nhất
có thể được, cho trướ c cái bạn đang làm.
Bạn đang làm điều tốt nhất có thể được, cho
trước cái tôi đang làm
• Cân bằng chiến lược ưu thế là trường hợp
đặc biệt của cân bằng Nash
18
10
Chiến lược ưu thế
• Nguyên tắc:
– Nếu bạn có chiến lược ưu thế, hãy sử dụng
nó
– Dự đoán rằng đối thủ của bạn cũng sử dụng
chiến lược ưu thế của họ nếu như họ cũng
có chiến lược ưu thế
19
Tình thế lưỡng nan của những người tù
20
Ngư
Ngư
ờ
ờ
i
i
B
B
Th
Th
ú
ú
t
t
ộ
ộ
i
i
Không
Không
th
th
ú
ú
t
t
ộ
ộ
i
i
Ngư
Ngư
ờ
ờ
i
i
A
A
Th
Th
ú
ú
t
t
ộ
ộ
i
i
8
8
,
,
8
8
0
0
,
,
20
20
Không
Không
th
th
ú
ú
t
t
ộ
ộ
i
i
20
20
,
,
0
0
1
1
,
,
1
1
- Chiến lược ưu thế của người A: Thú tội
- Chiến lược ưu thế của người B: Thú tội
- Cân bằng xảy ra khi cả hai người cùng thú tội
11
Trò chơi quảng cáo
21
Hãng
Hãng
B
B
L
L
ớ
ớ
n
n
Trung
Trung
b
b
ì
ì
nh
nh
Hãng
Hãng
A
A
L
L
ớ
ớ
n
n
70
70
,
,
50
50
140
140
,
,
25
25
Trung
Trung
b
b
ì
ì
nh
nh
25
25
,
,
140
140
120
120
,
,
90
90
- Cả hai hãng đều có chiến lược ưu thế
- Ở trạng thái cân bằng, kết cục của hai hãng đều bị
giảm đi so với trường hợp hai hãng hợp tác với nhau
22
Ra quyết định như thế nào
khi chỉ có một người chơi có chiến lược ưu thế?
Giả định rằng người chơi kia sử dụng
chiến lược ưu thế của họ, khi đó
sẽ chọn chiến lược phù hợp nhất
khi đã biết chiến lược họ sử dụng
12
Khi chỉ một người chơi có chiến lược
ưu thế
23
Hãng
Hãng
B
B
Q/
Q/
c
c
á
á
o
o
Ko
Ko
Q/
Q/
c
c
á
á
o
o
Hãng
Hãng
A
A
Q/
Q/
c
c
á
á
o
o
10
10
,
,
5
5
15
15
,
,
0
0
Ko
Ko
Q/
Q/
c
c
á
á
o
o
6
6
,
,
8
8
20
20
,
,
2
2
- Hãng A không có chiến lược ưu thế
- Hãng B có chiến lược ưu thế: Quảng cáo
- Hãng A cho rằng B sẽ quảng cáo khi đó lựa chọn tốt nhất
của hãng A là Quảng cáo
24
Nếu không người
chơi nào có chiến
lược ưu thế?
13
Quyết định giá khi không có chiến
lược ưu thế
25
$2
$2
$4
$4
$5
$5
Bar 1
Bar 1
$2
$2
10
10
,
,
10
10
14
14
,
,
12
12
14
14
,
,
15
15
$4
$4
12
12
,
,
14
14
20
20
,
,
20
20
28
28
,
,
15
15
$5
$5
15
15
,
,
14
14
15
15
,
,
28
28
25
25
,
,
25
25
Bar 2
Loại trừ liên tiếp những chiến lược
bị lấn át
• Xác định xem có người chơi nào có chiến
lược bị lấn át không?
– Chiến lược bị lấn át là một chiến lược luôn
có chiến lược khác tốt hơn nó
– Nếu có chiến lược bị lấn át:
• Loại bỏ chiến lược bị lấn át
• Làm giảm kích thước của ma trận lợi ích
• Lặp lại bước trên cho đến khi không còn chiến
lược bị lấn át
• Xác định điểm cân bằng
26
14
27
$2
$2
$4
$4
$5
$5
Bar 1
Bar 1
$2
$2
10
10
,
,
10
10
14
14
,
,
12
12
14
14
,
,
15
15
$4
$4
12
12
,
,
14
14
20
20
,
,
20
20
28
28
,
,
15
15
$5
$5
15
15
,
,
14
14
15
15
,
,
28
28
25
25
,
,
25
25
Bar 2
Cân bằng Nash ($4,$4)
Loại trừ liên tiếp những chiến lược
bị lấn át
• Giả sử có hai hãng Alpha và Beta
• Hai hãng có 3 sự lựa chọn:
– Không mở rộng khả năng sản xuất: giữ
nguyên quy mô
– Mở rộng khả năng sản xuất với quy mô nhỏ
– Mở rộng khả năng sản xuất với quy mô lớn
28
Loại trừ liên tiếp những chiến lược
bị lấn át
15
29
Loại trừ liên tiếp những chiến lược
bị lấn át
Hãng Beta
Giữ
nguyên
Nhỏ Lớn
Hãng
Alpha
Giữ
nguyên
$18,
$18
$15,
$20
$9, $18
Nhỏ
$20,
$15
$16,
$16
$8, $12
Lớn
$18, $9 $12, $8 $0, $0
30
Loại trừ liên tiếp những chiến lược
bị lấn át
Thứ tự loại trừ chiến lược bị lấn át không tác động đến kết quả
Hãng Beta
Giữ
nguyên
Nhỏ Lớn
Hãng
Alpha
Giữ
nguyên
$18,
$18
$15,
$20
$9, $18
Nhỏ
$20,
$15
$16,
$16
$8, $12
Lớn
$18, $9 $12, $8 $0, $0
16
Phân tích phản ứng tốt nhất
• Không phải mọi trò chơi đều có chiến lược
ưu thế và chiến lược bị lấn át
• Cần phân tích phản ứng tốt nhất để tìm ra
cân bằng Nash
31
Phân tích phản ứng tốt nhất
• Ứng với mỗi chiến lược của đối thủ, tìm phản ứng tốt
nhất của người chơi
– Ứng với mỗi chiến lược của người chơi 2, tìm phản
ứng tốt nhất của người chơi 1: Trong mỗi cột, tìm kết
cục cao nhất của người chơi 1
– Ứng với mỗi chiến lược của người chơi 1, tìm phản
ứng tốt nhất của người chơi 2: Trong mỗi dòng, tìm
kết cục cao nhất của người chơi 2
– Cân bằng Nash xảy ra tại ô xảy ra kết cục cao nhất
của cả hai người chơi
– Khi phân tích phản ứng tốt nhất không tìm ra cân
bằng Nash không có cân bằng Nash đối với các
chiến lược thuần túy
32
17
Phân tích phản ứng tốt nhất
• Ví dụ
– Có hai hãng cạnh tranh nhau, mỗi hãng kiếm
được $45.000
– Cả hai hãng có thể đầu tư vào nghiên cứu
triển khai với chi phí là $45.000
– Nghiên cứu triển khai chỉ thành công khi cả
hai hãng đều tham gia
– Nếu nghiên cứu triển khai thành công, mỗi
hãng sẽ kiếm được $95.000
33
Phân tích phản ứng tốt nhất
• Có hai cân bằng Nash: cả hai cùng đầu
tư, hoặc cả hai cùng không đầu tư
• Các ô khác không phải là cân bằng Nash:
– Nếu hãng 1 đầu tư và hãng 2 không đầu tư:
cả hai hãng đều có động cơ thay đổi chiến
lược của mình
34
Đầu tư Không
Hãng 1
Đầu tư
50 , 50 0 , 45
Không
45 , 0 45 , 45
Hãng 2
18
Chiến lược maximin
• Hãng 1 không có chiến lược ưu thế
• Hãng 2 có chiến lược ưu thế là Đầu tư
• Nếu hãng 1 cho rằng hãng 2 sẽ thực hiện chiến
lược ưu thế của mình là Đầu tư, hãng 2 cũng sẽ
đầu tư và thu về được lợi ích là 20.
35
Không Đầu tư
Hãng 1
Không
0 , 0 -10, 10
Đầu tư
-100,0 20, 10
Hãng 2
Chiến lược maximin
• Nếu hãng 2 lựa chọn sai, lại không đầu tư thì hãng 1 sẽ
mất rất lớn
• Nếu hãng 1 thận trọng và lo ngại hãng 2 không có đủ
thông tin hoặc không có lý trí thực hiện chiến lược
maximin
36
Không Đầu tư
Hãng 1
Không
0 , 0 -10, 10
Đầu tư
-100,0 20, 10
Hãng 2
19
Chiến lược maximin
• Chiến lược maximin (cực đại hóa tối thiểu)
– Đối với mỗi chiến lược, xác định kết cục thấp
nhất
– Trong các kết cục thấp nhất này, lựa chọn kết
cục có giá trị cao nhất
• Chiến lược maximin là chiến lược thận trọng,
nhưng không tối đa hóa lợi nhuận
– Nó có thể là cân bằng Nash, có thể không.
37
Chiến lược maximin
• Nếu hãng 1 không đầu tư mất lớn nhất là -10
• Nếu hãng 1 đầu tư mất lớn nhất là -100
• Nếu hãng 1 lựa chọn theo nguyên tắc maximin
chọn không đầu tư
38
Không Đầu tư
Hãng 1
Không
0 , 0 -10, 10
Đầu tư
-100,0 20, 10
Hãng 2
20
Trò chơi tuần tự
• Nếu hai hãng quyết định đồng thời có 2 cân
bằng Nash không biết chắc các hãng sẽ lựa
chọn như thế nào
• Nếu hãng 1 là hãng quyết định trước:
– Hãng 1 sẽ quyết định đầu tư và hãng 2 cũng
quyết định đầu tư
39
Đầu tư Không
Hãng 1
Đầu tư
50 , 50 0 , 45
Không
45 , 0 45 , 45
Hãng 2
Trò chơi tuần tự
• Hãng A là hãng độc quyền, hãng B muốn
xâm nhập vào thị trường
• Hãng A có hai sự lựa chọn là: không phản
ứng gì hoặc đe dọa bằng cách giảm giá
• Hãng B có hai sự lựa chọn là gia nhập thị
trường hoặc không
40
21
Trò chơi tuần tự
41
Hãng A
Không p/ứng Đe dọa
Gia
nhập
50 , 50 -50 , -50
Khôn
g
0 , 100 0 , 100
Hãng
B
Sử dụng phương pháp phản ứng tốt nhất, tìm được hai cân
bằng Nash
Trò chơi dạng mở rộng
42
B
Ở
ngo
à
i
Gia
nh
ậ
p
A
Đe
d
ọ
a
không
p/
ứ
ng
0 , 100
-50 , -50
50 , 50
22
Nhìn xa hơn…
• Hãng B quyết định trước: có gia nhập thị
trường hay không
– Để quyết định hãng B cần phải xem phản
ứng của hãng A như thế nào
• Nếu hãng B gia nhập:
– Hành động tốt nhất của hãng A là không
phản ứng
43
…và suy luận ngược
• Xem xét quyết định của hãng B
• Quyết định tốt nhất là hãng B gia nhập và
hãng A không phản ứng
44
B
Ở
ngo
à
i
Gia
nh
ậ
p
A
0 , 100
50 , 50
Không
phản ứng
23
Nguyên tắc
• Nhìn xa hơn và suy luận ngược
– Dự đoán rằng đối thủ của bạn có hành động
gì vào ngày mai, để bạn đưa ra được phản
ứng tốt nhất ngày hôm nay
45
Giải quyết trò chơi tuần tự
• Bắt đầu bằng quyết định cuối cùng trong
trò chơi
• Xác định chiến lược mà người chơi sẽ
chọn
• Cắt bớt cây trò chơi:
– Loại bỏ chiến lược bị lấn át
• Lặp lại quá trình trên cho đến khi xác định
được quyết định của người chơi đầu tiên
46
24
Hai hãng quyết định sản lượng
• Hai hãng độc quyền cạnh tranh nhau về sản lượng
• Hàm cầu thị trường là P = 30 – Q
– Trong đó Q = Q
1
+ Q
2
• Giả định cả hai hãng có chi phí biên bằng 0
• Cân bằng Cournot xảy ra khi hai hãng đều quyết định
sản lượng Q
1
= Q
2
= 10 và lợi nhuận mỗi hãng là 100
• Nếu hai hãng cùng quyết định sản lượng Q
1
= Q
2
= 7,5
thì lợi nhuận mỗi hãng là 112,5
• Nếu hãng 1 quyết định trước Q
1
= 15 và Q
2
= 7,5, lợi
nhuận tương ứng là 112,5 và 56,25
47
Hai hãng quyết định sản lượng
Hãng 2
7,5 10 15
Hãng
1
7,5 112,5;
112,5
93,75; 125 56,25;
112,5
10 125; 93,75 100; 100 50; 75
15 112,5;
56,25
75; 50 0; 0
48