Ế Ọ
Giảng viên: ThS. Phan Thế Công
Chương
Ế
ƠI
Giảng viên: THS. PHAN THẾ CÔNG
1
Nội dung chương 6
• Lý thuyết trị chơi
– Một số khái niệm cơ bản
– Một số ứng dụng cơ bản của lý thuyết trị
chơi
3
THS. PHAN THẾ CƠNG
ế
chơi
THS. PHAN THẾ CƠNG
2
Lý thuyết trị chơi
• Lý thuyết trị chơi là một nhánh của toán
học ứng dụng thường được sử dụng trong
phân tích kinh tế.
– Nó sử dụng các mơ hình để nghiên cứu các
tình huống chiến thuật, trong đó những
người tham gia (người chơi) cố gắng để tối
đa kết quả thu được của mình có tính đến
hành động và phản ứng của các đối thủ khác
THS. PHAN THẾ CÔNG
5
Một số khái niệm cơ bản
• Trị chơi: một tình huống mà trong đó
người chơi (người tham gia) đưa ra quyết
định chiến lược có tính đến hành động và
phản ứng của các đối thủ
– Nếu tôi tin rằng các đối thủ cạnh tranh của
tơi là người có lý trí và hành động để tối đa
hóa lợi nhuận của họ thì tơi phải tính đến
hành vi của họ như thế nào khi ra quyết định
tối đa hóa lợi nhuận của mình
THS. PHAN THẾ CƠNG
6
3
Một số khái niệm cơ bản
• Người chơi:
– Những người tham gia và hành động của họ có
tác động đến kết quả của của bạn.
• Chiến lược:
– Nguyên tắc hoặc kế hoạch hành động trong khi
tiến hành trị chơi
• Kết cục:
– Giá trị tương ứng với một kết quả có thể xảy ra.
– Phản ánh lợi ích thu được của mỗi người chơi
THS. PHAN THẾ CÔNG
7
Một số khái niệm cơ bản
• Trị chơi đồng thời:
– Các đối thủ ra quyết định khi khơng biết đến
quyết định của đối phương
• Trị chơi tuần tự:
– Một người chơi ra quyết định trước, người
chơi tiếp theo ra quyết định căn cứ vào
quyết định của người đi trước.
THS. PHAN THẾ CÔNG
8
4
Một số khái niệm cơ bản
• Trị chơi hợp tác:
– là trị chơi mà trong đó những người chơi có
thể đàm phán những cam kết ràng buộc lẫn
nhau cho phép họ cùng lập các kế hoạch
chiến lược chung
• Trị chơi bất hợp tác:
– Các bên tham gia không thể đàm phán và
thực thi có hiệu lực các cam kết ràng buộc
THS. PHAN THẾ CƠNG
9
Các giả định để nghiên cứu
• Những người chơi là những người có lý trí
– Mục đích của những người chơi đều là tối đa hóa
kết cục của bản thân họ
– Những người chơi đều là những người biết tính
tốn hồn hảo
• Hiểu biết chung:
– Mỗi người chơi đều biết nguyên tắc của trò chơi
– Mỗi người chơi đều biết rằng người khác cũng
biết nguyên tắc của trò chơi
– Mỗi người chơi đều biết người chơi khác cũng là
người có lý trí
10
THS. PHAN THẾ CƠNG
5
Trị chơi đồng thời
• Trong khi tơi đưa ra quyết định của mình
thì bạn cũng vậy
– Tơi và bạn đều đưa ra quyết định mà không
biết đến quyết định của người khác
• Cái mà tơi quyết định có ảnh hưởng đến
kết cục của bạn và cái mà bạn quyết định
cũng ảnh hưởng đến kết cục của tơi.
• Cần phải đưa ra quyết định như thế nào?
11
THS. PHAN THẾ CƠNG
Trị chơi đồng thời
• Xác định ma trận lợi ích (ma trận kết cục):
chỉ ra tất cả các kết cục của mỗi người
chơi tương ứng với tất cả các hành động
của mỗi người.
• Xác định hành động có kết quả tốt nhất
cho cả mình và đối thủ
– Tìm ra cân bằng Nash
12
6
Cân bằng Nash
• Cân bằng Nash là một tập hợp các chiến
lược (hoặc hành động) mà mỗi người chơi
có thể làm điều tốt nhất cho mình, khi cho
trước hành động của các đối thủ.
– Mỗi người chơi khơng có động cơ xa rời
chiến lược Nash của mình nên đây là các
chiến lược ổn định
13
Cân bằng Nash
• Nhắc lại:
– Cân bằng Cournot chính là cân bằng Nash:
• Hai hãng ra quyết định sản lượng đồng thời.
• Mỗi hãng sản xuất ở mức sản lượng làm
hãng tối đa hóa lợi nhuận khi biết các hãng
đối thủ sản xuất bao nhiêu.
– Cân bằng Stackelberg cũng là cân bằng Nash:
• Một hãng ra quyết định sản lượng trước,
một hãng hành động theo sau
• Mỗi hãng làm điều tốt nhất cho mình khi cho
trước quyết định của đối thủ
14
7
Thể hiện một trị chơi
ờ
Hãng B
Khơng Q/cáo
Q/c
Ko
Q/cáo
Q/c
Hãng A
Q/cáo
Q/c
ế
Q/cáo
Q/c
50 , 50
20 , 60
60 , 20
30 , 30
ợ
ế
ụ
15
Giải quyết trò chơi
Hãng B
Ko Q/cáo
Q/c
Hãng A
Q/cáo
Q/c
Ko
Q/cáo
Q/c
50 , 50
20 , 60
Q/cáo
Q/c
60 , 20
30 , 30
• Phản ứng tốt nhất của hãng A
– Nếu Hãng B không quảng cáo: Quảng cáo
– Nếu Hãng B quảng cáo: Quảng cáo
Hãng A sẽ quảng cáo bất kể hãng B có quảng
cáo hay khơng
16
8
Chiến lược ưu thế
• Chiến lược ưu thế là một chiến lược
hoặc hành động mang lại kết cục tốt nhất
dù cho các đối thủ có quyết định làm gì đi
chăng nữa
• Nếu một trị chơi có chiến lược ưu thế:
– các đối thủ sẽ lựa chọn chiến lược ưu thế
của mình
17
Chiến lược ưu thế và cân bằng Nash
• Chiến lược ưu thế: Tơi đang làm điều tốt
nhất có thể được cho tơi, bất kể bạn có làm
điều gì đi nữa. Bạn đang làm điều tốt nhất có
thể cho bạn, bất kể tơi làm gì đi nữa.
• Cân bằng Nash: Tơi đang làm điều tốt nhất
có thể được, cho trước cái bạn đang làm.
Bạn đang làm điều tốt nhất có thể được, cho
trước cái tơi đang làm
• Cân bằng chiến lược ưu thế là trường hợp
đặc biệt của cân bằng Nash
18
9
Chiến lược ưu thế
• Ngun tắc:
– Nếu bạn có chiến lược ưu thế, hãy sử dụng
nó
– Dự đốn rằng đối thủ của bạn cũng sử dụng
chiến lược ưu thế của họ nếu như họ cũng
có chiến lược ưu thế
19
Tình thế lưỡng nan của những người tù
Người B
Ngườ
Thú tội
Thú
Không thú tội
thú
Thú tội
Thú
Người A
Ngườ
8 , 8
0 , 20
Không
thú tội
thú
20 , 0
1 , 1
- Chiến lược ưu thế của người A: Thú tội
- Chiến lược ưu thế của người B: Thú tội
- Cân bằng xảy ra khi cả hai người cùng thú tội
20
10
Trị chơi quảng cáo
Hãng B
Lớn
Lớn
Hãng A
Trung
bình
Trung bình
70 , 50
25 , 140
140 , 25
120 , 90
- Cả hai hãng đều có chiến lược ưu thế
- Ở trạng thái cân bằng, kết cục của hai hãng đều bị
giảm đi so với trường hợp hai hãng hợp tác với nhau
21
ỉ
ế đị như
ộ ngườ chơi
ế
ế lượ ưu
ế
Giả định rằng người chơi kia sử dụng
chiến lược ưu thế của họ, khi đó
sẽ chọn chiến lược phù hợp nhất
khi đã biết chiến lược họ sử dụng
11
Khi chỉ một người chơi có chiến lược
ưu thế
Hãng B
Q/cáo
Q/c
Ko Q/cáo
Q/c
Q/cáo
Q/c
Hãng A
10 , 5
15 , 0
Ko
Q/cáo
c
Q/
6 , 8
20 , 2
- Hãng A khơng có chiến lược ưu thế
- Hãng B có chiến lược ưu thế: Quảng cáo
- Hãng A cho rằng B sẽ quảng cáo
khi đó lựa chọn tốt nhất
của hãng A là Quảng cáo
23
Nếu khơng người
chơi nào có chiến
lược ưu thế?
12
Quyết định giá khi khơng có chiến
lược ưu thế
$2
Bar 1 $4
$5
10
12
15
$2
,
,
,
10
14
14
$4
14 ,
12
20 ,
20
15 ,
28
$5
14 ,
15
28 ,
15
25 ,
25
25
Loại trừ liên tiếp những chiến lược
bị lấn át
• Xác định xem có người chơi nào có chiến
lược bị lấn át khơng?
– Chiến lược bị lấn át là một chiến lược ln
có chiến lược khác tốt hơn nó
– Nếu có chiến lược bị lấn át:
• Loại bỏ chiến lược bị lấn át
• Làm giảm kích thước của ma trận lợi ích
• Lặp lại bước trên cho đến khi khơng cịn chiến
lược bị lấn át
• Xác định điểm cân bằng
26
13
Loại trừ liên tiếp những chiến lược
bị lấn át
$2
Bar 1 $4
$5
10
12
15
$2
,
,
,
10
14
14
$4
14 ,
12
20 ,
20
15 ,
28
$5
14 ,
15
28 ,
15
25 ,
25
Cân bằng Nash ($4,$4)
27
Loại trừ liên tiếp những chiến lược
bị lấn át
• Giả sử có hai hãng Alpha và Beta
• Hai hãng có 3 sự lựa chọn:
– Không mở rộng khả năng sản xuất: giữ
nguyên quy mô
– Mở rộng khả năng sản xuất với quy mô nhỏ
– Mở rộng khả năng sản xuất với quy mô lớn
28
14
Loại trừ liên tiếp những chiến lược
bị lấn át
Hãng Beta
Hãng
Alpha
Giữ
nguyên
Nhỏ
Giữ
nguyên
$18,
$18
$20,
$15
Lớn $18, $9
Nhỏ
Lớn
$15,
$20
$16,
$16
$12, $8
$9, $18
$8, $12
$0, $0
29
Loại trừ liên tiếp những chiến lược
bị lấn át
Thứ tự loại trừ chiến lược bị lấn át không tác động đến kết quả
Hãng Beta
Hãng
Alpha
Giữ
nguyên
Nhỏ
Giữ
nguyên
$18,
$18
$20,
$15
Lớn $18, $9
Nhỏ
Lớn
$15,
$20
$16,
$16
$12, $8
$9, $18
$8, $12
$0, $0
30
15
Phân tích phản ứng tốt nhất
• Khơng phải mọi trị chơi đều có chiến lược
ưu thế và chiến lược bị lấn át
• Cần phân tích phản ứng tốt nhất để tìm ra
cân bằng Nash
31
Phân tích phản ứng tốt nhất
• Ứng với mỗi chiến lược của đối thủ, tìm phản ứng tốt
nhất của người chơi
– Ứng với mỗi chiến lược của người chơi 2, tìm phản
ứng tốt nhất của người chơi 1: Trong mỗi cột, tìm kết
cục cao nhất của người chơi 1
– Ứng với mỗi chiến lược của người chơi 1, tìm phản
ứng tốt nhất của người chơi 2: Trong mỗi dịng, tìm
kết cục cao nhất của người chơi 2
– Cân bằng Nash xảy ra tại ô xảy ra kết cục cao nhất
của cả hai người chơi
– Khi phân tích phản ứng tốt nhất khơng tìm ra cân
bằng Nash khơng có cân bằng Nash đối với các
chiến lược thuần túy
32
16
Phân tích phản ứng tốt nhất
• Ví dụ
– Có hai hãng cạnh tranh nhau, mỗi hãng kiếm
được $45.000
– Cả hai hãng có thể đầu tư vào nghiên cứu
triển khai với chi phí là $45.000
– Nghiên cứu triển khai chỉ thành công khi cả
hai hãng đều tham gia
– Nếu nghiên cứu triển khai thành cơng, mỗi
hãng sẽ kiếm được $95.000
33
Phân tích phản ứng tốt nhất
Hãng 2
ầ
ầ
50 , 50 0 , 45
45 , 0 45 , 45
• Có hai cân bằng Nash: cả hai cùng đầu
tư, hoặc cả hai cùng không đầu tư
• Các ơ khác khơng phải là cân bằng Nash:
– Nếu hãng 1 đầu tư và hãng 2 không đầu tư:
cả hai hãng đều có động cơ thay đổi chiến
lược của mình
34
17
Chiến lược maximin
Hãng 2
ầ
ầ
0 , 0 -10, 10
-100,0 20, 10
• Hãng 1 khơng có chiến lược ưu thế
• Hãng 2 có chiến lược ưu thế là Đầu tư
• Nếu hãng 1 cho rằng hãng 2 sẽ thực hiện chiến
lược ưu thế của mình là Đầu tư, hãng 2 cũng sẽ
đầu tư và thu về được lợi ích là 20.
35
Chiến lược maximin
Hãng 2
ầ
ầ
0 , 0 -10, 10
-100,0 20, 10
• Nếu hãng 2 lựa chọn sai, lại khơng đầu tư thì hãng 1 sẽ
mất rất lớn
• Nếu hãng 1 thận trọng và lo ngại hãng 2 khơng có đủ
thơng tin hoặc khơng có lý trí thực hiện chiến lược
maximin
36
18
Chiến lược maximin
• Chiến lược maximin (cực đại hóa tối thiểu)
– Đối với mỗi chiến lược, xác định kết cục thấp
nhất
– Trong các kết cục thấp nhất này, lựa chọn kết
cục có giá trị cao nhất
• Chiến lược maximin là chiến lược thận trọng,
nhưng khơng tối đa hóa lợi nhuận
– Nó có thể là cân bằng Nash, có thể khơng.
37
Chiến lược maximin
Hãng 2
ầ
ầ
0 , 0 -10, 10
-100,0 20, 10
• Nếu hãng 1 khơng đầu tư mất lớn nhất là -10
• Nếu hãng 1 đầu tư mất lớn nhất là -100
• Nếu hãng 1 lựa chọn theo nguyên tắc maximin
chọn không đầu tư
38
19
Trò chơi tuần tự
Hãng 2
ầ
ầ
50 , 50 0 , 45
45 , 0 45 , 45
• Nếu hai hãng quyết định đồng thời có 2 cân
bằng Nash khơng biết chắc các hãng sẽ lựa
chọn như thế nào
• Nếu hãng 1 là hãng quyết định trước:
– Hãng 1 sẽ quyết định đầu tư và hãng 2 cũng
quyết định đầu tư
39
Trò chơi tuần tự
• Hãng A là hãng độc quyền, hãng B muốn
xâm nhập vào thị trường
• Hãng A có hai sự lựa chọn là: khơng phản
ứng gì hoặc đe dọa bằng cách giảm giá
• Hãng B có hai sự lựa chọn là gia nhập thị
trường hoặc không
40
20
Trò chơi tuần tự
Hãng A
Hãng B
ứ
50 ,
ọ
50
-50 , -50
0 , 100
0 , 100
ậ
Sử dụng phương pháp phản ứng tốt nhất, tìm được hai cân
bằng Nash
41
Trị chơi dạng mở rộng
B
Ở
n
Gia
0 , 100
ài
go
nh
ập
d
Đe
ọa
-50 , -50
A
kh
ô
p/ứ ng
ng
50 , 50
42
21
Nhìn xa hơn…
• Hãng B quyết định trước: có gia nhập thị
trường hay không
– Để quyết định hãng B cần phải xem phản
ứng của hãng A như thế nào
• Nếu hãng B gia nhập:
– Hành động tốt nhất của hãng A là khơng
phản ứng
43
…và suy luận ngược
• Xem xét quyết định của hãng B
B
Ở
ng
Gia
0 , 100
i
ồ
nh
ập
A
Khơng
phản ứng
50 , 50
• Quyết định tốt nhất là hãng B gia nhập và
hãng A không phản ứng
44
22
Ngun tắc
• Nhìn xa hơn và suy luận ngược
– Dự đốn rằng đối thủ của bạn có hành động
gì vào ngày mai, để bạn đưa ra được phản
ứng tốt nhất ngày hơm nay
45
Giải quyết trị chơi tuần tự
• Bắt đầu bằng quyết định cuối cùng trong
trị chơi
• Xác định chiến lược mà người chơi sẽ
chọn
• Cắt bớt cây trị chơi:
– Loại bỏ chiến lược bị lấn át
• Lặp lại quá trình trên cho đến khi xác định
được quyết định của người chơi đầu tiên
46
23
Hai hãng quyết định sản lượng
• Hai hãng độc quyền cạnh tranh nhau về sản lượng
• Hàm cầu thị trường là P = 30 – Q
– Trong đó Q = Q1 + Q2
• Giả định cả hai hãng có chi phí biên bằng 0
• Cân bằng Cournot xảy ra khi hai hãng đều quyết định
sản lượng Q1 = Q2 = 10 và lợi nhuận mỗi hãng là 100
• Nếu hai hãng cùng quyết định sản lượng Q1 = Q2 = 7,5
thì lợi nhuận mỗi hãng là 112,5
• Nếu hãng 1 quyết định trước Q1 = 15 và Q2 = 7,5, lợi
nhuận tương ứng là 112,5 và 56,25
47
Hai hãng quyết định sản lượng
Hãng 2
7,5
10
7,5
112,5;
93,75; 125
Hãng
112,5
10 125; 93,75 100; 100
1
15
112,5;
75; 50
56,25
15
56,25;
112,5
50; 75
0; 0
48
24