12/13/2012
KINH TẾ HỌC QUẢN LÝ
(Managerial Economics)
12/13/2012
GVC: PHAN THẾ CÔNG
1
Chương 7
LÝ THUYẾT TRÒ CHƠI VÀ TƯ DUY CHIẾN LƯỢC
12/13/2012
GVC: PHAN THẾ CÔNG
2
1
12/13/2012
John Nash (1928--)
Received his Ph.D. from
Princeton University with a
28-page thesis on his 22-nd
birthday.
Invented the notion of Nash
equilibrium.
Wrote a seminal paper on
bargain theory.
Xem phim “A beautiful
Mind” nói về cuộc đời của
John Nash.
12/13/2012
GVC: PHAN THẾ CÔNG
3
Applications of game theory
Economic theory
Political science
Psychological study
Evolutionary biology (1970..)
Computer science
Yao’s Lemma (1977)
12/13/2012
GVC: PHAN THẾ CÔNG
4
2
12/13/2012
Nobel Prize in Economic Sciences 1994
John C. Harsanyi
John F. Nash Jr.
Reinhard Selten
"for their pioneering analysis of equilibria in the
theory of non-cooperative games"
12/13/2012
GVC: PHAN THẾ CÔNG
5
Nobel Prize in Economic Sciences 2005
Robert J. Aumann
Thomas C. Schelling
"for having enhanced our understanding of
conflict and cooperation through
game-theory analysis"
12/13/2012
GVC: PHAN THẾ CÔNG
6
3
12/13/2012
Lý thuyết trò chơi
Lý thuyết trò chơi là một nhánh của toán học ứng
dụng thường được sử dụng trong phân tích kinh
tế.
Nó sử dụng các mô hình để nghiên cứu các tình
huống chiến thuật, trong đó những người tham gia
(người chơi) cố gắng để tối đa kết quả thu được của
mình có tính đến hành động và phản ứng của các đối
thủ khác
12/13/2012
GVC: PHAN THẾ CÔNG
7
Một số khái niệm cơ bản
Trò chơi: một tình huống mà trong đó người chơi
(người tham gia) đưa ra quyết định chiến lược có
tính đến hành động và phản ứng của các đối thủ
Nếu tôi tin rằng các đối thủ cạnh tranh của tôi là
người có lý trí và hành động để tối đa hóa lợi nhuận
của họ thì tôi phải tính đến hành vi của họ như thế
nào khi ra quyết định tối đa hóa lợi nhuận của mình
12/13/2012
GVC: PHAN THẾ CÔNG
8
4
12/13/2012
Một số khái niệm cơ bản
Người chơi:
Chiến lược:
Những người tham gia và hành động của họ có tác
động đến kết quả của của bạn.
Nguyên tắc hoặc kế hoạch hành động trong khi tiến
hành trò chơi
Kết cục:
Giá trị tương ứng với một kết quả có thể xảy ra.
Phản ánh lợi ích thu được của mỗi người chơi
12/13/2012
GVC: PHAN THẾ CÔNG
9
Một số khái niệm cơ bản
Trò chơi đồng thời:
Các đối thủ ra quyết định khi không biết đến quyết
định của đối phương
Trò chơi tuần tự:
Một người chơi ra quyết định trước, người chơi tiếp
theo ra quyết định căn cứ vào quyết định của người
đi trước.
12/13/2012
GVC: PHAN THẾ CÔNG
10
5
12/13/2012
Một số khái niệm cơ bản
Trò chơi hợp tác:
là trò chơi mà trong đó những người chơi có thể đàm
phán những cam kết ràng buộc lẫn nhau cho phép họ
cùng lập các kế hoạch chiến lược chung
Trò chơi bất hợp tác:
Các bên tham gia không thể đàm phán và thực thi có
hiệu lực các cam kết ràng buộc
12/13/2012
GVC: PHAN THẾ CÔNG
11
Các giả định để nghiên cứu
Những người chơi là những người có lý trí
Mục đích của những người chơi đều là tối đa hóa kết cục
của bản thân họ
Những người chơi đều là những người biết tính toán hoàn
hảo
Hiểu biết chung:
Mỗi người chơi đều biết nguyên tắc của trò chơi
Mỗi người chơi đều biết rằng người khác cũng biết nguyên
tắc của trò chơi
Mỗi người chơi đều biết người chơi khác cũng là người có
lý trí
12/13/2012
GVC: PHAN THẾ CÔNG
12
6
12/13/2012
Trò chơi đồng thời
Trong khi tôi đưa ra quyết định của mình thì bạn
cũng vậy
Tôi và bạn đều đưa ra quyết định mà không biết đến
quyết định của người khác
Cái mà tôi quyết định có ảnh hưởng đến kết cục
của bạn và cái mà bạn quyết định cũng ảnh hưởng
đến kết cục của tôi.
Cần phải đưa ra quyết định như thế nào?
12/13/2012
GVC: PHAN THẾ CÔNG
13
Trò chơi đồng thời
Xác định ma trận lợi ích (ma trận kết cục): chỉ ra
tất cả các kết cục của mỗi người chơi tương ứng
với tất cả các hành động của mỗi người.
Xác định hành động có kết quả tốt nhất cho cả
mình và đối thủ
Tìm ra cân bằng Nash
12/13/2012
GVC: PHAN THẾ CÔNG
14
7
12/13/2012
Cân bằng Nash
Cân bằng Nash là một tập hợp các chiến lược
(hoặc hành động) mà mỗi người chơi có thể làm
điều tốt nhất cho mình, khi cho trước hành động
của các đối thủ.
Mỗi người chơi không có động cơ xa rời chiến lược
Nash của mình nên đây là các chiến lược ổn định
12/13/2012
GVC: PHAN THẾ CÔNG
15
Cân bằng Nash
Nhắc lại:
Cân bằng Cournot chính là cân bằng Nash:
Hai hãng ra quyết định sản lượng đồng thời.
Mỗi hãng sản xuất ở mức sản lượng làm hãng tối đa hóa
lợi nhuận khi biết các hãng đối thủ sản xuất bao nhiêu.
Cân bằng Stackelberg cũng là cân bằng Nash:
12/13/2012
Một hãng ra quyết định sản lượng trước, một hãng hành
động theo sau
Mỗi hãng làm điều tốt nhất cho mình khi cho trước quyết
định của đối thủ
GVC: PHAN THẾ CÔNG
16
8
12/13/2012
Thể hiện một trò chơi
Người chơi
Hãng B
Hãng A
Không Q/cáo
Q/cáo
Ko Q/cáo
50 , 50
20 , 60
Q/cáo
60 , 20
30 , 30
Chiến lược
12/13/2012
Kết cục
GVC: PHAN THẾ CÔNG
17
Giải quyết trò chơi
Hãng B
Hãng A
Ko Q/cáo
Q/cáo
Ko
Q/cáo
50 , 50
20 , 60
Q/cáo
60 , 20
30 , 30
Phản ứng tốt nhất của hãng A
Nếu Hãng B không quảng cáo: Quảng cáo
Nếu Hãng B quảng cáo: Quảng cáo
Hãng A sẽ quảng cáo bất kể hãng B có quảng cáo hay
không
12/13/2012
GVC: PHAN THẾ CÔNG
18
9
12/13/2012
Chiến lược ưu thế
Chiến lược ưu thế là một chiến lược hoặc hành
động mang lại kết cục tốt nhất dù cho các đối thủ
có quyết định làm gì đi chăng nữa
Nếu một trò chơi có chiến lược ưu thế:
các đối thủ sẽ lựa chọn chiến lược ưu thế của mình
12/13/2012
GVC: PHAN THẾ CÔNG
19
Chiến lược ưu thế và cân bằng
Nash
Chiến lược ưu thế: Tôi đang làm điều tốt nhất có thể
được cho tôi, bất kể bạn có làm điều gì đi nữa. Bạn
đang làm điều tốt nhất có thể cho bạn, bất kể tôi làm
gì đi nữa.
Cân bằng Nash: Tôi đang làm điều tốt nhất có thể
được, cho trước cái bạn đang làm. Bạn đang làm điều
tốt nhất có thể được, cho trước cái tôi đang làm
Cân bằng chiến lược ưu thế là trường hợp đặc biệt
của cân bằng Nash
12/13/2012
GVC: PHAN THẾ CÔNG
20
10
12/13/2012
Chiến lược ưu thế
Nguyên tắc:
Nếu bạn có chiến lược ưu thế, hãy sử dụng nó
Dự đoán rằng đối thủ của bạn cũng sử dụng chiến
lược ưu thế của họ nếu như họ cũng có chiến lược ưu
thế
12/13/2012
GVC: PHAN THẾ CÔNG
21
Tình thế lưỡng nan của những người tù
Người B
Thú tội
Thú tội
Người A
Không
thú tội
Không thú tội
8 , 8
0 , 20
20 , 0
1 , 1
- Chiến lược ưu thế của người A: Thú tội
- Chiến lược ưu thế của người B: Thú tội
- Cân bằng xảy ra khi cả hai người cùng thú tội
12/13/2012
GVC: PHAN THẾ CÔNG
22
11
12/13/2012
Trò chơi quảng cáo
Hãng B
Lớn
Lớn
Hãng A
Trung
bình
70 , 50
25 , 140
Trung bình
140 , 25
120 , 90
- Cả hai hãng đều có chiến lược ưu thế
- Ở trạng thái cân bằng, kết cục của hai hãng đều bị giảm
đi so với trường hợp hai hãng hợp tác với nhau
12/13/2012
GVC: PHAN THẾ CÔNG
23
Ra quyết định như thế nào
khi chỉ có một người chơi có chiến
lược ưu thế?
Giả định rằng người chơi kia sử dụng
chiến lược ưu thế của họ, khi đó
sẽ chọn chiến lược phù hợp nhất
khi đã biết chiến lược họ sử dụng
12/13/2012
GVC: PHAN THẾ CÔNG
24
12
12/13/2012
Khi chỉ một người chơi có chiến
lược ưu thế
Hãng B
Q/cáo
Q/cáo
Ko Q/cáo
10 , 5
15 , 0
6 , 8
20 , 2
Hãng A
Ko Q/cáo
- Hãng A không có chiến lược ưu thế
- Hãng B có chiến lược ưu thế: Quảng cáo
- Hãng A cho rằng B sẽ quảng cáo khi đó lựa chọn tốt nhất
của hãng A là Quảng cáo
12/13/2012
GVC: PHAN THẾ CÔNG
25
Nếu không người
chơi nào có chiến
lược ưu thế?
12/13/2012
GVC: PHAN THẾ CÔNG
26
13
12/13/2012
Quyết định giá khi không có
chiến lược ưu thế
$2
Bar 1 $4
$5
12/13/2012
Bar 2
$2
$4
$5
10 , 10 14 , 12 14 , 15
12 , 14 20 , 20 28 , 15
15 , 14 15 , 28 25 , 25
GVC: PHAN THẾ CÔNG
27
Loại trừ liên tiếp những chiến lược bị lấn át
Xác định xem có người chơi nào có chiến lược bị
lấn át không?
Chiến lược bị lấn át là một chiến lược luôn có chiến
lược khác tốt hơn nó
Nếu có chiến lược bị lấn át:
12/13/2012
Loại bỏ chiến lược bị lấn át
Làm giảm kích thước của ma trận lợi ích
Lặp lại bước trên cho đến khi không còn chiến lược bị
lấn át
Xác định điểm cân bằng
GVC: PHAN THẾ CÔNG
28
14
12/13/2012
Loại trừ liên tiếp những chiến lược bị lấn át
$2
Bar 1 $4
$5
Bar 2
$2
$4
$5
10 , 10 14 , 12 14 , 15
12 , 14 20 , 20 28 , 15
15 , 14 15 , 28 25 , 25
Cân bằng Nash ($4,$4)
12/13/2012
GVC: PHAN THẾ CÔNG
29
Loại trừ liên tiếp những chiến lược bị lấn át
Giả sử có hai hãng Alpha và Beta
Hai hãng có 3 sự lựa chọn:
Không mở rộng khả năng sản xuất: giữ nguyên quy
mô
Mở rộng khả năng sản xuất với quy mô nhỏ
Mở rộng khả năng sản xuất với quy mô lớn
12/13/2012
GVC: PHAN THẾ CÔNG
30
15
12/13/2012
Loại trừ liên tiếp những chiến lược bị lấn át
Hãng Beta
Giữ nguyên
Hãng
Alpha
12/13/2012
Nhỏ
Lớn
Giữ nguyên
$18, $18
$15, $20
$9, $18
Nhỏ
$20, $15
$16, $16
$8, $12
Lớn
$18, $9
$12, $8
$0, $0
GVC: PHAN THẾ CÔNG
31
Loại trừ liên tiếp những chiến lược bị lấn át
Thứ tự loại trừ chiến lược bị lấn át không tác động đến kết quả
Hãng Beta
Giữ nguyên
Hãng
Alpha
12/13/2012
Nhỏ
Lớn
Giữ nguyên
$18, $18
$15, $20
$9, $18
Nhỏ
$20, $15
$16, $16
$8, $12
Lớn
$18, $9
$12, $8
$0, $0
GVC: PHAN THẾ CÔNG
32
16
12/13/2012
Phân tích phản ứng tốt nhất
Không phải mọi trò chơi đều có chiến lược ưu thế
và chiến lược bị lấn át
Cần phân tích phản ứng tốt nhất để tìm ra cân
bằng Nash
12/13/2012
GVC: PHAN THẾ CÔNG
33
Phân tích phản ứng tốt nhất
Ứng với mỗi chiến lược của đối thủ, tìm phản ứng tốt
nhất của người chơi
Ứng với mỗi chiến lược của người chơi 2, tìm phản ứng tốt
nhất của người chơi 1: Trong mỗi cột, tìm kết cục cao nhất
của người chơi 1
Ứng với mỗi chiến lược của người chơi 1, tìm phản ứng tốt
nhất của người chơi 2: Trong mỗi dòng, tìm kết cục cao
nhất của người chơi 2
Cân bằng Nash xảy ra tại ô xảy ra kết cục cao nhất của cả
hai người chơi
Khi phân tích phản ứng tốt nhất không tìm ra cân bằng Nash
không có cân bằng Nash đối với các chiến lược thuần túy
12/13/2012
GVC: PHAN THẾ CÔNG
34
17
12/13/2012
Phân tích phản ứng tốt nhất
Ví dụ
Có hai hãng cạnh tranh nhau, mỗi hãng kiếm được
$45.000
Cả hai hãng có thể đầu tư vào nghiên cứu triển khai
với chi phí là $45.000
Nghiên cứu triển khai chỉ thành công khi cả hai hãng
đều tham gia
Nếu nghiên cứu triển khai thành công, mỗi hãng sẽ
kiếm được $95.000
12/13/2012
GVC: PHAN THẾ CÔNG
35
Phân tích phản ứng tốt nhất
Hãng 1
Đầu tư
Không
Hãng 2
Đầu tư
Không
50 , 50 0 , 45
45 , 0 45 , 45
Có hai cân bằng Nash: cả hai cùng đầu tư, hoặc cả
hai cùng không đầu tư
Các ô khác không phải là cân bằng Nash:
Nếu hãng 1 đầu tư và hãng 2 không đầu tư: cả hai
hãng đều có động cơ thay đổi chiến lược của mình
12/13/2012
GVC: PHAN THẾ CÔNG
36
18
12/13/2012
Chiến lược maximin
Người chơi 2
Trái
Phải
1, 0
1, 1
Người chơi 1 Trên
Dưới -1000, 0
12/13/2012
GVC: PHAN THẾ CÔNG
2, 1
37
Chiến lược maximin
Trong trò chơi này, chơi “bên phải” là một chiến lược ưu thế
đối với người chơi 2 vì bằng việc sử dụng chiến lược này,
người chơi 2 sẽ được lợi hơn (thu được 1 chứ không phải là 0),
bất kể người chơi 1 có làm gì đi nữa. Như vậy, người chơi 1 sẽ
dự kiến rằng người chơi 2 sẽ chơi chiến lược “bên phải”.
Trong trường hợp này, người chơi 1 sẽ được lợi hơn bằng việc
chơi “bên dưới” (và thu được 2) chứ không phải là chơi “bên
trên” (và thu được 1). Rõ ràng, kết cục (dưới, phải) là cân bằng
Nash của trò chơi này. Nhưng lưu ý rằng, người chơi 1 phải
biết rằng người chơi 2 hiểu trò chơi này và là người có lí trí.
Nếu người chơi 2 tình cờ bị lỗi và chơi “bên trái” thì sẽ cực kỳ
thiệt hại cho người chơi 1.
12/13/2012
GVC: PHAN THẾ CÔNG
38
19
12/13/2012
Chiến lược maximin
Nếu là người chơi 1, bạn sẽ làm gì? Nếu bạn là người thận trọng, và
lo ngai rằng việc người chơi 2 có thể không được thông tin đầy đủ
hoặc không có lí trí, bạn có thể chọn chơi “bên trên”. Trong trường
hợp đó, bạn chắc chắn sẽ được 1, và bạn không có cơ hội mất 1000.
Chiến lược như thế được gọi là chiến lược cực đại tối thiểu
(maximin) vì nó cực đại hoá cái lợi tổi thiểu có thể thu được. Nếu cả
hai người chơi cùng sử dụng chiến lược cực đại tối thiểu thì kết cục
sẽ là (trên, phải). Chiến lược cực đại tối thiểu là chiến lược thận
trọng, nhưng không phải là chiến lược tối đa hoá lợi nhuận (vì người
chơi 1 thu được lợi nhuận bằng 1 chứ không phải bằng 2).
Lưu ý rằng, nếu người chơi 1 biết chắc rằng người chơi 2 sử dụng
chiến lược cực đại tối thiểu thì người này sẽ thích chơi “bên dưới”
(và thu được 2), thay vì theo chiến lược cực đại tối thiểu là chơi
“bên trên”.
12/13/2012
GVC: PHAN THẾ CÔNG
39
Chiến lược maximin
Nhưng thú tội là một chiến lược ưu thế đối với
mỗi người tù – nó đem lại kết cục tốt hơn cho họ,
không cần biết đến chiên lược của người tù kia.
Các chiến lược ưu thế cũng là các chiến lược cực
đại tối thiểu.
Kết cục trong đó cả hai người tù cùng thú tội vừa
là cân bằng Nash vừa là giải pháp cực đại tối
thiểu. Như vậy, theo cách suy luật logic nhất thì
thú tội là hợp lý nhất đối với mỗi người tù.
12/13/2012
GVC: PHAN THẾ CÔNG
40
20
12/13/2012
Chiến lược maximin
Chiến lược maximin (cực đại hóa tối thiểu)
Đối với mỗi chiến lược, xác định kết cục thấp nhất
Trong các kết cục thấp nhất này, lựa chọn kết cục có
giá trị cao nhất
Chiến lược maximin là chiến lược thận trọng,
nhưng không tối đa hóa lợi nhuận
Nó có thể là cân bằng Nash, có thể không.
12/13/2012
GVC: PHAN THẾ CÔNG
41
Chiến lược maximin
Hãng 1
Không
Đầu tư
Hãng 2
Không
Đầu tư
0 , 0 -10, 10
-100,0 20, 10
Nếu hãng 1 không đầu tư mất lớn nhất là -10
Nếu hãng 1 đầu tư mất lớn nhất là -100
Nếu hãng 1 lựa chọn theo nguyên tắc maximin
chọn không đầu tư
12/13/2012
GVC: PHAN THẾ CÔNG
42
21
12/13/2012
Trò chơi tuần tự
Hãng 1
Đầu tư
Không
Hãng 2
Đầu tư
Không
50 , 50 0 , 45
45 , 0 45 , 45
Nếu hai hãng quyết định đồng thời có 2 cân
bằng Nash không biết chắc các hãng sẽ lựa
chọn như thế nào
Nếu hãng 1 là hãng quyết định trước:
Hãng 1 sẽ quyết định đầu tư và hãng 2 cũng quyết
định đầu tư
12/13/2012
GVC: PHAN THẾ CÔNG
43
Trò chơi tuần tự
Hãng A là hãng độc quyền, hãng B muốn xâm
nhập vào thị trường
Hãng A có hai sự lựa chọn là: không phản ứng gì
hoặc đe dọa bằng cách giảm giá
Hãng B có hai sự lựa chọn là gia nhập thị trường
hoặc không
12/13/2012
GVC: PHAN THẾ CÔNG
44
22
12/13/2012
Trò chơi tuần tự
Hãng B
Hãng A
Không p/ứng
Gia
nhập
Không
50 ,
Đe dọa
50
-50 , -50
0 , 100
0 , 100
Sử dụng phương pháp phản ứng tốt nhất, tìm được hai cân
bằng Nash
12/13/2012
GVC: PHAN THẾ CÔNG
45
Trò chơi dạng mở rộng
0 , 100
B
-50 , -50
A
50 , 50
12/13/2012
GVC: PHAN THẾ CÔNG
46
23
12/13/2012
Nhìn xa hơn…
Hãng B quyết định trước: có gia nhập thị trường
hay không
Để quyết định hãng B cần phải xem phản ứng của
hãng A như thế nào
Nếu hãng B gia nhập:
Hành động tốt nhất của hãng A là không phản ứng
12/13/2012
GVC: PHAN THẾ CÔNG
47
…và suy luận ngược
Xem xét quyết định của hãng B
0 , 100
B
A
Không
phản ứng
50 , 50
Quyết định tốt nhất là hãng B gia nhập và hãng A
không phản ứng
12/13/2012
GVC: PHAN THẾ CÔNG
48
24
12/13/2012
Nguyên tắc
Nhìn xa hơn và suy luận ngược
Dự đoán rằng đối thủ của bạn có hành động gì vào
ngày mai, để bạn đưa ra được phản ứng tốt nhất ngày
hôm nay
12/13/2012
GVC: PHAN THẾ CÔNG
49
Giải quyết trò chơi tuần tự
Bắt đầu bằng quyết định cuối cùng trong trò chơi
Xác định chiến lược mà người chơi sẽ chọn
Cắt bớt cây trò chơi:
Loại bỏ chiến lược bị lấn át
Lặp lại quá trình trên cho đến khi xác định được
quyết định của người chơi đầu tiên
12/13/2012
GVC: PHAN THẾ CÔNG
50
25