Chương trình Giảng dạy Kinh tế Fulbright Kinh tế học vi mô Nhập môn Lý thuyết trò chơi
Niên khóa 2011 – 2012 Bài giảng Phần 1
Vũ Thành Tự Anh
1
G
G
I
I
Ớ
Ớ
I
I
T
T
H
H
I
I
Ệ
Ệ
U
U
L
L
Ý
Ý
T
T
H
H
U
U
Y
Y
Ế
Ế
T
T
T
T
R
R
Ò
Ò
C
C
H
H
Ơ
Ơ
I
I
V
V
À
À
M
M
Ộ
Ộ
T
T
S
S
Ố
Ố
Ứ
Ứ
N
N
G
G
D
D
Ụ
Ụ
N
N
G
G
T
T
R
R
O
O
N
N
G
G
K
K
I
I
N
N
H
H
T
T
Ế
Ế
H
H
Ọ
Ọ
C
C
V
V
I
I
M
M
Ô
Ô
tra
ba
MC. (oligopoly),
g này
tham gia
1
Lý thuyết trò chơi n
êên
các bên khác.
-
trò
hành
g
(complete information) (incomplete
information). T
2
1
Lý thuyết trò chơi từ lâu đã trở thành một lĩnh vực quan trọng của kinh tế học nói chung. Nó có ứng dụng rộng rãi
trong kinh tế học vi mô, vĩ mô, tài chính, quản trị, ngân hàng, thương mại quốc tế, chính trị, khoa học về chiến tranh,
ngoại giao … nói chung là trong các môi trường có tương tác chiến lược.
2
Nếu mỗi người chơi ở thời điểm phải ra quyết định mà biết toàn toàn lịch sử của trò chơi cho đến thời điểm đó thì
ta nói rằng trò chơi này có thông tin hoàn hảo (perfect information), bằng không chúng ta nói rằng trò chơi có thông
tin không hoàn hảo (imperfect information).
Chương trình Giảng dạy Kinh tế Fulbright Kinh tế học vi mô Nhập môn Lý thuyết trò chơi
Niên khóa 2011 – 2012 Bài giảng Phần 1
Vũ Thành Tự Anh
2
Tĩnh
Động
Thông tin đầy đủ
Nash Equilibrium – NE
Subgame Perfect Nash Equilibrium -SPNS
Thông tin không đầy đủ
Bayesian Nash Equilibrium - BNE
Perfect Bayesian Equilibrium - PBE
Bảng 1:
Phần 1: Trò chơi tĩnh với thông tin đầy đủ
Dạng thức của trò chơi này là đồng thời ra quyết định (hay )
tối ưu hóa kết quả đều biết
Biểu diễn trò chơi dưới dạng chuẩn tắc (normal-form representation)
Ví dụ 1: Thế “lưỡng nan của người tù”
.
vào hai
cho nhau và
tù thay c ph c
kia v th gian 6 thángheo
3
3
Một cách khác, dạng chuẩn tắc của trò chơi tĩnh với thông tin đầy đủ có thể được biểu diễn dưới dạng G = {S
1
, S
2
,
…, S
n
; u
1
, u
2
, …, u
n
} trong đó chúng ta có thể đọc được các thông tin về số người chơi (n), không gian chiến lược
(hay các chiến lược có thể S
i
), và các kết cục (payoff) tương ứng (u
i
).
Chương trình Giảng dạy Kinh tế Fulbright Kinh tế học vi mô Nhập môn Lý thuyết trò chơi
Niên khóa 2011 – 2012 Bài giảng Phần 1
Vũ Thành Tự Anh
3
Giáp
Khai
Không khai
Ất
Khai
-3, -3
0, -6
Không khai
-6, 0
-1, -1
Bảng 2
Chiến lược áp đảo (dominant strategy) và chiến lược bị áp đảo (dominated strategy)
Trong trò
Nếu thằng Ất nhận tội
tháng.
thà mình cũng nhận tội 3
Nếu nó không khai tù à
,
mình cứ thật thà khai báo là hơndù t
ca dù
ca thì
áp đảo (- dominant strategy)
bị áp đảo (-
dominated strategy)
.
Trái
Trái
0, 4
4, 0
5, 3
4, 0
0, 4
5, 3
3, 5
3, 5
6, 6
Bảng 3
Chương trình Giảng dạy Kinh tế Fulbright Kinh tế học vi mô Nhập môn Lý thuyết trò chơi
Niên khóa 2011 – 2012 Bài giảng Phần 1
Vũ Thành Tự Anh
4
Cân bằng Nash: G = {S1, S2n; u1, u2n},
Si và ui không gian chiến lược
i,
*
1, s
*
2
*
n) i
*
i i phản ứng tốt nhất
n-1
*
1, s
*
2
*
i-1, s
*
i+1
*
n) (
s
*
-i). Nói cách khác, ui(s
*
i, s
*
-iui(si, s
*
-i).
s
*
i
*
max ( , )
i i i
ii
u s s
sS
, , t là Giáp
và t
tính ổn định và bền vững trategically stable
tự chế tài (self-enforcement)
mình
Sau khi dự báo được ứng xử
hành . hành
phản ứng tốt nhất (best response). Quay la
, và ph
không phụ thuộc khai
Một số ứng dụng của trò chơi tĩnh với thông tin đầy đủ
Ứng dụng 1: Độc quyền song phương Cournot (1838)
q1 và q2Q = q1 + q2
P(Q) = a Q = a (q1 + q2
cCi(qi) = c.qi , trong
c < a.
là
Bài
i)
Chương trình Giảng dạy Kinh tế Fulbright Kinh tế học vi mô Nhập môn Lý thuyết trò chơi
Niên khóa 2011 – 2012 Bài giảng Phần 1
Vũ Thành Tự Anh
5
ii) : Si = [0, a]
iii)
1(q1, q2) = q1[P(Q) c ] = q1 [ a (q1 + q2) -c]
2(q1, q2) = q2[P(Q) c ] = q2 [ a (q1 + q2) -c]
1*, s2 u1(s1*, s2*) u1(s1, s2*) và
u2(s1*, s2*) u2(s1*, s2)
11
*
211
),(max
Ss
ssu
= (q1, q2) = q1[a (q1 + q2*) -c] => q1 =
2
*
2
qca
3
*
2
*
1
ca
qq
22
2
*
12
),(max
Ss
ssu
= (q1, q2) = q2[a(q1* + q2) -c] => q2 =
2
*
1
qca
và
9
)(
2
*
2
*
1
ca
Hình 1
,
chúng có
4
2 công ty cấu kết với nhau và hoạt động như 1 công ty độc
quyền
4
Điều kiện định giá trong thị trường cạnh tranh hoàn hảo là P
1
= MC
1
hay a – (q
1
+ q
*
2
) = c; v P
2
= MC
2
hay a – (q
*
1
+ q
2
) = c. Giải hệ 2 ẩn 2 phương trình này ta được q
*
1
= q
*
2
= (a-c)/2 và P
1
= P
2
= c.
(a-c)
(a-c)/2
(a-c)/3
q2
q1
(a-c)/3 (a-c) (a-c)/2
Chương trình Giảng dạy Kinh tế Fulbright Kinh tế học vi mô Nhập môn Lý thuyết trò chơi
Niên khóa 2011 – 2012 Bài giảng Phần 1
Vũ Thành Tự Anh
6
[0, ]
[ ( ) ] [ ]
m
Qa
Max Q P Q c Q a Q c
→
12
*
* * * * *
12
2 2 4 3
m
m m m
Q
a c a c a c
Q q q q q
Thay
22
* * * * * *
12
1 2 1 2
( ) ( )
4 8 9
mm
a c a c a c
qq
*
1 và
*
2
4
*
2
*
1
ca
qq
mm
<
3
*
2
*
1
ca
qq
8
)(
2
*
2
*
1
ca
mm
>
9
)(
2
*
2
*
1
ca
liệu thỏa
thuận này có ổn định và có khả năng tự chế tài hay không?
mco giãn |Ed| > 1
%Q/%P > 1, hay %Q > %P 1
d nào thì doanh nghi v khi
a
a/2
Q
a/2 a (a-c)/2
MR
Em
Hình 2
1 = q1[a c (q1 + q2)].
Chương trình Giảng dạy Kinh tế Fulbright Kinh tế học vi mô Nhập môn Lý thuyết trò chơi
Niên khóa 2011 – 2012 Bài giảng Phần 1
Vũ Thành Tự Anh
7
4
*
22
ca
qq
m
=>
]
4
)(3
.[
111
q
ca
q
111
1
1
2
4
)(3
4
)(3
q
ca
qq
ca
dq
d
0
4
1
1
*
11
q
ca
qq
m
1 1. :
*m2 = qm2[a c (q1 + qm2)] =
0
4
)(3
4
1
*
2
1
dq
d
q
ca
ca
m
1
Ứng dụng 2: “Cha chung không ai khóc” (Hardin 1968)
tác và hàng hóa công
- : n
- Khô : {Si i Gmax}
- : Vi = gi.v(g1 + g2 + gi-1 + gi + gi+1 n) cgi = gi.v(gi + g-i) - cgi
i:
**
( ) '( ) 0
i i i i i
v g g g v g g c
(1)
Ý nghĩa kinh tế của đẳng thức (1)
v(gi + g-i) i êm bò.
gi + g-i
bò ùng
v(gi + g-i) - gigi + g-i) = doanh thu biên i
c
ã nội hóa ngoại tácbò
âbò
ì
có:
* * *
1
( ) '( ) 0v G G v G c
n
Chương trình Giảng dạy Kinh tế Fulbright Kinh tế học vi mô Nhập môn Lý thuyết trò chơi
Niên khóa 2011 – 2012 Bài giảng Phần 1
Vũ Thành Tự Anh
8
.v(G) G.c
:
** ** **
( ) '( ) 0v G G v G c
(2)
Ý nghĩa kinh tế:
àó ô
Tuy nhiêà (2) có áà
i óa ábò à không quan tâ bò
áâó
à làng) nêà bò
làâày, ta pháoán
*
> G
**
, tà bò
ò
nói cách khác, tài sản chung khi không được quản lý đúng đắn sẽ bị lợi dụng. â
*
> G
**
ào 0. Tuy nhiê
ààm v(G) là àm parabol có ên
trên.
G
**
G
*
C
v(G) + G.v’(G)/n
v(G) + G.v’(G)
G
Giá trị
Chương trình Giảng dạy Kinh tế Fulbright Kinh tế học vi mô Nhập môn Lý thuyết trò chơi
Niên khóa 2011 – 2012 Bài giảng Phần 1
Vũ Thành Tự Anh
9
Chủ đề nâng cao: Chiến lược hỗn hợp
5
Ví dụ
(pure Nash strategy). Tuy nhiên trong
mixed
strategy).
xác t
đoán trước bay sang
q1-
q)
-1) + (1- q)1 = 1 -
2q; còn sang
- q)(-1) = 2q 1
:
q < 1/2 => Trái
dự đoán
-r)
khi bay sang trái = r(1) + (1- r)(-1) = 2r -1. Còn
-1) + (1- r)(1) = -2r +1.
5
Chủ đề về cân bằng Nash hỗn hợp này liên quan trực tiếp đến việc chứng minh sự tồn tại của cân bằng Nash đối
với các trò chơi tĩnh với thông tin đầy đủ.
Trái
Trái
-1 , 1
1 , -1
1 , -1
-1 , 1
Chương trình Giảng dạy Kinh tế Fulbright Kinh tế học vi mô Nhập môn Lý thuyết trò chơi
Niên khóa 2011 – 2012 Bài giảng Phần 1
Vũ Thành Tự Anh
10
Hình 3
Tài liệu tham khảo
.
q
r
Trái
Phải
1/2
1/2
Trái
Phải