Tải bản đầy đủ (.pdf) (22 trang)

bài giảng tối ưu chương 1 lý thuyết trò chơi - ths. trần thị thùy nương

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (93.83 KB, 22 trang )

Chương 1
LÝ THUYẾT TRỊ CHƠI

10/6/2012

MaMH: C02012

Chương 1: Lý thuyết trị chơi

1


NỘI DUNG
1. Giới thiệu bài tốn tổng qt
2. Trị chơi 2 người tổng không
3. Chiến lược thuần túy, chiến lược hỗn hợp
4. Lý thuyết trò chơi dưới dạng QHTT

10/6/2012

MaMH: C02012

Chương 1: Lý thuyết trò chơi

2


GIỚI THIỆU BÀI TỐN TỔNG QT
1. Giới thiệu
−Trị chơi thường có ít hai người chơi và dựa vào
một quy luật đã được đưa ra trước khi bắt đầu trò


chơi. Cuối trò chơi, mỗi người chơi sẽ nhận được
một thu hoạch (payoff) nào đó, tùy theo thỏa thuận
giữa những người chơi, ví dụ là tiền hay hình thức
phạt nào đấy.
−Trị chơi có thể mang tính ngẫu nhiên (ném xúc
xắc, chia bài…); trò chơi dùng kỹ thuật, kỹ năng
(cờ tướng, cờ ca rơ…)
10/6/2012

MaMH: C02012

Chương 1: Lý thuyết trị chơi

3


GIỚI THIỆU BÀI TỐN TỔNG QT
−Trong trị chơi, người ta thường xét đến 3 yếu tố:
chiến lược, quy luật của trò chơi và thu hoạch.
−Lý thuyết trò chơi nghiên cứu các tình huống
chiến lược trong đó các đối thủ (người chơi) lựa
chọn các hành động khác nhau để cố gắng làm tối
đa các kết quả nhận được.

10/6/2012

MaMH: C02012

Chương 1: Lý thuyết trò chơi


4


GIỚI THIỆU BÀI TỐN TỔNG QT
− Lý thuyết trị chơi được ứng dụng trong nhiều
lĩnh vực:
• Kinh tế và kinh doanh: đấu giá, mặc cả…
• Sinh học: phần lợi của trị chơi là sự thích nghi,
ứng dụng vào việc giải thích sự tiến hóa (và bền
vững) của tỉ lệ giới tính gần 1 : 1.
• Khoa học máy tính và logic
• Chính trị học
• Triết học
10/6/2012

MaMH: C02012

Chương 1: Lý thuyết trò chơi

5


TRÒ CHƠI 2 NGƯỜI TỔNG 0
- Giả sử pi là thu hoạch của người chơi Pi , i = 1,..., k
trong đó có k người tham gia.
k

Khi đó, nếu

∑p

i =1

i

= 0 thì trị chơi này được gọi là trị

chơi k người tổng 0.
- Trường hợp k = 2, ta có trò chơi 2 người tổng 0.

10/6/2012

MaMH: C02012

Chương 1: Lý thuyết trò chơi

6


TRÒ CHƠI 2 NGƯỜI TỔNG 0
Dạng ma trận
- Người chơi thứ nhất (P1) có m chiến lược, được
biểu diễn là các hàng của ma trận.
- Người chơi thứ hai (P2) có n chiến lược, được
biểu diễn là các cột của ma trận.
- Ta biểu diễn ma trận A = (aij) cấp m × n là thu
hoạch của P1. Và của P2 là –A.

10/6/2012

MaMH: C02012


Chương 1: Lý thuyết trò chơi

7


TRÒ CHƠI 2 NGƯỜI TỔNG 0
 a11 ⋯ a1 j



A = (aij ) =  ai 1 ⋯ aij

 ⋮
a
amj
 m1

⋯ a1n 


ain 



amn 

P1 chọn chiến lược i , P2 chọn chiến lược j và
người này không biết sự lựa chọn của người kia.
Khi đó, P1 sẽ nhận aij (P2 trả aij ).

10/6/2012

MaMH: C02012

Chương 1: Lý thuyết trò chơi

8


TRỊ CHƠI 2 NGƯỜI TỔNG 0
• Nếu ma trận A = (aij ) thỏa mãn

min max aij = max min aij = ars
j

i

i

j

thì ma trận này được nói là có điểm n ngựa tại (r,s).
• Khi đó, r được gọi là chiến lược tối ưu của P1 ,
s được gọi là chiến lược tối ưu của P2.
• ars được gọi là giá trị của trị chơi, kí hiệu là v.

10/6/2012

MaMH: C02012


Chương 1: Lý thuyết trò chơi

9


CHIẾN LƯỢC HỖN HỢP
m

• x = { x1,..., xm } với xi ≥ 0, i = 1,..., m, ∑ xi = 1 được gọi
i =1
là chiến lược hỗn hợp.
Với xi là xác suất mà người chơi chọn chiến lược
thứ i.

10/6/2012

MaMH: C02012

Chương 1: Lý thuyết trò chơi

10


CHIẾN LƯỢC THUẦN TÚY
Chiến lược hỗn hợp x = ξ i trong đó ξ i = 1, những
thành phần cịn lại bằng 0 được gọi là một chiến
lược thuần túy.

10/6/2012


MaMH: C02012

Chương 1: Lý thuyết trò chơi

11


HÀM THU HOẠCH
Gọi X = { x } tập chiến lược của P1,
Y = { y } tập chiến lược của P2 .
Khi đó, nếu P1 chọn chiến lược hỗn hợp x, P2
chọn chiến lược hỗn hợp y, thì hàm thu hoạch là:
m

n

A( x, y ) = ∑∑ xi aij y j = xAT y
i =1 j =1

10/6/2012

MaMH: C02012

Chương 1: Lý thuyết trò chơi

12


ĐỊNH LÝ MINIMAX
Đặt

VI := max min A( x, y ) là giá trị thu được của P1,
x∈ X

y ∈Y

VII := minmax A( x, y ) là giá trị thu được của P2.
y ∈Y

x∈ X

Ta có: VI = max min xi aij ; VII = minmax y i aij
x∈ X

y ∈Y

j

i

Định lý Minimax

VI = VII .
10/6/2012

MaMH: C02012

Chương 1: Lý thuyết trò chơi

13



TÍNH TRỘI
• Trong ma trận A, ta nói hàng i trội hàng k nếu

aij ≥ akj , ∀j


 ∃j : aij > aik

• Trong ma trận A, ta nói cột j trội cột l nếu
aij ≤ ail , ∀i


∃i : aij < ail .


→ Áp dụng tính trội để rút ngắn cỡ của ma trận A.
10/6/2012

MaMH: C02012

Chương 1: Lý thuyết trò chơi

14


CÁCH GIẢI TRÒ CHƠI 2 x 2
Xét ma trận thu hoạch (khơng có điểm n ngựa)
a b 
A=


c d 
Đặt r = a + d − b − c
Giá trị của trò chơi:
ad − bc
v=
r
Các chiến lược tối ưu:
d −c a−b
d −b a−c 
X =
,
; Y =  r , r .
r 
 r


10/6/2012

MaMH: C02012

Chương 1: Lý thuyết trò chơi

15


CÁCH GIẢI TRÒ CHƠI 2 x n
Ma trận thu hoạch có 2 hàng, n cột.
- Vẽ các đường thẳng


z j := a1 j x1 + a2 j x2 ( x1 + x2 = 1)
hay z j = a2 j + (a1 j − a2 j )x1 , 0 ≤ x1 ≤ 1.
- Chọn min z j là đường (gấp khúc) nằm dưới cùng
j
trong hình vẽ. Sau đó, lấy max min z j tức là điểm
j
x
(đoạn) cao nhất trên đường (gấp khúc) này.
1

10/6/2012

MaMH: C02012

Chương 1: Lý thuyết trò chơi

16


CÁCH GIẢI TRÒ CHƠI 2 x n (tt)
- Giao điểm cho ta nghiệm của bài toán. Cụ thể,
xác định được x1 , v và x2 .
- Để tìm chiến lược tối ưu cho Y = ( y1, y 2 ,..., y n ), ta
xem điểm cao nhất nhận được là giao của 2 đường
zj nào, chẳng hạn đó là đường j’ và j’’ , thì ta sẽ có
ma trận cấp 2 x 2 là hai cột tương ứng j’ và j’’ của
ma trận A. Giải trò chơi với ma trận này, ta sẽ nhận
được y j ' , y .j ''
- Vậy, ngoại trừ hai giá trị y j ' , y j '' vừa tính được, các
thành phần cịn lại của Y sẽ có giá trị là 0.

10/6/2012

MaMH: C02012

Chương 1: Lý thuyết trò chơi

17


TRỊ CHƠI m x 2
- Ma trận thu hoạch có m hàng, 2 cột.
→ Cách giải tương tự trò chơi 2 x n.
- Đối với trò chơi m x n, ta sẽ dùng tính trội để
đưa về các dạng trị chơi 2 x 2; 2 x n hay m x 2
để giải.

10/6/2012

MaMH: C02012

Chương 1: Lý thuyết trò chơi

18


DẠNG QUY HOẠCH TUYẾN TÍNH
Bài tốn đối với P1 ,
m

max min ∑ xi aij

x∈ X 1≤ j ≤ n

i =1

 x1 + x2 + ... + xm = 1

 xi ≥ 0, i = 1,..., m
Vì hàm mục tiêu chưa phải hàm tuyến tính, nên ta
thêm một biến mới p : p ≤ min xi aij
1≤ j ≤ n

10/6/2012

MaMH: C02012

Chương 1: Lý thuyết trò chơi

19


DẠNG QUY HOẠCH TUYẾN TÍNH
Bài tốn trở thành: Tìm p, xi sao cho
max p
m

 p ≤ ∑ xi ai 1
i =1

⋮


m

 p ≤ ∑ xi ain
i =1

 x1 + x2 + ... + xm = 1

 xi ≥ 0, i = 1,..., m


10/6/2012

MaMH: C02012

(1)

Chương 1: Lý thuyết trò chơi

20


DẠNG QUY HOẠCH TUYẾN TÍNH
Tương tự, bài tốn của P2 : Tìm w, yj sao cho
min w
n

w ≥ ∑ a1 j y j
j =1

⋮


n

w ≥ ∑ a1 j y j
j =1

 y + y + ... + y = 1
n
2
 1
 y j ≥ 0, j = 1,..., n


10/6/2012

MaMH: C02012

(2)

Chương 1: Lý thuyết trò chơi

21


DẠNG QUY HOẠCH TUYẾN TÍNH
(1), (2) có dạng tuyến tính.
→ Dùng phương pháp đơn hình để giải.

10/6/2012


MaMH: C02012

Chương 1: Lý thuyết trò chơi

22



×