Tải bản đầy đủ (.pdf) (99 trang)

Lý thuyết trò chơi và ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (568.42 KB, 99 trang )

ĐẠI HỌC QUỐC GIA TP.HCM
TRƯỜNG ĐẠI HỌC BÁCH KHOA

NGUYỄN THỊ THANH VUI

LÝ THUYẾT TRỊ CHƠI VÀ ỨNG DỤNG

Chun ngành: Tốn ứng dụng
Mã số: 60 46 36

LUẬN VĂN THẠC SĨ

TP. HỒ CHÍ MINH,

tháng 12 năm 2014


ĐẠI HỌC QUỐC GIA TP.HCM
TRƯỜNG ĐẠI HỌC BÁCH KHOA

NGUYỄN THỊ THANH VUI

LÝ THUYẾT TRỊ CHƠI VÀ ỨNG DỤNG

Chun ngành: Tốn ứng dụng
Mã số: 60 46 36

LUẬN VĂN THẠC SĨ

TP. HỒ CHÍ MINH,


tháng 12 năm 2014


CƠNG TRÌNH ĐƯỢC HỒN THÀNH TẠI
TRƯỜNG ĐẠI HỌC BÁCH KHOA- ĐHQG-HCM
Cán bộ hướng dẫn khoa học: TS. Lê Xuân Đại ................................................
.................................................................................................................................
.................................................................................................................................
.................................................................................................................................
Cán bộ chấm nhận xét 1: .................................................................................
.................................................................................................................................
.................................................................................................................................
.................................................................................................................................
.................................................................................................................................
Cán bộ chấm nhận xét 2: ..................................................................................
.................................................................................................................................
.................................................................................................................................
.................................................................................................................................
.................................................................................................................................
Luận văn thạc sĩ được bảo vệ tại trường Đại Học Bách Khoa, ĐHQG Tp. HCM
ngày....tháng...năm.....
Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm:

1. ......................................................................
2. ......................................................................
3. ......................................................................
4. ......................................................................
5. ......................................................................
Xác nhận của Chủ tịch Hội đồng đánh giá LV và trưởng Khoa quản lý chuyên ngành sau
khi luận văn đã được sửa chữa (nếu có).

CHỦ TỊCH HỘI ĐỒNG
TRƯỞNG KHOA


ĐẠI HỌC QUỐC GIA TP.HCM CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM
TRƯỜNG ĐẠI HỌC BÁCH KHOA
Độc lập - Tự do - Hạnh Phúc
————————
————————–

NHIỆM VỤ LUẬN VĂN THẠC SĨ
Họ tên học viên: NGUYỄN THỊ THANH VUI
MSHV: 11240509.
Ngày, tháng, năm sinh: 18-06-1988
Nơi sinh: Quảng Ngãi.
Chuyên ngành: Toán Ứng Dụng.
Mã số: 60 46 36
I. TÊN ĐỀ TÀI: LÝ THUYẾT TRÒ CHƠI VÀ ỨNG DỤNG
NHIỆM VỤ VÀ NỘI DUNG: NGHIÊN CỨU VỀ LÝ THUYẾT
TRỊ CHƠI TĨNH VỚI THƠNG TIN ĐẦY ĐỦ, TRỊ CHƠI TĨNH
VỚI THÔNG TIN KHÔNG ĐẦY ĐỦ VÀ ỨNG DỤNG LÝ THUYẾT
NÀY ĐỂ TÌM ĐIỂM CÂN BẰNG CHO MỘT SỐ BÀI TỐN THỰC
TẾ
II. NGÀY GIAO NHIỆM VỤ:

19/06/2014

III. NGÀY HỒN THÀNH NHIỆM VỤ:

7/12/2014


IV. CÁN BỘ HƯỚNG DẪN: TS. Lê Xuân Đại
Tp. HCM, ngày .....tháng.....năm 20...
CÁN BỘ HƯỚNG DẪN

TS. LÊ XUÂN ĐẠI

CHỦ NHIỆM NGÀNH ĐÀO TẠO

PGS.TS NGUYỄN ĐÌNH HUY

TRƯỞNG KHOA

TS. HUỲNH QUANG LINH


Lời cảm ơn
Đầu tiên, em xin gửi đến Thầy hướng dẫn của em, TS. Lê Xuân Đại, lời
cảm ơn chân thành và sâu sắc đã tận tình hướng dẫn em trong suốt quá
trình học tập, cũng như định hướng con đường tìm hiểu và thực hiện luận văn.

Em xin chân thành cảm ơn Ban Giám Hiệu, Phòng Đào Tạo Sau Đại
Học, đặc biệt là các thầy cô trong bộ môn Toán Ứng Dụng- Khoa Khoa Học
Ứng Dụng trường Đại Học Bách Khoa thành phố Hồ Chí Minh đã tạo mọi
điều kiện thuận lợi cho em trong quá trình học tập, nghiên cứu và thực hiện
luận văn.

Cuối cùng, em xin chân thành cảm ơn đến gia đình, người thân và bạn
bè đã động viên giúp đỡ để luận văn này được hoàn thành.


Nguyễn Thị Thanh Vui


LỜI CAM ĐOAN
Tôi xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện Luận văn này
đã được cảm ơn và các thơng tin trích dẫn trong Luận văn đã được chỉ rõ
nguồn gốc.

Học viên thực hiện luận văn
NGUYỄN THỊ THANH VUI


MỤC LỤC

Danh mục hình vẽ, đồ thị . . . . . . . . . . . . . . . . . . .
Lời mở đầu . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Chương 1. Lý thuyết trò chơi

1

. . . . . . . . . . . . . . . . .

3

1.1 Giới thiệu Lý thuyết trò chơi . . . . . . . . . . . . . . . . .

3

1.2 Biễu diễn trò chơi . . . . . . . . . . . . . . . . . . . . . . .


4

1.3 Các loại trò chơi . . . . . . . . . . . . . . . . . . . . . . . .

8

1.4 Ứng dụng của lý thuyết trò chơi trong một số lĩnh vực

. . 14

1.5 Chiến lược thuần túy, chiến lược hỗn hợp của trò chơi . . . 17
Chương 2. Trị chơi tĩnh với thơng tin đầy đủ, trị chơi
tĩnh với thơng tin khơng đầy đủ . . . . . . . . . . . . . . 21
2.1 Trò chơi tĩnh với thông tin đầy đủ . . . . . . . . . . . . . . 21
2.2 Trò chơi tĩnh với thông tin không đầy đủ . . . . . . . . . . 52
Chương 3. Một số ứng dụng của lý thuyết trò chơi . . . . 58
3.1 Cạnh tranh sản lượng - Mô hình Cournot . . . . . . . . . . 58
3.2 Cạnh tranh giá cả - Mơ hình Bertrant . . . . . . . . . . . . 67
3.3 Đấu giá . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
Kết luận . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
Tài liệu tham khảo . . . . . . . . . . . . . . . . . . . . . . . . . . 86
Phụ lục . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87


DANH MỤC HÌNH VẼ, ĐỒ THỊ

Hình 1.1: Ví dụ về cây trò chơi . . . . . . . . . . . . . . . . . . .
Hình 2.1: Đồ thị hàm số y = 1 − 2q và y = 2q − 1

8


. . . . . . . . 34

Hình 2.2: Đồ thị biễu diễn cân bằng Nash hỗn hợp cho bài toán
"Đồng xu phù hợp"

. . . . . . . . . . . . . . . . . . . . . . . 38

Hình 2.3: Đồ thị hàm số y = 1 − 2q và y = 1 − q . . . . . . . . . 38
Hình 2.4: Đồ thị hàm số y = r và y = 2 − 2r . . . . . . . . . . . 39
Hình 2.5: Đồ thị biểu diễn cân bằng Nash cho bài toán "Cuộc
chiến của hai giới" . . . . . . . . . . . . . . . . . . . . . . . . 39
Hình 3.1: Đồ thị biểu diễn phản ứng tốt nhất của hai công ty
trong mơ hình Cournot

. . . . . . . . . . . . . . . . . . . . . 63

Hình 3.2: Đồ thị thể hiện giao dịch trong đấu giá

. . . . . . . . 84

Hình 3.3: Đồ thị thể hiện giao dịch xảy ra trong cân bằng tuyến
1
tính ⇔ vb ≥ vs +
. . . . . . . . . . . . . . . . . . . . . . . . 84
4


Lời mở đầu
Tốn học là mơn khoa học có lịch sử hình thành từ rất lâu đời, là cơ sở cho

nhiều ngành khoa học. Lý thuyết của toán học được ứng dụng trong nhiều
lĩnh vực khác nhau như kinh tế, vật lý, tin học,.... Lý thuyết trò chơi (game
theory) được xem như là một nhánh của toán học ứng dụng và kinh tế học
ứng dụng nhằm nghiên cứu về các tình huống trong đó các bên tham gia trị
chơi áp dụng những chiến lược ra quyết định nhằm đưa ra quyết định tối ưu
hóa kết quả mình nhận được. Ban đầu lý thuyết trị chơi được phát triển như
một cơng cụ để nghiên cứu hành vi kinh tế học. Ngày nay, lý thuyết này được
sử dụng trong nhiều ngành khoa học khác như Sinh học, Triết học, Chính trị
học ...
Căn cứ vào thông tin và thời gian hành động của những người chơi, người
ta phân chia trò chơi thành bốn loại trị chơi : trị chơi tĩnh với thơng tin đầy
đủ, trị chơi động với thơng tin đầy đủ, trị chơi tĩnh với thơng tin khơng đầy
đủ, trị chơi động với thông tin không đầy đủ. Tương ứng với bốn loại trò
chơi này là bốn khái niệm về điểm cân bằng.
Trong phần luận văn này, chúng ta sẽ tìm hiểu về lý thuyết trị chơi tĩnh
với thơng tin đầy đủ và trị chơi tĩnh với thơng tin khơng đầy đủ. Áp dụng
định lý Nash (1950,1951),... để tìm các điểm cân bằng Nash, Bayesian Nash
... Từ đó, mơ phỏng các ứng dụng của nó vào những mơ hình kinh tế như
mơ hình độc quyền song phương Cournot, Bertrand, đấu giá. Vì đây là bài
tốn tối ưu (tìm giá trị lớn nhất) nên các bài tốn tìm cân bằng Nash, Nash
Bayesian có thể giải được bằng thuật toán của bài toán tối ưu và tìm giá trị
lớn nhất.
Luận văn này được trình bày như sau :
Chương 1: Trình bày những kiến thức cơ bản về lý thuyết trò chơi, phân


loại và ứng dụng của lý thuyết trò chơi trong một số lĩnh vực; dạng chuẩn
tắc, dạng mở rộng, chiến lược thuần túy, chiến lược hỗn hợp của trò chơi.
Chương 2: Giới thiệu trị chơi tĩnh với thơng tin đầy đủ, trị chơi tĩnh với
thơng tin khơng đầy đủ và cách tìm cân bằng Nash .

Chương 3: Giới thiệu về mơ hình độc quyền song phương Cournot,
Bertrand, đấu giá.
Cuối cùng là kết luận và hướng phát triển của luận văn.

2


Chương 1
Lý thuyết trò chơi
1.1 Giới thiệu Lý thuyết trò chơi
Lý thuyết trị chơi bắt đầu hình thành và được áp dụng từ những ngày
đầu của Thế chiến thứ hai, khi các lực lượng hải quân Anh chơi trò mèo vờn
chuột với các tàu chiến ngầm của phát xít Đức và họ muốn nắm rõ hơn về
trị chơi để có thể thắng được nhiều hơn. Họ đã khám phá ra rằng những
bước đi đúng hóa ra lại khơng phải là những gì mà các hoa tiêu và thuyền
trưởng vẫn làm dựa vào trực giác của mình. Bằng cách áp dụng những khái
niệm về sau được biết đến như lý thuyết trị chơi, người Anh đã có thể cải
thiện thành tích bắn trúng đích của mình lên đáng kể. Thắng lợi đối với các
tàu ngầm của địch đã cho phép họ tiếp tục áp dụng lý thuyết trò chơi vào
các hoạt động khác trong chiến tranh. Như vậy, có thể nói lý thuyết trị chơi
đã chứng tỏ được mình trong những tình huống sống cịn trên thực tế trước
khi nó được viết ra giấy và trở thành một lý thuyết mang tính hệ thống [6].
Lý thuyết trị chơi chưa thực sự tồn tại cho đến khi nhà toán học John Von
Neumann và nhà kinh tế Oscar Morgenstern xuất bản cuốn sách Lý thuyết
trò chơi và các hành vi kinh tế vào năm 1944, tác phẩm này chứa đựng lời
giải tối ưu cho những trị chơi tổng bằng khơng với trị chơi hai người. Từ đó
dẫn đến một số lượng lớn các cơng trình kĩ thuật được viết ra trong các lĩnh
3



vực kinh tế, chính trị, chiến lược quân sự, luật, công nghệ thông tin, sinh
học,...Trong mỗi lĩnh vực kể trên, lý thuyết trò chơi lại đưa ra những khám
phá quan trọng.
Vào năm 1950 John Nash đã phát biểu một định nghĩa về một chiến thuật
tối ưu cho trò chơi với nhiều người chơi và nó được biết đến như một cân
bằng Nash. Cân bằng này là đủ tổng quát giúp chúng ta bước ra bên ngoài
những ý tưởng giản đơn về cạnh tranh và hợp tác để đạt đến tầm nhìn của
cạnh tranh hợp tác hay để đưa cạnh tranh và hợp tác lại gần nhau hơn - một
tầm nhìn phù hợp hơn với các cơ hội trong thời đại chúng ta.
Vào năm 1965, Reinhard Selten giới thiệu khái niệm lời giải của các cân
bằng lí tưởng của các trị chơi con, làm chính xác thêm cân bằng Nash. Vào
năm 1967, John Harsanyi phát triển các khái niệm thông tin đầy đủ và trò
chơi Bayesian. Năm 1994 ba nhà tiên phong trong lý thuyết trò chơi là John
Nash, John Harsanyi, Reinhard Selten đã được nhận giải Nobel về kinh tế.
Trong những năm 1970, lý thuyết trò chơi được áp dụng rộng rãi vào sinh
học chủ yếu là do kết quả của các cơng trình của John Maynard Smith và
chiến lược tiến hóa bền vững của ơng.
Thomas Schelling đã tạo ra các mơ hình động và các ví dụ ban đầu của lý
thuyết tiến hóa trị chơi và Robert Aumann đóng góp thêm vào trường cân
bằng (equilibrium school), phát triển một cân bằng làm thô đi những cân
bằng liên quan nhau và phát triển các phân tích chi tiết về giả sử của các
kiến thức chung. Với những thành tựu đó, vào năm 2005 hai nhà lý thuyết
gia trò chơi này đạt giải thưởng Nobel về kinh tế.
1.2 Biễu diễn trò chơi
1.2.1 Biểu diễn trò chơi dạng chuẩn tắc
Dạng chuẩn tắc của một trò chơi gồm ba thành phần

4



1. N là tập hợp những người chơi trong trò chơi
2. Các chiến lược có thể thực hiện mỗi người chơi
3. Mức thưởng phạt nhận được của mỗi người chơi cho mỗi sự kết hợp các
chiến lược có thể được chọn bởi người chơi đó.
Xét một trị chơi N người chơi trong đó các người chơi được đánh số từ 1
đến N và một người chơi tùy ý được gọi là người chơi i. Kí hiệu tập Si là tập
hợp các chiến lược có thể thực hiện của người chơi i (hay cịn gọi là khơng
gian chiến lược của người chơi i) và kí hiệu si là phần tử bất kì của tập hợp
này. Kí hiệu (s1 , ..., sN ) là một sự kết hợp của các chiến lược tương ứng cho
mỗi người chơi, kí hiệu ui : S1 × S2 × ... × SN −→ R là hàm thưởng phạt cho
người chơi i và do đó ui (s1 , ..., sN ) là mức thưởng phạt cho người chơi i nếu
tất cả những người chơi chọn chiến lược (s1 , ..., sN ) tương ứng.
Định nghĩa 1 [2]
Dạng chuẩn tắc của một trò chơi N người chơi được đặc trưng bởi những
không gian chiến lược của từng người chơi S1 , ..., SN và các hàm thưởng phạt
của họ u1 , ..., uN . Kí hiệu của một trò chơi là G = {S1 , ..., SN ; u1 , ..., uN }.
Thông thường 3 thành phần này thường được biểu diễn trong một bảng kết
hợp.
Ví dụ 1 Một trị chơi có 2 đối thủ: một người chọn hàng, một người chọn
cột. Mỗi đối thủ có 2 chiến lược: S1 = { trên, dưới } và S2 = { trái, phải },
mỗi chiến lược được biểu diễn bởi số hiệu hàng hoặc số hiệu cột của nó. Mức
thưởng phạt ghi trong ơ đó. Trong ơ thưởng phạt có 2 giá trị: giá trị đầu là
mức thưởng phạt cho đối thủ chơi theo hàng (đối thủ 1), giá trị thứ hai là
mức thưởng phạt cho đối thủ chơi theo cột (đối thủ 2). Ví dụ: đối thủ 1 chọn

5


di chuyển lên đồng thời đối thủ 2 chọn di chuyển sang trái thì đối thủ 1 sẽ
−3 điểm cịn đối thủ 2 cũng sẽ −3 điểm.

Di chuyển sang trái Di chuyển sang phải
Di chuyển lên

-3,-3

0,-6

Di chuyển xuống

-6,0

-1,-1

Tuy nhiên trò chơi này cũng có biễu diễn theo 2 ma trận riêng lẻ:
Ma trận thưởng phạt cho đối thủ 1:
Di chuyển sang trái Di chuyển sang phải
Di chuyển lên

-3

0

Di chuyển xuông

-6

-1

Ma trận thưởng phạt cho đối thủ 2:
Di chuyển sang trái Di chuyển phải

Di chuyển lên

-3

-6

Di chuyển xuống

0

-1

Chú ý:
Khi một trò chơi được biểu diễn dưới dạng chuẩn tắc thì coi như mỗi đối
thủ hành động một cách đồng thời hay khơng biết về hành động của người
kia.
1.2.2 Biễu diễn trị chơi dạng mở rộng
Dạng mở rộng được biểu diễn dưới dạng "cây trị chơi". Hầu hết các tình
huống trong thực tế có nhiều cách ra quyết định và mỗi cách như vậy lại có
nhiều khả năng để lựa chọn và nếu chỉ dùng trí nhớ thì khó nhớ hết được
các khả năng đó. Chúng ta cần một cơng cụ hiệu quả hơn để suy luận ngược
lại bài toán và giúp chúng ta có cái nhìn tổng qt hơn. Cơng cụ đó chính là
"cây trị chơi". Như vậy "cây trị chơi " chỉ ra thứ tự các quyết định trong
trò chơi.

6


Mỗi đỉnh biểu diễn các khả năng mà người chơi có thể lựa chọn. Người
chơi được chỉ rõ bằng một con số ghi trên đỉnh, các đoạn thẳng đi ra từ đỉnh

đó biểu diễn các khả năng có thể của người chơi đó. Mức thưởng phạt được
ghi rõ tại đáy cạnh. Một cạnh từ một đỉnh u đến một đỉnh v kế tiếp (v được
vẽ dưới u ) chỉ một bước đi có thể có trong trị chơi. Những đỉnh mà khơng
có đỉnh kế tiếp trong cây được gọi là các đỉnh cuối hay các lá.
Như vậy, trong dạng mở rộng này thì các đối thủ có thơng tin về sự lựa
chọn của các đối thủ khác. Và chúng ta sẽ sử dụng thông tin trên cây đồ thị
để dự đoán tất cả các bước đi trong tương lai và suy ngược lại những quyết
định ban đầu.
Ví dụ 2 ( Cây trò chơi )[7]
Giả sử thị trường máy hút bụi ở Cu - Ba đang bị chi phối bởi nhãn hiệu
Fastcleaner (F) và một cơng ty mới có tên Newcleaner (N) đang xem xét có
nên nhảy vào thị trường này hay khơng? Nếu N tham gia thì F có hai lựa
chọn: dàn xếp với N hoặc chiến tranh giá cả. Giả sử F dàn xếp với N khi N
tham gia thị trường thì N sẽ có lợi nhuận 100.000 đơ la, nếu cạnh tranh giá
cả thì N sẽ mất 200.000 đô la. Nếu N không nhảy vào thị trường Cuba thì lợi
nhuận của cơng ty N sẽ là 0.
Chúng ta sẽ mơ tả bài tốn này bằng "cây trị chơi":

7


Hình 1.1: Ví dụ về cây trị chơi

1.3 Các loại trị chơi
Có một số phương pháp phân loại trị chơi. Cách phân chia thứ nhất là
căn cứ vào khả năng hợp đồng và chế tài hợp đồng của những người chơi
thì có thể chia trị chơi làm hai loại: trị chơi hợp tác (cooperative games)
và trò chơi bất hợp tác (non-cooperative games). Cách phân chia thứ hai là
căn cứ vào thơng tin của những người chơi thì các trị chơi được chia thành
trị chơi với thơng tin đầy đủ (complete information)và trị chơi với thơng tin

khơng đầy đủ (incomplete information)hoặc là trị chơi với thơng tin hồn hảo
(perfect information) và thơng tin khơng hồn hảo (imperfect information).
Cách phân chia thứ ba là căn cứ vào thời gian hành động của mỗi người chơi,
các trò chơi được chia làm hai loại là tĩnh và động. Phối hợp cách phân chia
thứ hai và thứ ba ta có 4 dạng thức trị chơi là: trị chơi động với thơng tin
đầy đủ, trị chơi tĩnh với thơng tin đầy đủ, trị chơi tĩnh với thơng tin khơng
đầy đủ, trị chơi tĩnh với thơng tin không đầy đủ. Cách phân chia thứ tư là
dựa trên tổng kết quả (payoff) của những người chơi mà ta phân chia thành
trị chơi hai loại tổng bằng khơng và tổng khác khơng.
1.3.1 Trị chơi tổng bằng khơng và trị chơi tổng khác không
Để hiểu rõ hơn về hai loại trò chơi này, ta chỉ xét các trò chơi hai

8


người tham gia. Với Si , i ∈ {1, 2} là tập các chiến lược của hai người chơi
và hàm thưởng phạt ui : S1 × S2 −→ R. Nếu hai người chơi lần lượt
chọn các chiến lược s1j , s2k thì mức thưởng phạt của hai người lần lượt là
u1 (s1j , s2k ), u2 (s1j , s2k ), j = 1, ..., m; k = 1, ..., n.
Để thuận tiện, ta có thể biểu diễn trị chơi dưới dạng một ma trận m × n:


u (s , s ) ui (s11 , s22 ) · ui (s11 , s2n )

 i 11 21


 ui (s12 , s21 ) ui (s12 , s22 ) · ui (s12 , s2n ) 
 , i = 1, 2
Ai = 



.
.
.
.


.
.
·


ui (s1m , s21 ) ui (s1m , s22 ) · ui (s1m , s2n )
Trong đó
• m là số phương án của người chơi 1
• n là số phương án của người chơi 2
a. Trị chơi tổng bằng khơng
Trị chơi hai đối thủ với tổng bằng khơng là trị chơi mà số thu hoạch của
người này bằng sự tổn thất của người kia hay nói cách khác tổng điểm của
những người chơi trong ván chơi luôn bằng không. Cờ vua là một trị chơi
có tổng bằng khơng bởi khơng thể có trường hợp cả hai bên đều thắng hoặc
đều thua. Nếu một bên thắng thì bên kia nhất định là thua và ngược lại.
Thể thao là những ví dụ điển hình nhất của trị chơi có tổng bằng khơng.
Nhà vơ địch chỉ có thể đạt được vinh quang khi tồn bộ các đối thủ khác
đều thua cuộc. Trong một giải bóng đá tổng số trận thắng luôn bằng tổng số
trận thua cũng là bởi cái tính chất tổng bằng khơng ấy. Đầu tư kinh doanh
chứng khốn cũng là một trị chơi có tổng bằng khơng, bởi vì ở đó, số tiền
thua lỗ của nhà đầu tư này sẽ là tiền lãi của nhà đầu tư khác. Nhà đầu tư
có thể mất trắng hoặc thắng lớn, lợi nhuận mà anh ta thu được có thể đổi

bằng cả gia tài.
9


Như vậy trong trị chơi tổng bằng khơng ta có:
u1 (s1j , s2k ) + u2 (s1j , s2k ) = 0, ∀s1j ∈ S1 , s2k ∈ S2
Hay
u1 (s1j , s2k ) = −u2 (s1j , s2k ), ∀s1j ∈ S1 , s2k ∈ S2
Chú ý A2 = −A1 nên ta giả sử chỉ có một hàm u(s1j , s2k ) và cũng chỉ có
một ma trận A = A1 . Như vậy trò chơi hai người tổng bằng không được biểu
diễn bởi:


a
 11

 a21
A=
 ..
 .

am1

a12 · a1n





a22 · a2n 



... ·


am2 · amn

Với ajk = u(s1j , s2k )
Khi đó ajk là lợi nhuận thu được của người chơi 1 ( tương ứng là tổn thất
của người chơi 2) khi người chơi 1 chọn chiến lược thứ j còn người chơi 2
chọn chiến lược thứ k và A là ma trận lợi nhuận của người chơi 1 (hay ma
trận tổn thất của người chơi 2).
Ví dụ 3 Trong một trận đấu bóng đá mức thưởng phạt được tính bằng diện
tích lấn sân hay diện tích bị lấn sân. Trong đó có hai bên chơi: bên tấn cơng
(P1 ) và bên phòng thủ (P2 ). Mối quan tâm của bên tấn công là lấn càng nhiều
sân càng tốt trong khi đó mục tiêu của bên phịng thủ là giữ cho đối thủ chiếm
càng ít sân càng tốt. Giả sử bên tấn cơng có hai chiến lược lựa chọn:
S1 = { dắt bóng, chuyền bóng }
Bên phịng ngự có ba chiến lược lựa chọn:
S2 = { chống dắt bóng, chống chuyền bóng, phản cơng chớp nhống }
Chúng ta tính tốn phần diện tích sân mà bên tấn cơng đạt được cho mỗi
sự kết hợp chiến lược trong số 6 khả năng có thể xảy ra. Và diện tích lấn sân
10


của bên tấn cơng cũng chính là phần diện tích bị lấn sân của bên phịng thủ.
Ở đây ta có:
u(dắt bóng, chống dắt bóng)= (−3, 3)
u(dắt bóng, chống chuyền bóng)= (9, −9)
u(dắt bóng, phản cơng)=(−5, 5)

u(chuyền bóng, chống dắt bóng)= (4, −4)
u(chuyền bống, chống chuyền bóng)= (−3, 3)
u(chuyền bóng, phản cơng)= (6, −6)
Bên tấn cơng chọn cột, bên phịng thủ chọn dịng thì bài tốn này được
tóm gọn trong bảng sau đây:
Chống dắt bóng Chống chuyền bóng Phản cơng
Dắt bóng

-3,3

9,-9

-5,5

Chuyền bóng

4,-4

-3,3

6,-6

Bên tấn cơng cố gắng bằng mọi cách để diện tích lấn sân là lớn nhất.
Trong khi bên phịng thủ cố gắng giữ sao cho con số đó là nhỏ nhất.
Như vậy ta có các kí hiệu P = {P1 , P2 }, S = S1 × S2 và u : S −→ R. Khi
đó G = (S, u) là trị chơi tổng bằng khơng được viết dưới dạng chuẩn tắc.
b. Trị chơi tổng khác khơng
Nhiều tình huống thực tế khơng phải là trị chơi tổng bằng khơng hay lợi
nhuận của người này không nhất thiết phải là thiệt hại của người kia. Ví dụ
như trong lĩnh vực kinh tế, giá trị của hàng hóa và dịch vụ có thể được tạo

ra, phá hủy, hoặc bị phân bổ trong một số cách khác nhau, và bất kỳ trong
số này sẽ tạo ra một lợi nhuận đồng nhất hoặc mất khả năng sử dụng đến
nhiều bên liên quan. Tất cả các giao dịch kinh tế phải có lợi cho cả hai bên
đến mức mà mỗi bên có thể vượt qua chi phí giao dịch, hoặc giao dịch này
sẽ chỉ đơn giản là không xảy ra.

11


Như vậy trong trị chơi tổng khác khơng ta có:
u1 (s1j , s2k ) + u2 (s1j , s2k ) = c, ∀s1j ∈ S1 , s2k ∈ S2
với c là một hằng số.
Ví dụ 4 (Trị chơi "Chicken")
Xem xét trò chơi 2 người: hai chiếc xe đối mặt với nhau và bắt đầu lái
xe hướng về nhau. Người đầu tiên tách ra bị mất 1 điểm, người còn thắng 1
điểm. Nếu cả hai cùng tách ra thì mỗi người nhận 0 điểm. Nếu cả hai đều
khơng tách ra thì một vụ tai nạn rất xấu xảy ra và cả hai mất 10 điểm. Ta
xem các chiến lược cho người 1 là các dòng trong khi của người 2 là các cột.
Tách ra Không tách ra
Tách ra

0,0

-1,1

Không tách ra

1,-1

-10,-10


Đây là trị chơi có tổng khác khơng.
1.3.2 Trị chơi hợp tác và trò chơi bất hợp tác
Trong trò chơi hợp tác những người chơi có khả năng cùng nhau lập chương
trình (kế hoạch) hành động từ trước đồng thời cũng có khả năng chế tài được
những thỏa thuận này. Còn trong trị chơi bất hợp tác, những người chơi
khơng thể tiến tới một hợp đồng trước khi hành động, hoặc nếu có hợp đồng
thì những hợp đồng này khó có thể được chế tài .
1.3.3 Trò chơi tĩnh và trò chơi động
Trong các trò chơi tĩnh các đối thủ thực hiện các nước đi một cách đồng
thời, hoặc nếu khơng thì đối thủ này không biết về các hành động trước đó
của các đối thủ khác. Và kết quả cuối cùng của mỗi người phụ thuộc vào
phối hơp hành động của tất cả mọi người. Còn trong các trò chơi động người
đi sau có biết một số (nhưng khơng nhất thiết tồn bộ ) thơng tin về các
12


nước đi trước. Một ví dụ cổ điển về loại trị chơi này là bài tốn "Người tù
Dilemma" sẽ được giới thiệu ở chương 2.
Trò chơi động diễn ra trong nhiều giai đoạn, và một số người chơi sẽ phải
hành động ở mỗi một giai đoạn. Trò chơi động khác với trị chơi tĩnh ở một
số khía cạnh quan trọng. Thứ nhất, trong trị chơi động, thơng tin mà mỗi
người chơi có được về những người chơi khác rất quan trọng. Một người có
thơng tin đầy đủ khi người ấy biết kết quả (payoff) của những người chơi
khác. Còn một người có thơng tin hồn hảo nếu như tại mỗi bước phải ra
quyết định (hành động), người ấy biết được tồn bộ lịch sử của các bước đi
trước đó của trò chơi. Thứ hai, khác với các trò chơi tĩnh trong trò chơi động
mức độ đáng tin cậy (credibility ) của những lời hứa hay đe dọa là yếu tố
then chốt [10] .


13


1.4 Ứng dụng trong một số lĩnh vực của lý thuyết trị chơi
1.4.1 Ứng dụng trong lĩnh vực sinh học
Khơng giống như trong kinh tế, phần lợi cho những trò chơi trong sinh
học thường được diễn tả như là tương ứng với sự thích nghi. Thêm vào đó, ít
chú ý hơn về các cân bằng có liên quan đến khái niệm của sự hợp lí, và thiên
về những thứ có thể duy trì được bởi các lực tiến hóa. Cân bằng được biết
đến nhiều nhất trong sinh học là chiến lược tiến hóa bền vững (Evolutionary
Stable Strategy) hay ESS được giới thiệu bởi John Maynard Smith. Trong
sinh học, lý thuyết trò chơi đã được sử dụng để hiểu được nhiều hiện tượng
khác nhau. Nó được sử dụng lần đầu để giải thích sự tiến hóa (và bền vững)
của tỉ lệ giới tính khoảng 1 : 1.
Thêm vào đó, những nhà sinh vật học đã sử dụng lý thuyết trò chơi tiến
hóa và ESS để giải thích sự nổi lên của của liên lạc giữa muôn thú (Maynard
Smith và Harper, 2003). Sự phân tích của các trị chơi tín hiệu và các trò
chơi liên lạc khác đã cung cấp một số trực giác vào sự tiến hóa của việc liên
lạc giữa muôn thú .
Cuối cùng, các nhà sinh vật đã sử dụng trị chơi "diều hâu- bồ câu" để
phân tích những hành vi đánh nhau và tranh giành lãnh thổ.
1.4.2 Ứng dụng trong lĩnh vực kinh tế và kinh doanh
Các nhà kinh tế học đã sử dụng lý thuyết trò chơi để phân tích một diện
rộng các hiện tượng kinh tế trong đó có đấu giá, mặc cả, duopoly, oligopoly,
các tổ chức mạng lưới xã hội và bầu cử. Nghiên cứu này thường tập trung
vào một tập cụ thể các chiến lược được biết với tên các trạng thái cân bằng
trong trò chơi. Nổi tiếng nhất là cân bằng Nash của nhà toán học John Nash
[8].
1.4.3 Ứng dụng trong lĩnh vực chính trị


14


Các nghiên cứu trong khoa học chính trị cũng sử dụng lý thuyết trị chơi.
Một thuyết trị chơi giải thích cho lý thuyết dân chủ hịa bình rằng tính cơng
khai và tranh luận cởi mở trong các nền dân chủ sẽ gởi một thơng điệp rõ
ràng và khả tín về các mục tiêu đến những chế độ khác. Ngược lại, khó mà
biết được những chủ đích của các nhà lãnh đạo phi dân chủ (độc tài) rằng
sẽ có sự nhượng bộ chung hiệu quả nào và các lời hứa hẹn có được tơn trọng
hay khơng. Do đó, sẽ tồn tại sự việc không tin tưởng và không mong muốn
nhằm tạo ra sự nhượng bộ chung nếu ít nhất một trong các thành phần của
sự bàn cãi này là thành phần phi dân chủ [8].
1.4.4 Ứng dụng trong mơ hình chiến tranh
Như phần đầu đã giới thiệu, lý thuyết trò chơi ban đầu hình thành và áp
dụng trong chiến tranh thế giới thứ hai. Ta xét một ví dụ nhỏ về áp dụng
của nó trong chiến tranh thế giới thứ hai.
Ví dụ 5 [3]
Vào tháng 8 năm 1944, sau cuộc xâm lược Normandy, các nước đồng minh
đã phá vỡ vị trí dẫn đầu của Đức tại Avranches, Pháp và chiếm giữ phần lớn
đất nước này. Tướng Von Kluge của Đức, chỉ huy quân đội thứ 9 phải đối
mặt với 2 vấn đề:
(1) : Ở lại và chiến đấu với quân đội các nước đồng minh.
(2) : Rút lui vào những vùng đất chính và xây dựng lại lực lượng.
Đồng thời, tướng Bradley, chỉ huy của các nước đồng minh cũng đối mặt
với các vấn đề tương tự:
(1) : Củng cố lực lượng được tạo bởi những phong trào quân đội tại
Avranches.

15



(2) : Gởi lực lượng đến phía Đơng để chặn đường rút lui của Đức.
(3) : Khơng làm gì cả và chờ đợi
Chúng ta có thể thấy tập những người chơi là P = {Bradley, V onKluge}.
Tập các chiến lược:
S1 = { Củng cố lực lượng, gởi quân đội đến phía đơng, chờ đợi }.
S2 = { Tấn cơng, rút lui }.
Trong thực tế, ở đây khơng có giá trị thưởng phạt. Tuy nhiên, nhật kí của
tướng Bradley chỉ ra các kịch bản mà ông phải tuân thủ. Ở đây có 6 kịch
bản, cụ thể là có sáu khả năng S = S1 × S2 . Dựa vào đó chúng ta xây dựng
ma trận trị chơi :
Tấn cơng Rút lui
Củng cố

(2,-2)

(3,-3)

Di chuyển

(1,-1)

(5,-5)

Chờ đợi

(6,-6)

(4,-4)


16


1.5 Chiến lược thuần túy,chiến lược hỗn hợp của trò chơi
1.5.1 Chiến lược hỗn hợp của người chơi i
Định nghĩa 2 [4]
Cho Si = {si1 , si2 , ..., siri } là tập hợp hữu hạn và ri = |Si |. Một chiến lược
hỗn hợp cho người chơi i là một hàm phân phối xác suất σi rời rạc trên Si .


i

là không gian của tất cả các chiến lược σi của người i hay
ri
ri

= ∆i = {σi = {σi1 , σi2 , ..., σiri } ∈ R : σiq ≥ 0(q = 1, 2, ..., ri ),

σiq = 1}
q=1

i

(1.1)
1.5.2 Chiến lược thuần túy của trò chơi
Định nghĩa 3 [4]
Trong trường hợp σi = ei = (0, ..., 0, 1 , 0, ...0) thì σi được gọi là chiến
i

lược thuần túy thứ i cho người chơi.

Nhận xét:
Cho bất kì σi ∈

thì thành phần thứ q của nó là σiq (thường kí hiệu

i

σi (siq )) là xác suất mà người i áp dụng chiến lược thuần túy siq khi chọn
chiến lược hỗn hợp σi .
Tập hợp các chiến lược hỗn hợp của N người chơi là:
∆=

=

1 ×...

×

N

Sau này chúng ta sẽ kí hiệu :
s−i = (s1 , ..., si−1 , si+1 , ..., sN )
ui (s1 , ..., sN ) = ui (si , s−i )
σ−i = (σ1 , ..., σi−1 , σi+1 , ..., σN )
S−i = S1 × ... × Si−1 × Si+1 × SN
17


×