Tải bản đầy đủ (.pdf) (19 trang)

BÀI TOÁN TRÒ CHƠI MA TRẬN

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (709.22 KB, 19 trang )

ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC BÁCH KHOA

KHOA CÔNG NGHỆ THÔNG TIN
Tel. (84-511) 736 949, Website: itf.ud.edu.vn, E-mail:

BÁO CÁO TIỂU LUẬN MÔN HỌC
HỆ HỖ TRỢ RA QUYẾT ĐỊNH

NGÀNH KHOA HỌC MÁY TÍNH

ĐỀ TÀI :
BÀI TOÁN TRÒ CHƠI MA TRẬN
(Chú ý không làm thay đổi định dạng trang in)

Học viên thực hiện:

LÊ ĐỨC THỌ

Lớp Cao học KHMT Khóa 28 (2013 2015)

ĐÀ NẴNG, 05/2015


MỤC LỤC
LỜI MỞ ĐẦU ..................................................................................................................... 1
I.
TỔNG QUAN........................................................................................................... 2
1. Định nghĩa DSS ....................................................................................................... 2
2. Đặc điểm của hệ hỗ trợ ra quyết định ...................................................................... 2
3. Quy trình ra quyết định ............................................................................................ 3


4. Các loại quyết định .................................................................................................. 4
5. Phân loại DSS .......................................................................................................... 5
6. Kiến trúc DSS .......................................................................................................... 7
II.
BÀI TOÁN TRÒ CHƠI MA TRẬN ....................................................................... 8
1. Giới thiệu về trò chơi ma trận .................................................................................. 8
2. Một số ví dụ ............................................................................................................. 8
III.
MÔ HÌNH BÀI TOÁN .......................................................................................... 10
IV. PHƯƠNG PHÁP CHỌN ....................................................................................... 11
V.
VÍ DỤ MINH HỌA ............................................................................................ 13
1. Tổng quát về bài toán ............................................................................................. 13
2. Giải quyết vấn đề ................................................................................................... 13
VI. KẾT LUẬN ............................................................................................................ 16
VII. TÀI LIỆU THAM KHẢO ..................................................................................... 17


Hệ hỗ trợ ra quyết định

LỜI MỞ ĐẦU
Ngày nay công nghệ thông tin là lĩnh vực không thể thiếu trong các hoạt
động kinh doanh sản xuất, quản lý kinh tế cũng như nghiên cứu khoa học, thống
kê tình hình phát triển xã hội, dân số v.v..Với các chức năng khai thác có tính chất
tác nghiệp, việc khai thác cơ sở dữ liệu phục vụ các yêu cầu trợ giúp quyết định
ngày càng có ý nghĩa to lớn. Việc đưa ra quyết định đối với một vấn đề xuất hiện
trong khắp các lĩnh vực mà đôi khi chúng ta không nhận ra. Từ những việc đơn
giản như chọn một món ăn cho một bữa ăn cho đến những việc lớn như phân bổ
nguồn ngân sách vào các chương trình quốc gia đều là công việc đưa ra quyết
định. Việc ứng dụng các hệ hỗ trợ ra quyết định giúp các doanh nghiệp xây dựng

chiến lược phát triển sản xuất kinh doanh đúng đắn của mình trong tương lai,
mạng lại hiệu quả to lớn cho các doanh nghiệp, tổ chức v.v…
Dữ liệu được lưu trữ và thu thập ngày càng nhiều nhưng người ra quyết
định trong quản lý, kinh doanh lại cần những thông tin dưới dạng “tri thức” rút ra
từ những nguồn dữ liệu đó hơn là chính những dữ liệu đó cho việc ra quyết định.
Quá trình ra quyết định cần có nhiều phương pháp hỗ trợ, trong số những
phương pháp đó thì Dự báo là một phương pháp được sử dụng rất phổ biến và kết
quả dự báo chính là đầu vào rất cần thiết trong quá trình đưa ra ý kiến chủ quan
chung sau khi thảo luận.

Lê Đức Thọ

Trang 1


Hệ hỗ trợ ra quyết định

I. TỔNG QUAN
1. Định nghĩa DSS
Thuật ngữ hệ hỗ trợ ra quyết định (Decision Support Systems – DSS) đã bắt
đầu xuất hiện từ những năm đầu của thập niên 1970, và đã có rất nhiều các nghiên
cứu và các ứng dụng về hệ hỗ trợ ra quyết định. Đã có rất nhiều định nghĩa về hệ
hỗ trợ ra quyết định. Hệ hỗ trợ ra quyết định là những hệ thống nhằm hỗ trợ người
quản lý thực hiện ra các quyết định, nó bao gồm những mục tiêu cần đạt, hàm,
cách thức xử lý, … Quyết định có thể là những công việc có tổ chức hay có thể gọi
đó là những công việc có cấu trúc chặt chẽ, nhưng nó cũng có thể là những công
việc không có cấu trúc, thực hiện không thường xuyên, nhưng lại có tầm quan
trọng. Những hệ thống này cung cấp những cơ chế mở rộng và tiện lợi cho người
quản lý có thể thực hiện tốt hơn công việc của mình, nhưng nó không thể thay thế
người quản lý để tự động đề ra các quyết định.

Hệ hỗ trợ ra quyết định là phương pháp lấy tri thức đúng để cho ra quyết
định hợp lý vào đúng lúc và có mức phí hợp lý. Hay hệ hỗ trợ ra quyết định là hệ
các phương pháp xử lý dữ liệu để lấy tri thức nhằm lựa chọn phương án tối ưu
theo mục tiêu. Đó là sự kết hợp giữa tri thức và việc tạo lập quyết định.
Mục đích của hệ hỗ trợ ra quyết định là hỗ trợ việc ra quyết định của nhà
quản lý theo mục tiêu đã đề ra.

2. Đặc điểm của hệ hỗ trợ ra quyết định
Hệ hỗ trợ ra quyết định là một công cụ giúp đỡ người quản lý thực hiện ra
các quyết định. Ý định của hệ hỗ trợ ra quyết định là hỗ trợ hơn là thay thế, quản
lý việc ra quyết định với quan điểm là nâng cao tính hiệu quả của việc ra quyết
định hơn là năng suất. Có rất nhiều khuôn mẫu (framework) và mô hình được đưa

Lê Đức Thọ

Trang 2


Hệ hỗ trợ ra quyết định

ra trong việc xây dựng hệ hỗ trợ ra quyết định. Các mô hình này có các đặc điểm
chính như sau:
-

Thân thiện với người sử dụng.

-

Linh hoạt trong quá trình thực thi việc hỗ trợ ra quyết định.


-

Hỗ trợ các hoạt động trong quá trình ra quyết định bằng cách sử
dụng các phương thức, dữ liệu, các quy luật và các phương tiện
khác.

Các hệ hỗ trợ ra quyết định được dùng trong các tổ chức để hổ trợ ra quyết
định cho các vấn đề bán cấu trúc và không có cấu trúc. Với những vấn đề bán cấu
trúc và không có cấu trúc thì con người có thể can thiệp vào quá trình ra quyết
định. Con người cso thể can thiệp vào tại những thời điểm sau:
-

Trong quá trình nhận định vấn đề.

-

Trong quá trình xử lý vấn đề.

-

Trong quá trình lựa chọn giải pháp.

3. Quy trình ra quyết định
Các yếu tố quan trọng trong hệ hỗ trợ ra quyết định:
-

Dữ liệu

-


Tri thức

-

Mô hình, phương pháp lựa chọn.

Quy trình ra quyết định chia làm 3 giai đoạn:
-

Thu thập: Lấy yêu cầu, yếu tố môi trường, dữ liệu để xử lý như

thông tin, tri thức … (thu thập, chọn lọc, chuẩn hóa, …).
-

Thiết kế: Xây dựng các phương án thay thế, các ràng buộc, các

phương pháp đo lường. Định hình các phương pháp lựa chọn.

Lê Đức Thọ

Trang 3


Hệ hỗ trợ ra quyết định

-

Lựa chọn: Sử dụng các tri thức, thông tin thu được cùng với các

phương pháp hay mô hình lựa chọn (ở bước thiết kế) để lựa chọn, đánh giá các

phương án. Phương án phù hợp ở đây có thể là chi phí thấp và hiệu quả, cũng có
thể là phù hợp với mục tiêu đặt ra.

4. Các loại quyết định
Quyết định có thể được chia làm nhiều cấp độ từ quyết định có cấu trúc
hoàn toàn đến quyết định hoàn toàn không có cấu trúc.
Có cấu trúc hay không có cấu trúc là dựa vào sự rõ ràng, mập mờ hay tính
phức tạp của các yếu tố trong 3 giai đoạn của ra quyết định.

Phương pháp truyền thống trong tạo lập quyết định

Phương án n
Phương án n-1

Dữ liệu
(Data)

Thiết lập

Mục
đích

Lựa chọn

Quyết
định

Phương án 3
Phương án 2


Ràng
buộc

Phương án 1

Lê Đức Thọ

Trang 4


Hệ hỗ trợ ra quyết định

Tạo lập quyết định có sử dụng tri thức

Tri thức
Phương án n
Phương án n-1
Tri
thức

Thiết lập

Lựa chọn PA

Phương án 3
Xử lý dữ liệu

Mục
đích


Phương án 2

Quyết
định

Ràng
buộc

Phương án 1

Dữ liệu
(Data)

5. Phân loại DSS:
Có 5 xu hướng chính

Model – Driven
Mô hình vận dụng các mô hình toán tài chính, các mô hình dự báo, tối ưu,
và các mô hình giả lập để đưa ra sự hỗ trợ trong các quyết định của một vấn đề.
Dữ liệu thường bị giới hạn về tham số, không gian (Thường theo các mô
hình toán).
Ví dụ: Bài toán vận tải: Mô hình hỗ trợ điều xe cho ít tốn chi phí và đến đủ các nơi

Lê Đức Thọ

Trang 5


Hệ hỗ trợ ra quyết định


Data – Driven
Mô hình sử dụng các dữ liệu có tính chất là chuỗi hay thời gian để tạo lập
các báo cáo giúp cho việc ra quyết định.
Mô hình phải phân tích và rút trích dữ liệu để tạo lập các báo cáo tổng hợp,
các thông tin theo mục đích.
Về sau phát triển với các ứng dụng gọi là Data WareHouse.

Communication – Driven
Mô hình này quan tâm đến việc hỗ trợ ra quyết định dưới dạng nhóm.
Giải quyết những vấn đề của nhóm người ra quyết định.
-

Nhiều phương án khác nhau để lựa chọn

-

Nhiều cách giải quyết khác nhau

-

Phương pháp kết nối giữa nhóm ra quyết định

Document – Driven
Mô hình sử dụng các phương pháp phân tích và rút trích thông tin dạng văn
bản (có thể là văn bản, tài liệu ảnh, phim, âm thanh, …).
Ví dụ: hệ thống hỗ trợ nhà quản trị nhận thức thái độ và thị hiếu tiêu dùng của
khách hàng qua các thông tin phản hồi (có thể là thư từ, hay hình ảnh nét mặt của
khách hàng khi tới công ty, …). Các hệ khai thác dữ liệu trên mạng (web mining).

Knowledge – Driven

Mô hình sử dụng hệ thống quản lý tri thức để áp dụng vào việc ra quyết
định. Thường dùng cho những kiểu dữ liệu ít có hay không có cấu trúc, hay loại
dữ liệu không tường minh. Được áp dụng cho một lĩnh vực chuyên môn hẹp.
Sử dụng các phương pháp trí tuệ nhân tạo. Sự phát triển dần hình thành nên
các hệ thống gọi là hệ chuyên gia (Expert System).
Lê Đức Thọ

Trang 6


Hệ hỗ trợ ra quyết định

6. Kiến trúc DSS
Kiến trúc DSS bao gồm 4 phần căn bản:
-

Hệ thống ngôn ngữ (Language System – LS)

-

Hệ thống thể hiện (Presentation System – PS).

-

Hệ thống tri thức (Knowledge System – KS).

-

Hệ thống xử lý (Problem Processing System – PPS).


Người dùng
Người ra
quyết định
Người
nhận tri
thức
Người
phát triển
Nhà quản
trị


Lê Đức Thọ

Hệ thống ngôn ngữ
- Tiếp nhận dữ
liệu thông tin,
và cả tri thức
- Nơi giao tiếp
ngừi dùng

- Xuất thông tin,
tri thức ra cho
người dùng.
- Ra quyết định
dạng hỗ trợ

Hệ thống xử lý
- Lấy dữ liệu
- Lấy tri thức

- Chọn lọc
- Chuẩn hóa

Hệ thống tri thức
- Mô tả tri
thức
- Xử lý tri
thức

- Đo lường
- So sánh
- Điều khiển
- Suy diễn

- Suy diễn
trên tri
thức

Trang 7


Hệ hỗ trợ ra quyết định

II.

BÀI TOÁN TRÒ CHƠI MA TRẬN

1. Giới thiệu về trò chơi ma trận
Đối tượng nghiên cứu trong lý thuyết trò chơi là các mô hình và các
phương pháp ra quyết định trong trường hợp nhiều người tham gia (nhiều người

chơi). Mục tiêu của các người chơi khác nhau thường trái ngược nhau. Ở đây,
chúng ta chỉ xem xét các trò chơi có hai người và quyền lợi của hai người chơi là
trái ngược nhau.
Trò chơi bao gồm một dãy các bước (phương án). Các bước là ngẫu nhiên
(Trong trò chơi cờ tất cả các bước mang tính cá nhân). Kết quả của các bước được
đánh giá bởi hàm chiến thắng cho mỗi người chơi. Nếu hàm chiến thắng là 0 thì
trò chơi được gọi là chơi tổng bằng không.
-

Chiến lược là một tập hợp các quy tắc, được xác định bởi người

chơi, có nghĩa là sự lựa chọn bước đi.
-

Chiến lược tối ưu được gọi là một chiến lược mà chiến lược đạt

được giá trị trung bình mong đợi của người chơi là lớn nhất (tốt nhất) khi trò chơi
lặp đi lặp lại.
-

Trò chơi ma trận: đó là trò chơi mà có hai người tham gia vào trò

chơi, ban đầu hàm chiến thắng của mỗi người chơi bằng 0. Người chơi thứ nhất có
hữu hạn số chiến lược: {1, …, m} và người chơi thứ 2 có: {1, …, n} và với (ij )
đưa ra số tiền thưởng aij của người chơi thứ 2 (j) trả cho người chơi thứ nhất (i).
Ma trận (aij) cho kết quả chiến thắng của người chơi thứ nhất và kết quả thất bại
của người chơi thứ hai, aij  0!

2. Một số ví dụ
Trò chơi đột kích

Trò chơi có 2 người chơi:

Lê Đức Thọ

Trang 8


Hệ hỗ trợ ra quyết định

Người chơi thứ nhất chọn hệ thống phòng không. Người chơi thứ hai chọn
máy bay. Phần tử aij là xác suất bắn cháy máy bay j bởi hệ thống phòng không i.
Mục đích của người người chơi thứ hai là vượt qua hệ thống phòng không

Các pháo

Các máy bay
0,5

0,6

0,8

0,9

0,7

0,8

0,7


0,5

0,6

Phương án chọn bước đi là một bộ (2,2) thì có ý nghĩa theo hai hướng:
Nếu chọn máy bay 2, thì pháo cao xạ 2 sẽ tốt nhất cho người chơi thứ nhất;
Nếu chọn pháo cao xạ 2 thì máy bay 2 sẽ tốt nhất cho người chơi thứ hai.
Trong ma trận có điểm tựa “saddle-node” (điểm ổn định).
Saddle-node của (aij) là (ai0j0) sao cho:
aij0  ai0j0  ai0j, (ij )
Trò chơi tung đồng xu
Người chơi chọn một trong hai phương án {sấp, ngửa} trước lúc tung đồng
xu. Nếu lần tung trùng với phương án chọn thì người chơi thứ nhất chiến thắng,
còn không thì chiến thắng thuộc người chơi thứ hai.
II- người chơi

Sấp

Ngửa

Sấp

1

-1

Ngửa

-1


1

I- Người chơi

Lê Đức Thọ

Trang 9


Hệ hỗ trợ ra quyết định

Một số trò chơi khác như :
Trò chơi tài xỉu từ 3 quân xúc sắt, Trò chơi Oẳn tù xì hay trò chơi tìm
đường đi trong mê cung cho hai người chơi v.v…

III. MÔ HÌNH BÀI TOÁN


Lý thuyết trò chơi: nghiên cứu việc chọn quyết định trong trường hợp đối
kháng.



Người chơi
– Người chọn quyết định;
– Đối thủ của người chọn quyết định



Chiến lược: Tập hợp các hành động để lựa chọn quyết định ứng với mỗi

người chơi



Xét trò chơi gồm 2 người:
– A : i, i:=1,…,n, tập chiến lược
– B : j, j:=1,…,m, tập chiến lược
– Giải thưởng ứng với chiến lược (i,j) của hai người chơi được ký hiệu

là aij (Phần thưởng là cái được của người này và cái mất của người kia).


Lời giải
– Tìm chiến lược tốt nhất cho mỗi người chơi

1

2



n

1

a11

a12




a1n

2

a21

a22



a2n











m

am1

am2




amn

A

Lê Đức Thọ

B

Đối với A:
Nếu A đi nước 1 thì A sẽ:
- Thắng a11 điểm nếu B đi nước 1
- Thắng a12 điểm nếu B đi nước 2
-…
Đối với B:
Nếu B đi nước 2 thì B sẽ:
- Thua a11 điểm nếu A đi nước 1
- Thua a21 điểm nếu A đi nước 2
-…
- Thua am1 nếu A đi nước m
Trang 10


Hệ hỗ trợ ra quyết định

- Nghiệm tối ưu của trò chơi là bộ chiến lược (i*,j*)
- Giải trò chơi có nghĩa là đi tìm nghiệm tối ưu.

IV. PHƯƠNG PHÁP CHỌN
Nguyên lý Minimax

Minimax (còn gọi là minmax) là một phương pháp trong lý thuyết quyết
định có mục đích là tối thiểu hóa (minimize) tổn thất vốn được dự tính có thể là
"tối đa" (maximize). Có thể hiểu ngược lại là, nó nhằm tối đa hóa lợi ích vốn được
dự tính là tối thiểu (maximin). Nó bắt nguồn từ trò chơi có tổng bằng không. Nó
cũng được mở rộng cho nhiều trò chơi phức tạp hơn và giúp đưa ra các quyết định
chung khi có sự hiện diện của sự không chắc chắn.
Một phiên bản của giải thuật áp dụng cho các trò chơi như tic – tac - toe,
khi mà mỗi người chơi có thể thắng, thua, hoặc hòa. Nếu người chơi A có
thể thắng trong 1 nước đi, thì "nước đi tốt nhất" chính là nước đi để dẫn đến kết
quả thắng đó. Nếu người B biết rằng có một nước đi mà dẫn đến tình huống người
A có thể thắng ngay ở nước đi tiếp theo, trong khi nước đi khác thì sẽ dẫn đến tình
huống mà người chơi A chỉ có thể, tốt nhất, là hòa thì nước đi tốt nhất của người B
chính là nước đi sau.
Ta sẽ nắm rõ, thế nào là một nước đi "tốt nhất". Giải thuật Minimax giúp
tìm ra nước đi tốt nhất, bằng cách đi ngược từ cuối trò chơi trở về đầu. Tại mỗi
bước, nó sẽ ước định rằng người A đang cố gắng tối đa hóa cơ hội thắng của A
khi đến phiên anh ta, còn ở nước đi kế tiếp thì người chơi B cố gắng để tổi thiểu
hóa cơ hội thắng của người A (nghĩa là tối đa hóa cơ hội thắng của B).
Giả thiết đối thủ toàn năng và đoán được tất cả các phương án (bước đi).
Người chơi thứ nhất giả thiết rằng người chơi thứ hai biết hết tất cả và đối với
phương án i (bước đi i) của người chơi thứ nhất chọn j(i): aij(i)  aij, j = 1, …, n

Lê Đức Thọ

Trang 11


Hệ hỗ trợ ra quyết định

Ký hiệu  i = aij(i) = min aij, i=1, ..., n. Người chơi thứ nhất chọn i0 sao cho

 = max  i = max min aij = ai0. Đại lượng  gọi là giá trị nhỏ nhất của trò chơi

trong các chiến lược.
Người chơi thứ hai từ việc cân nhắc một cách thận trọng và cho rằng trước
tiên j chọn i(j) sao cho aij(j)  aij  i, có nghĩa  j = max aij và chọn j sao cho  j
nhỏ nhất.
 = min max aij =  j0

Đại lượng  gọi là giá trị lớn nhất của trò chơi trong tập chiến lược.
Ví dụ : Trong ví dụ sau đây của một trò chơi tổng bằng 0, khi A và B đi các bước
cùng một lúc, minh họa thuật toán minimax. Nếu như mỗi người chơi có 3 chọn
lựa và ma trận lợi cho A là:
B chọn B1

B chọn B2

B chọn B3

A chọn A1

+3

-2

+2

A chọn A2

-1


0

+4

A chọn A3

-4

-3

+1

và B có ma trận lợi như nhau nhưng ngược dấu (i.e. nếu các lựa chọn là A1
và B1 thì B trả 3 cho A) sau đó lựa chọn minimax đơn giản cho A là A2 bởi vì kết
quả xấu nhất là sau khi phải trả 1, trong khi lựa chọn minimax đơn giản cho B là
B2 bởi vì kết quả xấu nhất là sau đó không phải trả gì cả. Tuy vậy, lời giải này là
không ổn định, bởi vì nếu B tin rằng A sẽ chọn A2 thì B sẽ chọn B1 để thắng 1;
sau đó nếu A tin rằng B sẽ chọn B1 thì A sẽ chọn A1 để thắng 3; và sau đó B sẽ
chọn B2; và cuối cùng cả hai người chơi sẽ nhận ra sự khó khăn của việc chọn lựa.
Do đó một chiến lược ổn định hơn là cần thiết.
Một số chọn lựa bị thống trị bởi những người khác và có thể bị loại bỏ: A
sẽ không chọn A3 bởi vì hoặc A1 hay A2 sẽ sinh ra một kết quả tốt hơn, bất kể là

Lê Đức Thọ

Trang 12


Hệ hỗ trợ ra quyết định


B chọn gì; B sẽ không chọn B3 bởi vì B2 sẽ sinh ra kết quả tốt hơn, bất kể là A
chọn cái gì.
A có thể tránh việc phải trả số lượng dự định (expected payment) hơn 1/3
bằng cách chọn A1 với xác suất 1/6 và A2 với xác suất 5/6, bất kể là B đã chọn gì.
B có thể tính chắc phần lợi dự định (expected gain) ít nhất 1/3 bằng cách sử dụng
một chiến thuật ngẫu nhiên của việc chọn B1 với xác suất 1/3 và B2 với xác suất
2/3, bất kể là A chọn gì. Những chiến lược minimax hỗn hợp bây giờ là ổn định và
không thể nào cải tiến nữa.
John von Neumann chứng minh định lý Minimax vào năm 1928, phát biểu rằng
những chiến lược như vậy luôn luôn tồn tại trong những trò chơi tổng bằng không
cho hai người chơi và có thể tìm ra bằng cách giải một tập hợp các phương trình
trong cùng một lúc.

VÍ DỤ MINH HỌA

V.

1. Tổng quát về bài toán
Ký hiệu điểm thưởng của người chơi thứ I khi người chơi 1 sử dụng chiến lược
p và người chơi 2 sử dụng chiến lược q bởi công thức Ri(p,q).
Tìm kiếm chiến lược Minimax và số tiền phải trả trong ma trận trò chơi sau:
A

B

A

(5,3)

(2,6)


B

(3,2)

(4,5)

2. Giải quyết vấn đề
Giả sử người chơi 1 thực hiện hành động A với xác suất p và người chơi 2 thực
hiện hành động A với xác suất q. Số điểm thưởng mong đợi của người chơi 1 được
cho bởi công thức:
R1(p, q) = 5pq+2p(1 q)+3(1 p)q+4(1 p)(1 q) = 4pq 2p q+4.
Lê Đức Thọ

Trang 13


Hệ hỗ trợ ra quyết định

Người chơi 1 giả định rằng người chơi 2 sẽ hạn chế tối đa số tiền phải trả
của người chơi Để giảm thiếu số tiền phải trả của người chơi 1 dựa trên chiến lượt
của người chơi 2 chúng ta tính

(có nghĩa là sự thay đổi số tiền mong muốn phải chi trả của người chơi 1 đối với
từng chiến lược của người chơi 2)

Nói chung, hàm trên sẽ là hàm tuyến tính của p
Có 3 khả năng sau:
Trong trường hợp này, để hạn chế tối đa số tiền mà


1.

người chơi 1 phải trả, người chơi 2 sẽ chọn xác suất q=0 (có nghĩa là người
chơi 2 luôn chọn chơi sau). Chiến lược Minimax của người chơi 1 để chọn
bước đi nhằm tăng tối đa số điểm khi người chơi 2 chơi sau
Trong trường hợp này để giảm thiểu số tiền phải trả

2.

của người chơi 1, người chơi 2 sẽ chọn xác suất q=1 (có nghĩa là luôn chọn
chơi trước). Chiến lược minimax của người chơi 1 chọn bước đi tối đa hoá
điểm thưởng khi người chơi 2 chơi trước
3. Tồn tại p

sao cho

. Khi người chơi 1 sử dụng chiến lược

này, họ mong đợi số tiền phải trả không phụ thuộc vào chiến lược của
người chơi 2. Đây chính là chiến lược minimax của người chơi 1.

Lê Đức Thọ

Trang 14


Hệ hỗ trợ ra quyết định

Ta có:
R( ,q) = 4-2p = 3,5

Nó dựa trên chiến lược của người chơi 1 là chọn bước đi A với xác suất 0.25.
Bằng cách này người chơi 1 đảm bảo cho mình một số tiền phải trả 3.5
Cần lưu ý rằng nếu người chơi 1 chọn

và người chơi 2 hạn

thì

chế tối đa điểm thưởng của người chơi 1 bằng cách chọn q=0 tức là chọn B.
Trong trường hợp này số tiền phải trả của người chơi 1 là
R1(p, 0) = 4 − 2p < 3.5
Tương tự nếu người chơi 1 chọn

thì

thì người chơi 2 sẽ hạn chế

tối đa số điểm thưởng của người chơi 1 bằng cách chọn q= 1 tức là chọn A.
Trong trường hợp này số tiền phải chi trả của người chơi 1
R1(p, 1) = 2p + 3 < 3.5
Rõ ràng 3.5 là số tiền lớn nhất mà người chơi 1 mong muốn trả.
Chúng ta có thể tính chiến lược Minimax cho người chơi 2 bằng cách tương tự. Số
tiền mong muốn chi trả của người chơi 2 là hàm của p và q, và sự khác nhau liên
quan đến p, chiến lược của người chơi 1.Chúng ta có
R2(p, q) = 3pq+6p(1−q)+2(1−p)q+5(1−p)(1−q) = p−3q+5
Do đó

Theo đó, người chơi 1 luôn tìm cách tối thiểu hóa số điểm đạt được của
người chơi 2 bằng cách chọn xác suất p=0 tức là luôn chọn bước đi B
Nếu người chơi 1 chọn bước đi B thì người chơi 2 nên chọn bước đi B. Điều

này đảm bảo cho người chơi 2 hoàn trả 5
Chú ý: Điều này có thể biết được từ ma trận tiền trả nếu mục đích của người chơi 1
giảm thiểu tối đa số tiền phải trả của người chơi 2, vậy thì người chơi 1 chọn bước
B tốt hơn bước A.
Lê Đức Thọ

Trang 15


Hệ hỗ trợ ra quyết định

Thực tế thì phần thưởng của người chơi 2 luôn nhỏ hơn khi người chơi 1 chọn
bước B, bất kể người chơi 2 chọn A hay B
Giả sử cả 2 người chơi đều sử dụng chiến lược Minimax, có nghĩa là người chơi 1
chọn bước đi A với xác xuất 0.25 và người chơi 2 luôn chọn bước đi B.
Thì số tiền phải trả của người chơi 1 là:
R1(0.25A + 0.75B, B) = 0.25 × 2 + 0.75 × 4 = 3.5
Số tiền phải trả của người chơi 2 là:
R2(0.25A + 0.75B, B) = 0.25 × 6 + 0.75 × 5 = 5.25
có nghĩa là điểm thưởng của người chơi 2 sẽ lớn hơn số tiền phải trả minimax
cuả người chơi 2
Tóm lại, nếu chiến lược minimax của người chơi là chiến lược tốt, khi đó cả 2
người chơi sẽ sử dụng chiến lược minimax của mình. Người chơi có thể chi trả
nhiều hơn.

VI. KẾT LUẬN
Đề tài đã tìm hiểu những kiến thức chung về hệ hỗ trợ ra quyết định như các
định nghĩa, đặc điểm, quy trình ra quyết định và các kiến trúc DSS. Giới thiệu về
bài toán trò chơi ma trận và phương pháp giải bài toán ma trận sử dụng chiến lược
Minimax.


Lê Đức Thọ

Trang 16


Hệ hỗ trợ ra quyết định

VII. TÀI LIỆU THAM KHẢO
1- Bài giảng “ trò chơi ma trận” – Nguyễn Văn Hiệu
2- Bài giảng “ Lecture 6 – Matrix Games” – Nguyễn Văn Hiệu
3- />4- />5- Concepts of Solutions to 2-Player Matrix Games

Lê Đức Thọ

Trang 17



×