Tải bản đầy đủ (.pdf) (6 trang)

Một số dạng luật mạnh số lớn trong lí thuyết trò chơi xác suất

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (448.2 KB, 6 trang )

TẠP CHÍ ĐẠI HỌC SÀI GÒN

Số 20 - Tháng 4/2014

MỘT SỐ DẠNG LUẬT MẠNH SỐ LỚN
TRONG LÍ THUYẾT TRỊ CHƠI XÁC SUẤT
ĐỖ THẾ SƠN(*)
LÊ HỒNG SƠN(**)

TĨM TẮT
Bài báo cung cấp một số dạng luật mạnh số lớn trong khn khổ lí thuyết trò chơi
xác suất của Shafer và Vovk (2001). Các dạng luật mạnh số lớn trong lí thuyết trò chơi
được thiết lập với hàng rào bậc hai có sẵn.
Từ khố: luật mạnh số lớn, lí thuyết, xác suất, trò chơi xác suất
ABSTRACT
The paper presents some versions of the strong law of large numbers in the
framework of the game-theoretic probability of Shafer and Vovk (2001). Game-theoretic
versions of the strong law of large numbers are established under the availability of the
quadratic hedge.
Keywords: the strong law of large numbers, theory, probability, probability game
1. GIỚI THIỆU*
Trong khn khổ của lí thuyết trò chơi
xác suất, việc chứng minh các nước đi của
Thực tế (Reality) tn theo luật mạnh số
lớn (LMSL) trong trường hợp các nước đi
này b chặn là khá dễ dàng. Tuy nhiên, khi
các nước đi của Thực tế khơng b chặn,
việc chứng minh trở nên phức tạp hơn. Bên
cạnh đó, tương ứng với một số dạng phổ
biến nhất của LMSL trong lí thuyết xác
suất cần phải được nghiên cứu trong lí


thuyết trò chơi xác suất (nếu có).
Bài báo cung cấp một số dạng LMSL
trong trò chơi dự báo khơng bị chặn
(unbounded forecasting game) đã được giới
thiệu trong chương 4 của [1]. Tiếp theo, khi
hạn chế nước đi của Thực tế trong trò chơi
dự báo khơng b chặn là các số thực dương,

chúng tơi đưa ra một giao thức mới, gọi là
trò chơi dự báo khơng bị chặn một phía
(One-sided unbounded forecasting game).
Sau đó, chúng tơi chứng minh một số kết quả
dạng LMSL đối với giao thức này.
2. MỘT SỐ KHÁI NIỆM VÀ KẾT QUẢ
SƠ BỘ
Trong mục này, chúng tơi tóm tắt một
số khái niệm cơ bản của trò chơi dự báo
khơng b chặn. Sau đó, chúng tơi đưa ra hai
kết quả dạng LMSL đối với trò chơi này.
Xét trò chơi hồn hảo thơng tin giữa ba
người: Dự báo (Forecaster), Hồi nghi
(Skeptic) và Thực tế (Reality). Trước khi bắt
đầu trò chơi, Hồi nghi cơng bố số vốn ban
đầu của mình K0  1 ( K0  D  0 trong mục
2 của [2]). Sau đó, ở mỗi vòng n  1, 2,... của
trò chơi, người chơi lần lượt cơng bố các nước
đi (move) của mình theo thứ tự: Dự báo, Hồi
nghi và Thực tế. Tại mỗi vòng, đầu tiên Dự
báo cơng bố nước đi mn và vn của mình,


(*)

ThS, Trường ĐH Cơng nghiệp TP Hồ Chí Minh, Cơ sở
Thanh Hóa.
(**)
TS, Khoa Giáo dục đại cương, Trường ĐH Sư phạm
Kĩ thuật Vinh.

61


chúng được hiểu lần lượt như là giá cho nước
đi xn của Thực tế và giá cho bình phương độ

Người chơi: Dự báo, Hoài nghi, Thực tế
Giao thức:
K0  1 .

lệch ( xn  mn )2 . Căn cứ vào các giá mà Dự
báo đưa ra, Hoài nghi sau đó sẽ công bố số
lượng M n và Vn mà anh ta đặt cược lần lượt

Dự báo công bố mn 

cho xn và ( xn  mn )2 . Cuối cùng, Thực tế

Thực tế công bố xn 

và vn  0 .


Hoài nghi công bố M n 

và Vn  0 .

.

công bố nước đi xn của mình. Số phải trả

Kn : Kn1  M n ( xn  mn )  Vn [( xn  mn )2  vn ] .

(payoff) cho Hoài nghi tại vòng thứ n là
M n ( xn  mn )  Vn [( xn  mn )2  vn ] và số vốn

Nhiệm vụ ràng buộc: Hoài nghi phải
giữ K n không âm.

(capital) của Hoài nghi khi kết thúc vòng thứ
n được cập nhật là:

Thực tế phải giữ K n không tiến đến vô
cùng.
Một chiến lược (strategy) P  {Pn }n1

Kn : Kn1  M n ( xn  mn )  Vn [( xn  mn )2  vn ] .

của Hoài nghi xác đ nh M n và Vn dựa vào

Giao thức của trò chơi dự báo không b
chặn được viết như sau
TRÒ CHƠI DỰ BÁO KHÔNG BỊ CHẶN

(UNBOUNDED FORECASTING GAME)

các nước đi trước của Dự báo và Thực tế,
và nước đi hiện tại của Dự báo

M n  M nP (m1 , v1 , x1 , m2 , v2 , x2 ,..., mn1 , vn1 , xn1 , mn , vn )

Vn  VnP (m1 , v1 , x1 , m2 , v2 , x2 ,..., mn1, vn1, xn1, mn , vn )
K nP là số vốn tích lũy (cumulative) của

(event). Chúng ta nói rằng Hoài nghi có thể
buộc (force) biến cố E nếu tồn tại một
chiến lược P của Hoài nghi sao cho

Hoài nghi với chiến lược P sau vòng n,
với K 0P =0 .

KnP ( )  1,  ,n  0

Chúng ta gọi một dãy hàm giá tr thực
Sn (m1 , v1 , x1,..., mn , v n , xn ) của các nước đi



m1 , v1 , x1 ,..., mn , vn , xn , n  0 là một quá

   limsup KnP ( )  
n

trình vốn (capital process) nếu Sn  K đối

P
n

với một chiến lược P nào đó.
Một dãy vô hạn
  (m1 , v1 , x1 , m2 , v2 , x2 ,....) các

(1)

Chú ý rằng Hoài nghi có thể buộc
biến cố E , tức là E xảy ra hầu chắc chắn
(xem [1]).
Một chiến lược P của Hoài nghi thỏa
mãn (1) được gọi là thận trọng (prudent).
Chúng ta cũng gọi hàm thực h( xn  mn ) của

nước

đi của Dự báo và Thực tế được gọi là một
đường đi (path). Tập tất cả các đường đi

hiệu các nước đi xn và mn là một hàng rào

  {  (m1 , v1, x1, m2 , v2 , x2 ,....), n  1}

(hedge) nếu 0  h(x n  mn )   .

gọi là không gian mẫu (sample space), tập
con bất kỳ E   gọi là một biến cố


Cho hai biến cố E, F   biến cố
62


E  F được xác đ nh là E  F  E c  F .
Chúng ta cũng nói rằng một quá trình A là
dự báo được (predictable) nếu với mọi số
nguyên n  1 ,

thay hàng rào bậc hai bởi hàng rào tổng
quát h còn giá của hàng rào là một hằng số
dương cố đ nh (xem [3]).
Đ nh lí 3.1 của [3] cho thấy rằng
trong trò chơi dự báo không b chặn với
hàng rào đơn h( x)  x1 ,   0 thì Hoài

An (m1, v1, x1,m 2 , v2 , x2 ,...,m n, vn, x n)
không phụ thuộc vào xn .

nghi

Một supermartingale T là một quá
trình có dạng T  S  B , với S là một quá
trình vốn và B là một quá trình tăng
( Bn ( )  Bn1 ( ), n, ). Một quá trình

xn 




thể

buộc

xn  0 ,

với

x1  x2  ...  xn
. Mặt khác, Mệnh
n

đề 2.1 của [3] cũng khẳng đ nh rằng trong
trò chơi dự báo không b chặn với hàng rào
đơn h( x)  x r , r  0 thì Hoài nghi không

B  0 có thể xem là tăng nên bản thân một
quá trình vốn S là một supermartingale.
Một semimartingale là một quá trình có thể
viết dưới dạng U  T  A , với T là một
supermartingale và A là một quá trình tăng
dự báo được; quá trình A được gọi là
compensator đối với U .
Bây giờ chúng ta chứng minh đ nh lí
dưới đây:
Định lí 2.1. Trong trò chơi dự báo
không b chặn, Hoài nghi có thể buộc

thể buộc


x1  x2  ...  xn
0.
n1/ r

Tuy nhiên, cả đ nh lí và mệnh đề này
đều được phát biểu đối với trò chơi dự báo
không b chặn với hàng rào đơn h , trong
đó giá của hàng rào đơn h là hằng số
dương (tức là: vn  v  0, n  1 ). Do vậy,
khi xem xét trò chơi dự báo không b chặn
với hàng rào bậc hai, có hai câu hỏi chính
mà chúng ta cần quan tâm là có thể thay n



vn
1 n



lim

 (x k  mk )  0 .
x 
n k 1
n 1 n

trong Đ nh lí 3.1 của [3] bằng n hay
không và nếu có thể, thì chúng ta cần phải
thêm điều kiện gì? Đ nh lí 2.1 đã đưa ra

một câu trả lời cho hai câu hỏi trên.
Việc tiếp theo của chúng ta bây giờ là
đưa ra chứng minh cho Đ nh lí 2.1.
Chứng minh. Không mất tính tổng
quát, chúng ta giả sử rằng mn  0, n . Đặt

Trước khi chứng minh đ nh lí này,
chúng ta thảo luận về ý nghĩa của đ nh lí và
đặc trưng của giao thức trò chơi dự báo
không b chặn.
Trong giao thức của trò chơi dự báo
không b chặn, chúng ta xét hàng rào
phương sai (còn gọi là hàng rào bậc hai
h(x n  mn )  (x n  mn )2 ). Do đó, giao thức

n

Sn  

này được gọi chính xác là trò chơi dự báo
không b chặn với hàng rào bậc hai. Trong
trò chơi này, hàng rào bậc hai được cố đ nh
sẵn đối với Hoài nghi còn các giá của hàng
rào vn sẽ được Dự báo công bố ở mỗi vòng,

k 1

n

xk

, S0  0 ;
k


vk
vk
, A   .
k 1 k
k 1 k

An  

trước khi Thực tế công bố nước đi của
mình. Vì vậy, sẽ rất hữu ích nếu chúng ta
63


Chú ý rằng Sn2  U n  An , do đó An là

Xét

xk2  vk

k k 1 k

n

n

xk


U n  S  An  2 Sk 1
2
n

k 1

= U n 1  2Sn 1

compensator đối với semimartingale S n2 .
Khi đó từ Bổ đề 4.7 của [1], nếu A  
thì S n hội tụ h.c.c, tức là

xn2  vn

n
n

xn



n
vn
x
    k hội tụ h.c.c, khi

k
n 1 n
k 1


2
= U n1  M n xn  Vn ( xn  vn ).

n  .

2
2 n 1 xk
Trong đó, M n 
Sn1 
 và
n
n k 1 k
1
Vn  . Suy ra, U n là một quá trình vốn,
n
do đó U n cũng là một supermartingale.

Kết hợp với bổ đề Kronecker, ta được:


vn
1 n



lim
xk  0 .



x 
n
n
n 1
k 1
Trong các giáo trình về lí thuyết xác suất,
tốc độ hội tụ của LMSL có thể được đánh
giá bằng một dãy số (bn ) tăng dương

Từ
n

Sn  
k 1

xk
k

 Sn 1 

xn

( 0  bn   ). Tuy nhiên, trong lí thuyết trò
chơi xác suất, dãy số dương tăng trở nên
đặc biệt hơn, như trong Đ nh lí 2.2 dưới
đây.

n

Chúng ta có S n là một quá trình vốn, với

1
và Vn  0 nên S n cũng là một
Mn 
n
supermartingale.


 vn   và
n 1

n

Định lí 2.2. Gọi Bn2   vk , trong trò chơi
k 1

dự báo không b chặn, Hoài nghi có thể buộc



vn
1



lim

2
x  B
n 1 Bn
n


n

xk
. Compensator
k 1 Bk

quá trình vốn Sn  

vk
của S n2 là An   2 . Từ hai bổ đề 4.6
k 1 Bk
và 4.7 của [1] kết hợp với bổ đề Kronecker,
ta dễ dàng suy ra

x
k 1

k

k 1

k

 mk )  0 .

của Thực tế là một số thực bất kỳ. Trong
mục này, chúng tôi hạn chế nước đi của
Thực tế là các số thực dương và đưa ra giao
thức trò chơi dự báo không bị chặn một phía

với hàng rào bậc hai (One-sided unbounded
forecasting game with quadric hedge). Sau
đó, chúng tôi chứng minh một số kết quả
dạng LMSL đối với giao thức này.
Giao thức trò chơi dự báo không b

n

n

 (x

3. TRÒ CHƠI DỰ BÁO KHÔNG BỊ
CHẶN MỘT PHÍA
Với trò chơi dự báo không b chặn ở
mục trước, chúng ta thấy rằng nước đi xn

Chứng minh. Chú ý rằng, không mất tính
tổng quát, chúng ta giả sử mn  0, n . Xét

1
lim
x  B
n

n

0

64



chặn một phía với hàng rào bậc hai được
viết như sau:

Kn : Kn1  M n ( xn  mn )  Vn [( xn  mn )2  vn ] .

Nhiệm vụ ràng buộc: Hoài nghi phải
giữ K n không âm.

ONE-SIDED UNBOUNDED
FORECASTING (OUF)

Thực tế phải giữ K n không tiến đến

Người chơi: Dự báo, Hoài nghi, Thực tế

vô cùng.
Đ nh lí dưới đây được phát triển dựa
vào Đ nh lí 4.4 của [2] phát biểu cho trò
chơi dự báo không b chặn.

Giao thức:

K0  1 .
Với n  1, 2,... :

n

Định lí 3.1. Đặt Bn   mk , giả sử


Dự báo công bố mn  0 và vn  0 .
Hoài nghi công bố M n 

k 1

rằng g là một hàm số dương tăng trên
[0; ) với g ()   . Trong OUF, Hoài
nghi có thể buộc

và Vn  0 .

Thực tế công bố xn  0 .





m

n

n 1

vn

 g ( B )    lim

  và


n 1

x 

n

Chứng minh. Đặt
n
x  mk
, U0  0 ;
Un   k
g ( Bk )
k 1

n

An  
k 1

Xét

n
1
( xk  mk )  0.

g ( Bn ) k 1


vk
v

, A   k .
g ( Bk )
k 1 g (Bk )

với
n

Tn  U n2  An  2 (
k 1

xk  mk
( x  mk )  vk
)U k 1   k
g (Bk )
g ( Bk )
k 1
n

2

Mn 

xn  mn
( xn  mn )2  vn
= Tn 1  2U n 1 (
)
g ( Bn )
g ( Bn )




= Tn1  M n ( xn  mn )  Vn [( xn  mn ) 2  vn ] .

Tn cũng là một supermartingale. Mặt khác

Un  
k 1

xk  mk
g ( Bk )

 U n 1 

xn  mn
g ( Bn )



1
g ( Bn ) .

compensator đối với U n2 . Khi đó, theo Bổ
đề 4.7 của [1], ta có

,

n
vn
x  mk
 k


g ( Bk )
n 1 g ( Bn )
k 1


suy ra U n cũng là một quá trình vốn với
Mn 

Vn 

g ( Bn )

n 1
xk  mk
2

g ( Bn ) k 1 g ( Bk )

Lưu ý rằng U n2  Tn  An nên An là

Do đó Tn là một quá trình vốn, suy ra
n

2U n 1

1
và Vn  0 .
g ( Bn )


hội tụ h.c.c, khi n   .

65


Kết hợp với bổ đề Kronecker, ta được

Khi đó, Hoài nghi có thể buộc

Sn
.
x  n

n
1
lim
( xk  mk )  0 .

x 
g ( Bn ) k 1

lim

Chứng minh. Trong Đ nh lí 3.1, lấy
hàm g ( x)  x 2 . Khi đó

Đ nh lí được chứng minh
Như chúng ta đã biết trong lí thuyết xác
suất, luật mạnh số lớn Kolmogorov đã được
nghiên cứu với các biến ngẫu nhiên độc lập

cùng phân phối. Trong trường hợp đó, kỳ
vọng và phương sai của các biến ngẫu nhiên
đó là những hằng số không phụ thuộc vào n.
Tương ứng với điều đó, trong lí thuyết trò
chơi xác suất, ta xét luật mạnh số lớn với
các nước đi của Thực tế là những hằng số
và thu được hệ quả dưới đây.
Hệ quả 3.2. Trong OUF, giả sử rằng


vn
2
2  1




 
2 2
 2 n1 n 2
n 1 g ( Bn )
n 1 n 


,
n
1
1 n
(x


m
)

(x k  mk )
 k k n 
g ( Bn ) k 1
k 1

.
Do đó
1 n
( xk   )  0

x  n
k 1

lim

hay

n

mn   , vn   với mọi n, đặt Sn   xk .
2

Sn
.
x  n

lim


k 1

TÀI LIỆU THAM KHẢO
1.

G. Shafer, V. Vovk, Probability and Finance: It's Only a Game! Wiley, 2001.

2.

Kenshi Miyabe, Akimichi Takemura, Convergence of random series and the rate of
convergence of the strong law of large numbers in game-theoretic probability,
Stochastic Process. Appl 122 (2012) 1-30.

3.

M. Kumon, A. Takemura, K. Takeuchi, Game-theoretic versions of strong law of
large numbers for unbounded variables, Stochastic 79 (5) (2007) 449-468.
* Ngày nhận bài: 6/3/2014. Biên tập xong: 16/5/2014. Duyệt đăng: 22/5/2014

66



×