Tải bản đầy đủ (.pdf) (83 trang)

Luận văn thạc sĩ Phân tích liên tiếp

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (476.79 KB, 83 trang )

Mục lục
1 MỞ ĐẦU 5
1.1 Giới thiệu về phân tích liên tiếp . . . . . . . . . . . . . . . . . . 5
1.2 Thí dụ: Kiểm tra sản phẩm . . . . . . . . . . . . . . . . . . . . 7
1.2.1. Phân phối cỡ mẫu . . . . . . . . . . . . . . . . . . . . . 7
2 PHÂN TÍCH LIÊN TIẾP: KIỂM ĐỊNH GIẢ THIẾT ĐƠN 11
2.1 Tiêu chuẩn liên tiếp tỉ số xác suất(SPRT) . . . . . . . . . . . . 11
2.2 SPRT: Kết thúc hữu hạn và bị chặn . . . . . . . . . . . . . . . . 13
2.3 Hàm OC (θ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4 Số trung bình mẫu . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.5 Đồng nhất thức cơ bản của Wald . . . . . . . . . . . . . . . . . 28
2.5.1. Ứng dụng của đồng nhất thức cơ bản . . . . . . . . . . . 28
2.6 Các cận trên và cận dưới của số trung bình mẫu . . . . . . . . . 31
3 PHÂN TÍCH LIÊN TIẾP: KIỂM ĐỊNH CHO GIẢ THIẾT
HỢP 35
3.1 Phương pháp hàm trọng lượng . . . . . . . . . . . . . . . . . . . 35
3.1.1. Ứng dụng của phương pháp hàm trọng lượng . . . . . . . 36
3.2 Tiêu chuẩn liên tiếp t và t
2
. . . . . . . . . . . . . . . . . . . . . 37
3.2.1. Sự khai triển tiệm cận đều và sự nghịch đảo của tích phân 40
3.2.2. Tiệm cận chuẩn của thống kê T . . . . . . . . . . . . . . 41
3.2.3. Tiêu chuẩn liên tiếp t . . . . . . . . . . . . . . . . . . . . 45
1
3.2.4. Tiêu chuẩn liên tiếp t
2
(tiêu chuẩn hai phía) . . . . . . . 46
4 ƯỚC LƯỢNG LIÊN TIẾP 49
4.1 Các khái niệm cơ bản . . . . . . . . . . . . . . . . . . . . . . . . 49
4.2 Tính đủ và hoàn toàn đầy đủ . . . . . . . . . . . . . . . . . . . 50
4.3 Cận dưới Cramer-Rao . . . . . . . . . . . . . . . . . . . . . . . 59


4.4 Quy trình hai bước . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.4.1. Quy trình Stein cho ước lượng trung bình của một phân
phối chuẩn với phương sai chưa biết . . . . . . . . . . . . 64
4.4.2. Quy trình ước lượng hiệu của hai trung bình . . . . . . . 68
4.4.3. Quy trình cho ước lượng trung bình chung . . . . . . . . 70
4.4.4. Khoảng tin cậy chiều dài cố định dựa trên SPRT . . . . 75
KẾT LUẬN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
Tài liệu tham khảo . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
2
Lời nói đầu
Ngày nay đi cùng với sự phát triển của xã hội là sự gia tăng nhu cầu về việc
ứng dụng các phương pháp thống kê toán để phân tích các số liệu thống kê thu
được trong các lĩnh vực của khoa học tự nhiên, kinh tế và xã hội. Trong luận
văn này tác giả sẽ trình bày về thống kê liên tiếp, được dùng để xử lí dữ liệu
khi số lượng các quan trắc là không cố định.
Luận văn được chia thành bốn chương:
Chương 1: Mở đầu. Chương này giới thiệu chung về phương pháp phân tích
liên tiếp trong thống kê, đặc điểm cơ bản của phân tích liên tiếp, và ứng dụng
của nó trong kiểm tra sản phẩm.
Chương 2: Phân tích liên tiếp: kiểm định giả thiết đơn. Nội dung của
chương này là sử dụng phân tích liên tiếp để kiểm định bài toán giả thiết đơn,
đối thiết đơn. Đưa ra cách xây dựng tiêu chuẩn liên tiếp tỉ số xác suất (SPRT)
và các ví dụ minh họa, chỉ ra tính hữu hạn, bị chặn của SPRT. Sau đó xét các
hàm OC, hàm ASN, và đồng nhất thức cơ bản của Wald.
Chương 3: Phân tích liên tiếp: kiểm định cho giả thiết hợp. Nội dung
chương này là ứng dụng của SPRT trong kiểm định giả thiết hợp, đưa ra phương
pháp hàm trọng lượng ( Phân phối tiên nghiệm ) để xây dựng một SPRT tối ưu
và các ứng dụng của phương pháp hàm trọng lượng. Chương này cũng đưa ra
các tiêu chuẩn liên tiếp t và t
2

và các tính chất của nó.
Chương 4: Ước lượng liên tiếp. Chương này bao gồm các khái niệm cơ bản
trong ước lượng liên tiếp, nghiên cứu tính đủ và đầy đủ, cận dưới Cramer - Rao,
quy trình hai bước. Và cách xác định khoảng tin cậy độ dài cố định dựa trên
SPRT.
Luận văn này được thực hiện tại trường Đại Học Khoa Học Tự Nhiên - Đại
Học Quốc Gia Hà Nội, dưới sự hướng dẫn nhiệt tình của GS.TSKH. Đặng Hùng
Thắng. Thầy đã dành nhiều thời gian hướng dẫn cũng như giải đáp các thắc
3
mắc của tôi trong suốt quá trình làm luận văn. Tôi muốn bày tỏ lòng biết ơn
sâu sắc đến thầy.
Qua đây, tôi xin gửi tới quý thầy cô Khoa Toán-Cơ-Tin học, Trường Đại học
Khoa học Tự nhiên, Đại học Quốc gia Hà Nội, cũng như các thầy cô đã tham
gia giảng dạy khóa cao học 2011- 2013, lời cảm ơn sâu sắc nhất đối với công lao
dạy dỗ trong suốt quá trình học tập của tôi tại Nhà trường.
Tôi xin cảm ơn gia đình, bạn bè và các bạn đồng nghiệp thân mến đã quan
tâm, tạo điều kiện và cổ vũ, động viên tôi để tôi hoàn thành tốt nhiệm vụ của
mình.
Hà Nội, tháng 08 năm 2014
Tác giả luận văn
Lê Thị Bích Ngọc
4
Chương 1
MỞ ĐẦU
1.1 Giới thiệu về phân tích liên tiếp
Phân tích liên tiếp khác với các quy trình thống kê khác trong đó cỡ mẫu là
không cố định trước. Người thí nghiệm chọn một dãy các quan sát (hoặc một
số cố định các quan sát) ở một thời điểm và quyết định xem: ngừng lấy mẫu
và đưa ra một quyết định hoặc là tiếp tục lấy mẫu và đưa ra quyết định sau.
Những bài toán ra quyết định mà trong đó người thí nghiệm có thể liên tục thay

đổi phương pháp xử lí thì sẽ ở mức khó hơn, và gọi là bài toán thiết kế liên tiếp.
Chẳng hạn xét bài toán sau
Bài toán 1.1: Nếu ta muốn so sánh vài loại thuốc khác nhau hoặc các phương
pháp điều trị(như trong kiểm tra liên tiếp các loại thuốc ung thư)để biết có nên
giảm một số loại thuốc ra khỏi giai đoạn đầu của cuộc thử nghiệm, nếu như kết
quả những loại thuốc này là kém hơn so với các loại thuốc khác
Vậy một nét đặc trưng cơ bản của phân tích liên tiếp đó là số quan sát cần tìm
để kết thúc thí nghiệm là một biến ngẫu nhiên. Vì nó phụ thuộc vào kết quả của
các quan sát.
Phương pháp liên tiếp giúp ta có thể đưa ra dự đoán sớm hơn là dùng phương
pháp cỡ mẫu cố định.
Trong thí nghiệm liên tiếp ta cần xác định:
1 . Kích cỡ mẫu ban đầu.
5
2 . Một quy tắc cho sự kết thúc thí nghiệm.
3 . Số lượng các quan sát được làm thêm nếu thí nghiệm tiếp tục.
4 . Một quy tắc quyết định cuối cùng.
Trong những thí nghiệm này chỉ có số lượng các quan sát là phụ thuộc liên tiếp,
đòi hỏi định lý đơn giản và sẽ áp dụng chung, hơn nữa trong bài toán thiết kế
liên tiếp không chỉ có số phép thử mà cả số phương pháp xử lí cũng phụ thuộc
liên tiếp.
Nếu thí nghiệm vẫn tiếp tục cho đến khi chúng ta quan sát X
1
, . . . , X
n
, một
tiêu chuẩn liên tiếp là hoàn toàn xác định bởi các tập rời nhau R
0
m
, R

1
m
và R
c
m
∈ R
n
- không gian Euclid m chiều với m = 1,2 nếu X
1
, . . . , X
n
phụ thuộc vào
R
0
m
, ta chấp nhận giả thiết H, bác bỏ H khi nó phụ thuộc vào R
1
m
. Và ta tiếp
tục lấy mẫu nếu nó nằm trong R
c
m
.
Bởi vì các tập trên là rời nhau và hợp của chúng là R
m
suy ra chỉ cần xác
định hai tập bất kì trong ba tập đó. Vấn đề cơ bản là lựa chọn một tập thích
hợp trong hai tập này. Tiêu chuẩn lựa chọn tập được quyết định bởi đặc trưng
sử dụng(OC) và cỡ mẫu trung bình(ASN), những hàm này sẽ được xây dựng
như sau:

Giả sử rằng hàm phân bố cơ bản là được chỉ ra bởi một tham số giá trị thực và
giả sử các nhà thống kê có thể lựa chọn giữa hai giả thiết H
0
và H
1
. Hàm OC(θ)
là xác suất chấp nhận H
0
. khi θ là giá trị thực của tham số. Với mong muốn rằng
hàm OC phải là các giá trị cao của θ sao cho phù hợp với H
0
và giá trị thấp của
θ sao cho phù hợp với H
1
. Ví dụ người ta có thể yêu cầu OC(θ) ≥ 1−α, ∀θ ∈ H
0
và OC(θ) ≤ β, ∀θ ∈ H
1
, trong đó α và β là các xác suất phạm sai lầm. Một tiêu
chuẩn liên tiếp S được gọi là chấp nhận được nếu hàm OC của nó thỏa mãn tiêu
chuẩn trên.
Như đã nói ở trên số lượng các quan sát cần tìm trong phân tích liên tiếp là
một biến ngẫu nhiên và quan trọng hơn là giá trị kì vọng của nó khi θ là một
tham số giá trị thực. Giá trị kì vọng này là hàm điển hình của θ và được gọi là
hàm ASN(hàm cỡ mẫu trung bình). Với mong muốn có một hàm ASN nhỏ với
α, β cho trước, và cỡ mẫu dự kiến là nhỏ hơn so với quy trình cỡ mẫu cố định.
Cho ν(θ|D) là kí hiệu của cỡ mẫu kì vọng của quy trình D khi θ là giá trị thực.
Nếu D
0
là chấp nhận được và ν(θ|D) = Min

D
ν(θ|D) khi đó D
0
được xem là
một tiêu chuẩn tốt đều nhất . Tuy nhiên, nói chung là không tồn tại tiêu chuẩn
6
tốt đều nhất. Tiêu chuẩn này có thể tìm thấy trong một phân tích liên tiếp tối
ưu, khi H
0
và H
1
là những giả thiết đơn. Phép kiểm định theo tỉ số xác suất
liên tiếp của Wald cho ASN nhỏ nhất với cả hai H
0
và H
1
.
Hiệu quả của quy trình D tại θ được xác định bằng tỉ lệ số lượng mẫu dự
kiến nhỏ nhất của D tại θ với số lượng mẫu dự kiến của D tại θ. Wald’s SPRT
có hiệu quả bằng 1 với cả hai giả thiết H
0
và H
1
.
1.2 Thí dụ: Kiểm tra sản phẩm
Phân tích liên tiếp sớm nhất là phương pháp lấy mẫu đôi của Dodge và
Romig trong kiểm tra chất lượng sản phẩm. Lấy n sản phẩm và bác bỏ mẫu
này nếu như số lượng phế phẩm trong mẫu ≥ c (và chấp nhận nếu < c ). Một
phương pháp khác đó là : lấy mỗi sản phẩm một cách riêng biệt tại các thời
điểm khác nhau, bác bỏ những mẫu mà số lượng phế phẩm trong mẫu ≥ c, và

chấp nhận những mẫu mà số lượng thành phẩm trong mẫu ≥ n −c + 1, cỡ mẫu
cần thiết ít nhất là c và nhiều nhất là n. Phương pháp này gọi là kiểm tra rút
ngắn.
1.2.1. Phân phối cỡ mẫu
Kí hiệu N là cỡ mẫu ngẫu nhiên cần thiết để kết thúc thí nghiệm, khi đó:
P
θ
(N = c và bác bỏ H
0
) = θ
c
(1.1)
P
θ
(N = c + r và bác bỏ H
0
) =

c + r − 1
c −1

θ
c
(1 −θ)
r
(1.2)
với r = 1, 2, n − c
P
θ
(N = n −c + 1 + s và chấp nhận H

0
) =

n −c + s
s

θ
s
(1 −θ)
n−c+1
(1.3)
với s = 0, 1, c − 1
bây giờ : E
θ
(N) =
n

m=1
mP
m
trong đó P
m
là xác suất mà một quyết định đạt được tại lần thử thứ m.
7
Kí hiệu : P (N = m| bác bỏ H
0
) = 0 với m < c
và P (N = m| chấp nhận H
0
) = 0 với m < n − c + 1

hơn nữa:
P
m
= P
0
(bác bỏ tại giai đoạn m) + P (chấp nhận tại giai đoạn m, m ≥ c)
=

m −1
c −1

θ
c
(1 −θ)
m−c
+

m −1
n −c

(1 −θ)
n−c+1
θ
m−(n−c+1)
(1.4)
Do đó:
E
θ
(N) =c θ
c

n

m=1

m
c

(1 −θ)
m−c
+ (n − c + 1) (1 − θ)
n−c+1
n

m=n−c+1

m
n −c + 1

θ
m−(n−c+1)
(1.5)
=c θ
c
n=c

r=0

r + c
c


(1 −θ)
r
+ (n − c + 1) (1 − θ)
n−c+1
c−1

r=0

n −c + 1 + r
r

θ
r
(1.6)
Người ta thường ưa dùng kế hoạch lấy mẫu rút ngắn hơn là kế hoạch lấy mẫu
đơn tương đương bởi vì E(N|θ)của kế hoạch lấy mẫu rút ngắn là nhỏ hơn cỡ
mẫu của kế hoạch lấy mẫu đơn. Xét trường hợp c = 1:
E (N|θ) = θ
n−1

r=0
(r + 1) (1 − θ)
r
+ n (1 − θ)
n
= (1 −y)
n−1

r=0
(r + 1) y

r
+ ny
r
, y = 1 −θ
=
n−1

r=0
(r + 1) y
r

n

j=1
jy
j
+ ny
n
=
n−1

r=0
(r + 1) y
r

n−1

j=0
jy
j

=
n−1

r=0
y
r
=
1 −y
n
1 −y
(1.7)
8
E (N|θ) tăng với y do đó E (N|θ) giảm với θ khi c = 1. Tuy nhiên điều này
không đúng với c > 1.
Cho
P
1
(θ) = P (chấp nhận mẫu sử dụng quy trình mẫu cố định|θ)
=
c−1

r=0

n
r

θ
r
(1 −θ)
n−r

(1.8)

P
2
(θ) = P (chấp nhận mẫu sử dụng luật liên tiếp|θ)
=
n

m=n−c+1
P (chấp nhận mẫu vàN = m|θ)
=
n

m=n−c+1

m −1
n −c

θ
m−1−(n−c)
(1 −θ)
n−c
(1 −θ)
= (1 −θ)
n−c+1
n−1

r=n−c

r

n −c

θ
r−(n−c)
= (1 −θ)
n−c+1
c−1

r=0

r + n − c
r

θ
r
(1.9)
Khi đó chúng ta có bổ đề sau:
Bổ đề 1.2.1. P
1
(θ) = P
2
(θ) ∀ n,c
Chứng minh. cho c=1,P
1
(θ) = P
2
(θ) = (1 −θ)
n
cho c = 2,P
1

(θ) = P
2
(θ) = (1 −θ)
n
+ nθ(1 −θ)
n−1
Giả sử đúng với mọi c và xét trường hợp c + 1
giả sử
c−1

k=0

n
k

θ
k
(1 −θ)
n−k
= (1 −θ)
n−c+1
c−1

r=0

r + n − c
r

θ
r

(1.10)
ta cần chứng minh:
c−1

k=0

n
k

θ
k
(1 −θ)
n−k
= (1 −θ)
n−c
c

r=0

r + n − c − 1
r

θ
r
(1.11)
9
trừ (1.11) cho (1.10), sau đó chia cả 2 vế cho (1 − θ)
n−c
ta được:


n
c

θ
c
=
c

r=0

r + n − c − 1
r

θ
r
− (1 − θ)
c−1

r=0

r + n − c
r



n
c

θ
c

=

n −1
c

θ
c
+
c−1

r=0

r + n − c − 1
r



r + n − c
r

θ
r
+ θ
r+1
c−1

r=0

r + n − c
r




n
c



n −1
c

θ
c
=
c−1

r=0

r + n − c − 1
r



r + n − c
r

θ
r
=
c−1


r=0

r + n − c
r

θ
r+1


n −1
c −1

θ
c
= −
c−1

r=0

r + n − c − 1
r − 1

θ
r
+
c

s=1


s + n −c −1
s −1

θ
s
⇔ 0 = −
c−1

r=0

r + n − c − 1
r − 1

θ
r
+
c−1

s=1

s + n −c −1
s −1

θ
s
Điều này luôn đúng.
10
Chương 2
PHÂN TÍCH LIÊN
TIẾP: KIỂM ĐỊNH

GIẢ THIẾT ĐƠN
2.1 Tiêu chuẩn liên tiếp tỉ số xác suất(SPRT)
Neyman và Pearson (1933) đã cung cấp một phương pháp xây dựng tiêu
chuẩn mạnh nhất để kiểm định giả thiết đơn, đối thiết đơn.
Giả sử ta có hàm mật độ xác suất f(x
0
, θ) và ta muốn kiểm định: H
0
: θ =
θ
0
|H
1
: θ = θ
1
.
Bổ đề 2.1.1. (Neyman và pearson) Cho X
1
, X
2
, X
n
là một mẫu ngẫu nhiên
và cho
Λ
n
=

n
i=1

f (X
i
, θ
1
)

n
i=1
f (X
i
, θ
0
)
Khi đó tiêu chuẩn mạnh nhất để kiểm định H
0
|H
1
thu được bằng cách bác bỏ
H
0
nếu Λ
n
≥ K và chấp nhận H
0
nếu Λ
n
< K.Với K được xác định bởi mức ý
nghĩa.
11
Wald đưa ra tiêu chuẩn liên tiếp tỉ số xác suất: chọn hai hằng số A, B sao

cho: 0 < B < A <∞. Chấp nhận H
0
nếu Λ
n
≤ B, bác bỏ H
0
nếu Λ
n
≥ A, tiếp
tục lấy mẫu nếu B < Λ
n
< A khi người thí nghiệm tiến hành đến bậc n. (n =
1,2, )
Ví dụ 2.1.2. Cho phân phối mũ: f (x, θ) = θ
−1
exp (−x/θ) , x > 0, θ > 0
ta muốn kiểm định: H
0
: θ = θ
0
|H
1
: θ = θ
1
. Khi đó:
Λ
n
= (θ
1


0
)
−1
exp
n

i=1
X
i
((θ
1
− θ
0
)/θ
0
θ
1
)
⇒ ln Λ
n
= −n ln

θ
1
θ
0

+

θ

1
− θ
0
θ
0
θ
1

n

i=1
X
i
Sau quan sát thứ n, thực hiện thêm một quan sát nếu:
B < Λ < A
⇔ln B < ln Λ
n
< ln A
⇔ln B < −n ln

θ
1
θ
0

+

θ
1
− θ

0
θ
0
θ
1

n

i=1
X
i
< ln A
Vậy sau quan sát lần thứ n, bất đẳng thức tiếp tục lấy mẫu là:
θ
0
θ
1
θ
1
− θ
0

ln B + n ln

θ
1
θ
0

<

n

i=1
X
i
<
θ
0
θ
1
θ
1
− θ
0

ln A + n ln

θ
1
θ
0

Ví dụ 2.1.3. Cho phân phối nhị thức một SPRT để kiểm định:
H
0
: θ = θ
0
|H
1
: θ = θ

1
, (θ
1
> θ
0
) xác định bởi hai hằng số A và B.
Λ
n
=
θ
m
1
(1 −θ
1
)
n−m
θ
m
0
(1 −θ
0
)
n−m
Sau n quan sát ta tiếp tục lấy mẫu nếu:
B <
θ
m
1
(1 −θ
1

)
n−m
θ
m
0
(1 −θ
0
)
n−m
< A
⇔ln B < m ln

θ
1
θ
0

+ (n − m) ln

1 −θ
1
1 −θ
0

< ln A
⇔ln B < −n ln

1 −θ
0
1 −θ

1

+ m ln

θ
1
(1 −θ
0
)
θ
0
(1 −θ
1
)

< ln A
12
Ta đặt:
s =
ln [(1 − θ
0
)/(1 −θ
1
)]
ln K
c
0
=
ln B
ln K

, c
1
=
ln A
ln K
, K =
θ
1
(1 −θ
0
)
θ
0
(1 −θ
1
)
m là số lượng phế phẩm hoặc thành phẩm (X
i
= 1) trong số n quan sát. Khi
đó tại bước thứ n miền để tiếp tục lấy mẫu là:
c
0
+ sn < m < c
1
+ sn
Trong mặt phẳng của n và m. Miền tiếp tục lấy mẫu nằm giữa 2 đường có
chung hệ số góc và chắn c
0
và c
1

. Mỗi điểm mẫu (n, m) khi phác họa trên mặt
phẳng này có tọa độ nguyên. Hai quy trình được xác định bởi cặp chắn (c
0
, c
1
)
và (c

0
, c

1
) là tương đương nếu không có điểm (n, m) (0 ≤ m ≤ n) nào giữa các
đường y = c
0
+ sx và y = c
0

+ sx và giữa các đường y = c
1
+ sx và y = c
1

+ sx
Anderson và Friedman(1960) chỉ ra rằng nếu hệ số góc là hữu tỉ thì đó là một
số đếm được của SPRT và nếu hệ số góc là vô tỉ thì là một số không đếm được.
2.2 SPRT: Kết thúc hữu hạn và bị chặn
Lý do ta dùng một phân tích liên tiếp đó là : ta có thể kết thúc thí nghiệm
sớm hơn là dùng quy trình cỡ mẫu cố định. Khi đó chúng ta cần đảm bảo
rằng quy trình liên tiếp sẽ kết thúc hữu hạn với xác suất 1. Ta có kết quả của

Stein(1946) và Wald(1947).
Định lí 2.2.1. Cho Z = ln

f(X,θ
1
)
f(X,θ
0
)

. Trong đó ta muốn kiểm định H
0
: f(x) =
f
0
(x)|H
1
: f(x) = f
1
(x) khi đó Wald’s SPRT kết thúc hữu hạn với xác suất 1,
điều kiện P (Z = 0) < 1.
Khi ta làm việc với một họ những mật độ được chỉ ra bởi một tham số
θ , Z = ln

f(X,θ
1
)
f(X,θ
0
)


. Trong đó f(x; θ
0
), f(x; θ
1
) lần lượt là hàm mật độ của
những giả thiết H
0
và H
1
. Nói chung có thể chỉ ra rằng nếu N là thời điểm
dừng của SPRT: P (N > kr) ≤ (1 − q
r
)
k
Trong đó k và r là số nguyên dương
do P (Z = 0) < 1, ∃d > 0 và q > 0 sao cho: hoặc P (Z > d) ≥ q hoặc
13
P (Z < −d) ≥ q.
Ở trường hợp trước chọn số nguyên r: r d > ln

A
B

Ở trường hợp sau chọn số nguyên r : −r d < −ln

A
B

Bây giờ {N = ∞} = ∩


n=1
{N > n} với {N > n} là đơn điệu giảm. Do đó:
P (N là không hữu hạn) = lim
n→∞
P (N > n) = lim
k→∞
(N > kr)
Chú ý rằng P (N > n) là dãy các xác suất đơn điệu giảm và bị chặn dưới, do đó
có một giới hạn. Giới hạn này cũng là giới hạn của bất kì dãy con nào, đặc biệt
dãy bao gồm tất cả mọi phần tử thứ r của dãy ban đầu. Như vậy:
lim
k→∞
P (N > kr) ≤ lim
k→∞
(1 −q
r
)
k
= 0
Tiếp theo ta sẽ tìm hiểu xem liệu có thể tìm A và B một cách tường minh với
α và β đã cho. Ta có:
α = P

bác bỏ H
0
|H
0

=



i=1
P
H
0

B < Λ
j
< A; j = 1, 2, i − 1 và Λ
i
≥ A

β = P (chấp nhận H
0
|H
1
) =


i=1
P
H
1

B < Λ
j
< A; i = 1, 2, i −1 và Λ
i
≤ B


Tuy nhiên không dễ dàng dùng những biểu thức này để ước lượng A và B. Trong
đó :
Λ
n
=
n

i=1

f
1
(x
i
)
f
2
(x
i
)

Định lí 2.2.2. Cho Wald’s SPRT. Ta có: A ≤ (1 −β) /α và B ≥ β/ (1 − α)
Chứng minh. Cho X = (X
1
, X
2
, X
k
) và cho E
k

là tập hợp tất cả các điểm
(trong không gian Euclid k - chiều R
k
) mà tại đó ta bác bỏ H
0
khi sử dụng SPRT.
F
k
là tập tất cả các điểm tại đó ta chấp nhận H
0
. Chú ý rằng (E
k
, k = 1, 2, )là
rời nhau. (F
k
, k = 1, 2, ) là rời nhau.
Giả sử, không mất tổng quát rằng: P
H
i
(∪E
k
∪ ∪F
k
) = 1, i = 0, 1 .
P (N = ∞) = 0 được thỏa mãn khi P(Z = 0 )< 1 (xem định lý 2.2.1). Chú ý
rằng Z sẽ đồng nhất bằng 0 nếu và chỉ nếu f
1
(x) và f
0
(x) đồng nhất tại mỗi x.

Điều kiện yếu P (Z = 0) < 1 sẽ được thỏa mãn với điều kiện biến ngẫu nhiên X
là không tập trung trên tập của những điểm x mà có f
1
(x) = f
0
(x). Khi đó :
α = P
H
0
(bác bỏ H
0
) = P
H
0
(∪E
k
) =


k=1
P
H
0
(E
k
)
14
1 −β = P
H
1

(bác bỏ H
0
) =


k=1
P
H
1
(E
k
)
Vì f
1
(x) ≥ Af
0
(x) với mọi x ∈ E
k
ta có :
α =


k=1
P
H
0
(E
k
) =



E
k
f
0
(x) dx ≤

A
−1

E
k
f
1
(x) dx = A
−1
(1 −β) (2.1)
Do đó :
1
A
>
α
1 −β
(2.2)
Tương tự:
β =


k=1
P

H
1
(F
k
) =


F
k
f
1
(x)dx ≤

B

F
k
f
0
(x)dx −B(1 −α)
Vì 1 −α = P
H
0
(chấp nhận H
0
) =


k=1
P

H
0
(F
k
) Vì vậy : B > β/(1 − α)
Hệ quả 2.2.3. Nếu A = (1 − β) /α và B = β/ (1 −α) thì α = (1 − B) / (A −B)
và β = B (A −1) / (A −B)
Ví dụ 2.2.4. Cho θ là xác suất của một sản phẩm bị lỗi. Tại bước thứ n, ta
làm thêm một quan sát nếu :
B <
θ
r
1
(1 −θ
1
)
n−r
θ
r
0
(1 −θ
0
)
n−r
< A
⇔B

1 −θ
0
1 −θ

1

n
<

θ
1
(1 −θ
1
)
θ
0
(1 −θ
1
)

r
< A

1 −θ
0
1 −θ
1

n

n ln

1−θ
0

1−θ
1

+ ln B
ln

θ
1
(1−θ
0
)
θ
0
(1−θ
1
)

< r <
n ln

1−θ
0
1−θ
1

+ ln A
ln

θ
1

(1−θ
1
)
θ
0
(1−θ
0
)

Nói cách khác: BĐT tiếp tục lấy mẫu viết ở dạng: nC + D

< r < n.C + D với
r là số lượng các phế phẩm. C, D, D

là hàm của A, B, θ
0
, θ
1
Ví dụ 2.2.5. Cho θ
0
= 1/2, θ
1
= 0.8 trong ví dụ (2.2.4). Khi đó :
Λ
n
=
(0, 8)
r
.(0, 2)
n−r

(0, 5)
r
.(0, 5)
n−r
= 4
r

2
5

n
15
Tại bước thứ n ta làm thêm một quan sát nếu:
B < Λ
n
< A
⇔B < 4
r

2
5

n
< A
⇔B

5
2

n

< 4
r
< A

5
2

n

ln B + n ln(5/2)
2 ln 2
< r <
ln A + n ln(5/2)
2 ln 2
Cho α = 0, 2, β = 0, 2, ta có
B
.
=
2
8
=
1
4
, A
.
=
0, 8
0, 2
= 4
Giả sử rằng chúng ta quan sát D, G, G, D, D, D, D, D, D, D, D, D. Với D là ký

hiệu của một phế phẩm và G là một thành phẩm. Miền tiếp tục lấy mẫu là:
n ln(5/2)
2 ln 2
− 1 < r <
n ln(5/2)
2 ln 2
+ 1
0, 65n − 1 < r < 0, 65n + 1
Với n = 1 : −0, 35 < r < 1, 65, quan sát thứ nhất có 1 phế phẩm, r nằm trong
miền tiếp tục lấy mẫu.
.
.
.
Với n = 8 : 4, 2 < r < 6, 2, ở quan sát thứ 8, số phế phẩm là : r = 6, vậy r nằm
trong miền tiếp tục lấy mẫu. Ta thực hiện thêm một quan sát.
Với n = 9 : 4, 85 < r < 6, 85 mà ở quan sát thứ 9 thì số lượng phế phẩm là
r = 7 > 6, 85. Do đó, ta bác bỏ H
0
ở quan sát thứ 9.
Ví dụ 2.2.6. (Quy trình cỡ mẫu cố định cho ví dụ 2.2.5) Nếu một mẫu cố định
cỡ n được sử dụng trong ví dụ (2.2.5). Ta sử dụng phương pháp xấp xỉ phân
phối chuẩn để kiểm định θ = θ
0
|θ = θ
1
.
P (r > k|θ
0
=
1

2
) = 0, 2
P (r ≤ k|θ
1
= 0, 8) = 0, 2
Tức là:
1 −Φ

k − n/2
(n/4)
1/2

.
= 0, 2
⇔Φ

k − n/2
(n/4)
1/2

.
= 0, 8 = Φ(0, 84)
16
Và :
Φ

k − 0, 8n
(0, 16n)
1/2


.
= 0, 2 = Φ(−0, 84)
hay:

k − n/2 = 0, 84

n/2
k − 0, 8n = −0, 84

n(0, 4)


0, 3n = 0, 84

n(0, 9)

n = 0, 84.3 = 2, 52
Do đó: n
.
= 7 và k = 5, 32.
Giá trị chính xác, sử dụng bảng nhị thức: n = 10, k = 6.
Vậy khi sử dụng quy trình liên tiếp ta có thể kết thúc quá trình lấy mẫu
sớm hơn so với sử dụng quy trình mẫu cố định.
2.3 Hàm OC (θ)
Wald(1947) đã tìm ra phương pháp khéo léo để có được các đặc trưng sử dụng
(OC)(xác suất chấp nhận H
0
) của một SPRT. Xét một SPRT xác định bởi hằng
số A, B cho trước với B < 1 < A, để kiểm định : H
0

: f = f
0
(x) = f(x; θ
0
)|H
1
:
f = f
1
(x) = f(x; θ
1
). Nếu θ
0
và θ
1
chỉ là 2 trạng thái của tự nhiên (states of
nature), khi đó không có điểm nào trong hàm OC (θ) đang xét. Tuy nhiên nếu
giả thiết kiểm định trên là một giả thiết đơn giản, ví dụ: H
0
: θ ≤ θ

|H
1
: θ ≥ θ

khi đó người ta sẽ quan tâm đến OC(θ) ∀ giá trị có thể của θ. Cho θ là cố định
và xác định như một hàm mà trong đó θ là giá trị của h ( = 0) và :
E
θ



f (X; θ
1
)
f (X; θ
0
)

h

= 1
Kỳ vọng này là 1 khi h = 0 nhưng có một giá trị của h mà giá trị của nó cũng
là 1. Chẳng hạn, h = 1 nếu θ = θ
0
và h = −1 nếu θ = θ
1
Công thức trên có thể
viết như sau :
+∞

−∞

f (x; θ
1
)
f (x; θ
0
)

h

f (x, θ) dx = 1
17
Ta xác định hàm mật độ:
f

(x; θ) =

f (x; θ
1
)
f (x; θ
0
)

h
f (x; θ)
Xét bài toán bổ trợ của kiểm định:
H : f = f(x; θ)|H

: f = f

(x; θ)
là giả thiết đơn, đối thiết đơn cho h, θ cố định. Vì vậy tiếp tục lấy mẫu(trong
kiểm định H|H

)nếu:
B

= B
h

<

f

(x
i
; θ)

f (x
i
; θ)
=


f (x
i
; θ
1
)
f (x
i
; θ
0
)

h
< A
h
= A


Sau lũy thừa thứ 1/h, (h > 0) ta thu được bất đẳng thức giống như đã dùng để
tiếp tục lấy mẫu trong bài toán kiểm định H
0
|H
1
. Do đó:
P
θ
(chấp nhận H
0
) = P
θ
(chấp nhận H) = P
H
(chấp nhận H) = 1 − α

α

là độ lớn của sai lầm loại 1 trong bài toán bổ trợ. Tuy nhiên giải phương
trình:
B
h
.
=
β

1 −α

; A
h

.
=
1 −β

α

ta nhận ra:
α

.
=
1 −B
h
A
h
− B
h
. Do đó
OC(θ)
.
=
A
h
− 1
A
h
− B
h
là một hàm của h.
Nếu h < 0 ta đặt B


= A
h
và A

= B
h
. Khi đó
P
θ
(chấp nhận H
0
) = P
0
(bác bỏ H) = α

. Với
α

=
1 −B

A

− B

=
1 −A
h
B

h
− A
h
=
A
h
− 1
A
h
− B
h
Tiến hành tương tự với OC(θ) trong trường hợp h > 0. Tuy nhiên, h là một
hàm của θ và ở đây có 2 hệ thức để xác định đường cong tham số đặc trưng sử
dụng OC(θ). Mỗi giá trị của h xác định một θ và một giá trị của P
θ
(chấp nhận
18
H
0
), một điểm trên đường cong OC. Đẳng thức giữa h và θ không cung cấp một
giá trị rõ ràng của θ khi h = 0, vì biểu thức này thỏa mãn ∀θ. Tuy nhiên, người
ta có thể ước lượng được giới hạn của OC(θ) khi h → 0 bằng cách sử dụng luật
I’hospital. Như vậy:
lim
h→0
OC (θ) =
ln A
ln A − ln B
Ta biết: OC(θ
0

) = 1 - α, OC(θ
1
) = β, lim
h→∞
OC (θ) = 1, và lim
h→−∞
OC (θ) = 0
Do B < 1 < A. Vì vậy ta thu được bảng các giá trị xấp xỉ sau:
h -∞ -1 0 1 ∞ h
θ - θ
1
- θ
0
- -
OC 0 β
lnA
lnA−lnB
1 -α 1
A
h
−1
A
h
−B
h
Ví dụ 2.3.1. xét bài toán kiểm định: θ = θ
0
|θ = θ
1
> θ

0
trong một tập hợp
Bernoulli.
Ở đây:
E
θ


f(X; θ
1
)
f(X; θ
0
)

h

= E
θ




θ
x
1
(1 −θ
1
)
1−x

θ
x
0
(1 −θ
0
)
1−x

h



= θ

θ
1
θ
0

h
+(1 − θ)

1 −θ
1
1 −θ
0

h
Cho biểu thức trên bằng 1. Giải với ẩn θ ta được:
θ =

1 −[(1 −θ
1
)/(1 − θ
0
)]
h

1

0
)
h
− [(1 − θ
1
)/(1 −θ
0
)]
h
Khi h → 0 sử dụng luật I’hospital để tính giới hạn, ta có:
lim
h→0

1 −

1−θ
1
1−θ
0

h





θ
1
θ
0

h


1−θ
1
1−θ
0

h


= lim
h→0


−θ
1
1−θ
0

h

ln

1−θ
1
1−θ
0


θ
1
θ
0

h
ln
θ
1
θ
0


1−θ
1
1−θ
0

h
ln

1−θ

1
1−θ
0

=
−ln [(1 − θ
1
)/(1 −θ
0
)]
ln (θ
1

0
) −ln [(1 − θ
1
)(1 −θ
0
)]
Vậy ta có khi h → 0 thì:
θ =
−ln [(1 − θ
1
)/(1 −θ
0
)]
ln (θ
1

0

) −ln [(1 − θ
1
)(1 −θ
0
)]
19
Dễ thấy : lim
h→∞
θ = 0; lim
h→−∞
θ = 1
Nếu θ
0
= 0, 5; θ
1
= 0, 8 và α = β = 0, 01. Ta được:
θ =
1 −(2/5)
h
(1, 6)
h
− (2/5)
h
=
5
h
− 2
h
8
h

− 2
h
và bảng sau:
h −∞ -1 0 1 ∞
θ 1 0,8 0,661 0,5 0
OC 0 0,01 0,5 0,99 1
2.4 Số trung bình mẫu
Cỡ mẫu cần thiết để quyết định kế hoạch lấy mẫu liên tiếp hoặc lấy mẫu
đôi là một biến ngẫu nhiên N. Sự phân phối của biến ngẫu nhiên này phụ thuộc
vào phân phối thực của các quan sát trong suốt quá trình lấy mẫu. Đặc biệt, ta
quan tâm đến ước lượng E(N), cỡ mẫu trung bình (ASN).
Trong mục (2.2) đã chỉ ra rằng với tiêu chuẩn SPRT, N là hữu hạn với xác suất
1, do đó N có thể nhận giá trị 1,2,3 với các xác suất P
1
, P
2
, và

P
i
= 1.
Mô men của N không thể tính toán rõ ràng. Tuy nhiên, người ta có thể chỉ ra
rằng (giả sử P (Z = 0) < 1): E(N
i
) < ∞, ∀i. Xét:
E(N
i
) =

1

i
P
1
+ 2
i
P
2
+ + r
i
P
r

+

(r + 1)
i
P
r+1
+ + (2r)
i
P
2
r

+
≤ r
i

r


j=1
P
j

+ (2r)
i

r

j=1
P
r+j

+ (3r)
i

r

j=1
P
2r+j

+
bây giờ :
r

j=1
P
j
,

r

j=1
P
r+j
< 1 − q
r
,
r

j=1
P
2r+j
< (1 − q
r
)
2
,
Theo bất đẳng thức thu được ở mục (2.2): P (N > kr) ≤ (1 − q
r
)
k
, k = 1, 2,
vì:
r

j=1
P
r+j
≤ 1 −

r

j=1
P
j
= P (N > r)
Do đó:
E(N
i
) ≤ r
i
+(2r)
i
(1 −q
r
)+(3r)
r
(1 −q
r
)
2
+ = r
i

1 + 2
i
(1 −q
r
) + 3
i

(1 −q
r
)
2
+

20
Ta có thể thấy dãy trong ngoặc hội tụ bằng cách sử dụng tiêu chuẩn tỉ số với
0 < q ≤ 1 tỉ số của số hạng thứ n + 1 và số hạng thứ n trong dãy trên là

n+1
n

i
(1 −q
r
) giới hạn của nó là nhỏ hơn 1. Do đó E(N
i
) < ∞. Thực tế, có
thể thấy (giả sử P (Z = 0) < 1) hàm sinh các momen của N là hữu hạn. Xét:
M
N
(t) = E(e
N
t) =

e
t
P
1

+ e
2t
P
2
+ + e
rt
P
r

+

e
(r+1)t
P
r+1
+ + e
2rt
P
2r

≤ e
rt

r

j=1
P
j

+ e

2rt


r
lim
j=1
P
r+j

+
≤ e
rt
e
2rt
(1 −q
r
) + e
3rt
(1 −q
r
)
2
+
=
e
rt
[1 −e
rt
(1 −q
r

)]
cho e
rt
(1 −q
r
) < 1 ⇒ t ∈ (−∞; 0).
Nếu một quyết định được đưa ra ở bước thứ n, Λ
n
là phân phối xấp xỉ như một
biến Becnulli với giá trị B và A. Và:
E(ln Λ
N
)
.
= (ln B) P (ln Λ
n
= ln B) + (ln A) P (ln Λ
N
= ln A)
= ln B.P

chấp nhậnH
0

+ ln A.P

bác bỏH
0

Ở đây kì vọng và các xác suất là đối với phân phối thực. Vậy:

E
θ
0
(ln Λ
N
)
.
= ln B (1 − α) + (ln A) α
và:
E
θ
1
(ln Λ
n
)
.
= (ln B) β + (ln A) (1 − β)
tuy nhiên
ln Λ
N
= Z
1
+ Z
2
+ + Z
n
một tổng ngẫu nhiên của các biên ngẫu nhiên độc lập, cùng phân phối, với :
Z
i
= ln


f(X
i
, θ
1
)
f(X
i
; θ
0
)

Bây giờ, sử dụng phương pháp đơn giản của Wolfowitz và Johnson, ta sẽ thấy
rằng E (lnΛ
N
) = E (N) E (Z). Cho Z, Z
1
, Z
2
, là một dãy biến ngẫu nhiên đôc
lập cùng phân phối và N là một biến ngẫu nhiên với giá trị 1,2, như vậy biến
cố (N ≥ i) là độc lập với Z
i
, Z
i+1
,
Cho
Y
i
=


0 nếu N < i
1 nếu N ≥ i
21
khi đó biến cố (N = i) được quyết định bởi ràng buộc trên Z
1
, Z
2
, Z
i
và do đó
là độc lập với Z
i+1
, i = 1, 2 Ta cũng có: {N ≥ i} =

i−1

j=1
{N = j}

là độc lập
với Z
i
, Z
i+1
, như vậy :
E (Z
1
+ Z
2

+ + Z
n
) = E



i=1
Y
i
Z
i

=


i=1
E (Y
i
Z
i
)
=


i=1
E(Y
i
)E(Z
i
)

= E(Z)


i=1
E(Y
i
)
vì Y
i
phụ thuộc vào Z
1
, Z
2
, , Z
i−1
và do đó phụ thuộc vào Z
i
đã cho. Sự hoán
vị giữa tổng hữu hạn và kì vọng là hợp lý, và:


i=1
E(Y
i
) =


i=1
P (N ≥ i) =



i=1


j=1
P (N = j)
=


j=1
j

i=1
P (N = j) =


j=1
jP(N = j)
= E(N)
Điều này hoàn toàn chứng minh khẳng định sau: E (ln Λ
N
) = E(Z)E(N)
Sự hoán vị của tổng và kì vọng là có thể xảy ra nếu dãy là chắc chắn hội tụ.
Xét:


i=1
E |(Y
i
Z

i
)| ≤


i=1
E (|Y
i
|) E (|Z
i
|) = E (|Z|) E (|N|) < ∞
Với điều kiện E (|Z|) và E(N) là hữu hạn. Như vậy một ứng dụng của kết quả
cuối cùng đối với dãy
Z
i
= ln

f(X
i
; θ
1
)
f(X
i
; θ
0
)


E(N) =
E(ln Λ

n
)
E(Z)
. Do đó:
E
θ
0
(N)
.
=
α ln A + (1 −α) ln B
E
θ
0
(Z)
(2.3)
22
Và:
E
θ
1
(N)
.
=
(1 −β) ln A + β ln B
E
θ
1
(Z)
(2.4)

Ví dụ 2.4.1. Cho X là phân phối chuẩn với giá trị trung bình: θ và Var(X) =
1, Cho θ
0
= 0, θ
1
= 1; α = β = 0, 01. Khi đó: A = 99 =
1
B
, lnA = 4, 595.
vậy : E
0
(lnΛ
N
) = −(1 −2α)ln99 = −4, 5031
Z = ln

f(X; θ
1
)
f(X; θ
0
)

= X −
1
2
E(Z) = θ −
1
2
E

θ
0
(N) =
4, 5031
1/2
= 9 và E
θ
1
(N) = 9
Với một quy trình cỡ mẫu cố định thì n = 22 là cần thiết, cỡ mẫu kì vọng có
thể tính được cho bậc tự nhiên khác H
0
và H
1
theo:
E
θ
(N) =
(ln B) π(θ) + (ln A) [1 −π(θ)]
E
θ
(Z)
(2.5)
với : π(θ) = P
θ
(chấp nhận H
0
) = OC(θ)
Ví dụ 2.4.2. Cho X là một biến ngẫu nhiên phân phối đều trên [θ, θ + 2]. Ta
muốn kiểm định H

0
: θ = 0(mật độ f
0
)|H
1
: θ = 1(mật độ f
1
) ta sẽ đạt được
Wald’s SPRT, cỡ mẫu trung bình chính xác và các xác suất phạm sai lầm. Cho
I(a, b) = 1 nếu a ≤ b, và bằng 0 trong những trường hợp còn lại. Khi đó:
Λ
N
=
n

i=1

f
1
(X
i
)
f
0
(X
i
)

=
I


X
(n)
, 3

I

1, X
(1)

I

X
(n)
, 2

I

0, X
(1)

X
(n)
và X
(1)
lần lượt là số quan sát lớn nhất và nhỏ nhất trong mẫu. Do đó quy
tắc là:
- Tại bước thứ n chấp nhận H
0
nếu X

(1)
< 1 và X
(n)
< 2 khi đó (Λ
n
= 0).
- Tại bước thứ n làm thêm một quan sát nếu 1 ≤ X
i
≤ 2(i = 1, 2 ) khi đó
Λ
n
= 1.
- Tại bước thứ n bác bỏ H
0
nếu X
(1)
> 1 và X
(n)
> 2, Λ
n
= ∞
23
Kí hiệu N là cỡ mẫu ngẫu nhiên cần thiết. Khi đó:
P
0
(n) =P (N = n|H
0
)
=P


N = n, bác bỏ H
0
|H
0

+ P

N = n, chấp nhận H
0
|H
0

=P

1 ≤ X
i
≤ 2, i ≤ n −1, X
(1)
> 1vàX
(n)
> 2|H
0

+ P

1 ≤ X
i
≤ 2, i ≤ n −1, X
(1)
< 1vàX

(n)
< 2|H
0

=P

1 ≤ X
i
≤ 2, i ≤ n −1, X
(n)
> 2|H
0

+ P

1 ≤ X
i
≤ 2, i ≤ n −1, X
(n)
< 1|H
0

=

1
2

n−1

1

2

+

1
2

n−1
(0)
=

1
2

n
Tương tự:
P
1
(n) =P (N = n|H
1
)
=P

N = n, bác bỏ H
0
|H
1

+ P


N = n, chấp nhận H
0
|H
1

=P

1 ≤ X
i
≤ 2, i ≤ n −1, X
(1)
> 1 và X
(n)
> 2|H
1

+ P

1 ≤ X
i
≤ 2, i ≤ n −1, X
(1)
< 1vàX
(n)
< 2|H
1

=P

1 ≤ X

i
≤ 2, i ≤ n −1, X
(n)
> 2|H
1

+ P

1 ≤ X
i
≤ 2, i ≤ n −1, X
(n)
< 1|H
1

=

1
2

n−1
(0) +

1
2

n−1

1
2


=

1
2

n
E(N|H
0
) =


n=1
n

1
2

n
= 2, và E (N|H
1
) = 2



n=1

n
= θ



n=1

n−1
= θ


∂θ



n=1
θ
n
=
θ
(1 −θ)
2
và P(sai lầm loại 1)
α =


n=1
P

1 ≤ X
i
≤ 2, i ≤ n −1, X
(1)
> 1 và X(n) > 2|H

0

= 0
tương tự : β = 0
24
Momen cao hơn của tổng dừng ngẫu nhiên được bắt nguồn bởi Chow, sau
đây ta sẽ phát biểu kết quả của họ cho moment thứ 2.
Cho (Ω, F, P ) là không gian xác suất và Z
1
, Z
2
, là một dãy các biến ngẫu
nhiên trong Ω. Một biến dừng (của dãy {Z
i
}) là một biến ngẫu nhiên với giá trị
nguyên dương. Như vậy biến cố {N = n} chỉ phụ thuộc (Z
1
, Z
2
, Z
n
) ∀n ≥ 1
Cho :
S
n
=
n

i=1
Z

i
. Khi đó:
S
N
=
N

i=1
Z
i
là một tổng dừng ngẫu nhiên. Ta giả sử rằng:
E(Z
n
) < ∞, E (Z
n+1
|Z
1
, Z
2
, Z
n
) = 0 (2.6)
Định lý Wald phát biểu rằng cho Z
i
độc lập, cùng phân phối với E(Z
i
) = 0,
E(N) < ∞ nghĩa là E(S
N
) = 0. Ta có kết quả sau của Chow, Robbins và

Teicher (1965).
Định lí 2.4.3. Cho Z
1
, Z
2
, là độc lập với E(Z
n
) = 0, E|Z
n
| = a
n
, E(Z
n
)
2
=
σ
2
n
< ∞(n ≥ 1) và S
n
=

n
i=1
Z
i
. Khi đó nếu N là một biến dừng, và :
E


N

i=1
a
i

< ∞ hoặc E

N

i=1
σ
2
i

< ∞ (2.7)
Nghĩa là : E(S
N
) = 0 và:
E(S
2
N
) = E

n

i=1
Z
2
i


= E

n

i=1
σ
2
i

(2.8)
Nếu σ
2
n
= σ
2
< ∞ khi đó E(N) < ∞ tức là:
E(S
2
N
) = E

n

i=1
Z
2
i

= σ

2
E(N) (2.9)
Hệ quả 2.4.4. Nếu E(Z
n
) = 0, thì E(N) =

S
2
N

/E

Z
2

, nó được biết đến
như phương trình Wald thứ 2.
25

×