BÀI THẢO LUẬN
MÔN LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN
A. LÝ THUYẾT
I. Ước lượng các tham số của ĐLNN
Xét một ĐLNN X thể hiện trên một đám đông nào đó. Các số đặc trưng của X được
gọi là các tham số lý thuyết (hay tham số của đám đông). Ký hiệu chung tham số lý thuyết
cần ước lượng là
θ
. Có hai phương pháp ước lượng
θ
là:
• Ước lượng điểm
• Ước lượng bằng khoảng tin cậy.
1. Ước lượng bằng khoảng tin cậy
Để ước lượng tham số θ của ĐLNN X, trước hết từ đám đông ta lấy ra mẫu ngẫu nhiên
W=(X
1
,X
2
, … , X
n
). Tiếp đến ta xây dựng thống kê G=f(X
1
,X
2
, … , X
n,
θ), sao cho quy luật
phân phối xác suất của G hoàn toàn xác định (không phụ thuộc vào tham số θ). Với xác suất γ
= 1 – α cho trước, ta xác định cặp giá trị α
1,
α
2
thỏa mãn các điều kiện α
1
≥ 0, α
2
≥ 0 và α
1
+ α
2
= α. Vì quy luật phân phối xác suất của G ta đã biết, ta tìm được các phân vị g
1-α1
và g
α2
sao
cho P(G > g
1-α1
) = 1 – α
1
và P(G > g
a2
)= α
2
.
Khi đó: P(g
1-α1
< G < g
a2
) = 1 - α
1
- α
2
= 1 – α = γ.
Cuối cùng bằng cách biến đổi tương đương ta có:
P(θ
*
1
< θ < θ
*
2
) = 1 – α = γ
Trong đó: γ = 1 – α
*
được gọi là là độ tin cậy,
(θ
*
1
, θ
*
2
) được gọi là độ tin cậy,
I = θ
*
2
– θ
*
1
được gọi là độ dài của khoảng tin cậy.
Người ta thường chọn α
1
= α
2
= α/2. Nếu chọn α
1
= 0 và α
2
= α hoặc chọn α
1
= α và α
2
= 0 thì ta sẽ có khoảng tin cậy một phía (dùng để ước lượng giá trị tối thiểu hoặc giá trị tối đa
của θ).
2. Ước lượng các tham số của ĐLNN
2.1 Ước lượng kỳ vọng toán của ĐLNN
Để ước lượng kỳ vọng toán E(X) = µ của ĐLNN X, từ đám đông ta lấy mẫu
W=(X1,X2,…,Xn). Từ mẫu này ta tìm được trung bình mẫu X và phương sai mẫu điều chỉnh
S’² . Ta sẽ ước lượng µ thông qua
X
. Xét các trường hợp sau:
a) ĐLNN X trên đám đông có phân phối chuẩn đã biết.
b) ĐLNN X trên đám đông có phân phối chuẩn chưa biết.
c) Chưa biết quy luật phân phối xác suất của X nhưng n>30.
Khi n lớn,
X
có phân phối xấp xỉ chuẩn. Mặt khác ta luôn có
( )
E X
µ
=
và
( )
2
Var X
n
σ
=
(
)
2
,X N
n
σ
µ
⇒ ;
Ta xây dựng thống kê: U=~ N(0,1).
Khoảng tin cậy đối xứng ( lấy α1 = α2 = α/2)
Với độ tin cậy γ= 1 – α cho trước ta tìm được phân vị chuẩn
2
u
α
sao cho:
P(|U| <
2
u
α
) = 1 – α =γ
Thay biểu thức của U vào công thức trên ta có:
P(|
X
- µ| <
2
u
α
) = 1 – α =γ
P(
X
– ε < µ <
X
+ ε ) = 1 – α =γ
Trong đó :
ε =
2
u
α
là sai số của ước lượng
γ = 1 – α là độ tin cậy
(
X
– ε;
X
+ ε) là khoảng tin cậy ngẫu nhiên của µ. Ở đây ta cần chú ý rằng : Với xác suất
bằng γ = 1 – α khoảng tin cậy ngẫu nhiên này chụp đúng µ (µ là 1 số xác định )
Trong 1 lần lấy mẫu ta tìm được 1 giá trị cụ thể
x
của
X
. Khi đó ta có 1 khoảng tin cậy cụ
thể của µ là (
x
– ε;
x
+ ε)
Ta có những bài toán sau:
Bài toán 1: Biết kích thước mẫu n, biết độ tin cậy γ = 1 – α, tìm sai số ε ( hoặc khoảng tin
cậy ). Vì biết γ = 1 – α tra bảng ta tìm được
2
u
α
, từ đó ta tìm được sai số ε =
2
u
α
và khoảng
tin cậy của µ
Bài toán 2: Biết kích thước mẫu n và sai số ε, cần tìm độ tin cậy γ. Biết n và ε, ta tìm được
2
u
α
.tra bảng tìm được α/2 từ đó tìm được độ tin cậy γ = 1 – α
Từ công thức tìm khoảng tin cậy ta thấy rằng sai số của ước lượng bằng 1 nửa độ dài
của khoảng tin cậy. Vì vậy nếu biết khoảng tin cậy đối xứng (a,b) thì ta có thể tính được sai
số của ước lượng theo công thức
ε=
Bài toán 3: Biết độ tin cậy γ, biết sai số ε, cần tìm kích thước mẫu n. Biết γ = 1 – α, ta tìm
được
2
u
α
. Ta tìm được
2 2
2
2
u
n
α
σ
ε
=
Đó chính là kích thước mẫu tối thiểu cần tìm.
Chú ý 1 : Nếu chưa biết σ, nhưng kích thước mẫu lớn (n>30). Ta có thể thay σ bằng ước
lượng không chệch tốt nhất của nó là s’
Chú ý 2 : Trong trường hợp biết µ cần ước lượng
X
biến đổi tương đương công thức ta
có:
P( µ - ε <
X
< µ + ε ) = 1 – α = γ
Vậy khoảng tin cậy của
X
là ( µ - ε, µ + ε ).
Khoảng tin cậy phải (lấy
1 2
0,
α α α
= =
; dùng để ước lượng giá trị tối thiểu của µ)
Ta vẫn dùng thống kê
( )
0;1
X
U N
n
µ
σ
−
= ;
Với độ tin cậy γ = 1-α cho trước ta tìm được phân vị chuẩn
u
α
sao cho:
P(U<
u
α
)=1-α=γ
Thay vào biểu thức của U vào công thức trên ta có:
P (
X
u
n
α
µ
σ
−
<
) = 1 – α = γ
1P X u
n
α
σ
µ α γ
⇔ − < = − =
÷
Như vậy, khoảng tin cậy phải đối với độ tin cậy γ = 1 – α của µ là:
;X
n
σ
− +∞
÷
Khoảng tin cậy trái (lấy α2 = 0 ; α1 = α, dùng để ước lượng giá trị tối đa của µ)
Ta cũng dùng thống kê :
( )
0;1
X
U N
n
µ
σ
−
= ;
Với độ tin cậy γ = 1 – α cho trước ta tìm được
u
α
sao cho:
P(-
u
α
<U) = 1 – α = γ
1P X u
n
α
σ
µ α γ
⇒ < + = − =
÷
Ta có khoảng tin cậy trái với độ tin cậy γ = 1 – α của µ là
; X u
n
α
σ
+∞ +
÷
2.2 Ước lượng tỷ lệ.
2.3 Ước lượng phương sai của ĐLNN phân phối chuẩn.
II. Kiểm định giả thuyết thống kê
1.Một số khái niệm và định nghĩa
1.1 Giả thuyết thống kê
Giả thuyết về quy luât phân phối xác suất của ĐLNN về tham số đặc trưng của đại
lựơng ngẫu nhiên hoặc tính độc lập của các ĐLNN được gọi là giả thuyết thống kê,kí hiệu là
Ho.
Mọi giả thuyết khác với giả thuyết H đươc gọi là đối thuyết,kí hiêu là H1.Ho và H1 lập
thành một cặp giả thuyết thống kê. Ta quy định: khi đã chọn cặp giả thuyết Ho và H1 thì nếu
bác bỏ Ho sẽ chấp nhận H1.
1.2 Tiêu chuẩn kiểm định
Để kiểm đinh cặp giả thuyết thống kê Ho và H1,từ đám đông ta chọn mẫu ngẫu
nhiên:W=(X1,…,Xn).dựa vào mẫu trên ta xây dưng thống kê
( )
1 0
,..., ,
n
G f X X
θ
=
.
Trong đó
0
θ
là một số tham số liên quan đến Ho sao cho nếu đúng Ho thì quy luật
phân phối xác suất của G hoàn toàn xác định. Khi đó thống kê G được gọi là tiêu chuẩn kiểm
định.
1.3 Miền bác bỏ
Để xây dựng miền bác bỏ ta sử dụng nguyên lý xác suất nhỏ:Nếu một biến cố có xác
suất nhỏ ta có thể coi nó không xảy ra trong một lần thực hiện phép thử.
Vì đã biết quy luật phân phối xác suất của G, nên với một số α khá bé cho trước ta có thể tìm
được miền Wα gọi là miền bác bỏ, sao cho nếu giả thuyết Ho đúng thì xác suất để G nhận giá
trị thuộc miền Wα bằng α:
P(G
∈
Wα/Ho)=α
Vì α khá bé theo nguyên lý xác suất nhỏ ta có thể coi biến cố (G
∈
Wα/Ho) không xảy
ra trong một lần thưc hiện phép thử.Nên nếu từ một mẫu cụ thể w=(x1,.., xn) ta tìm được giá
trị thực nghiệm
( )
1 0
,...., ,
tn n
g f x x
θ
=
mà
tn
g W
α
∈
(Nghĩa là vừa thực hiện phếp thử thấy
biến cố (G
∈
Wα/Ho) xảy ra)ta có cơ sở bác bỏ giả thuyết Ho.
Kí hiêu
W
α
là miền bù của Wα. Khi đó ta có
( )
0
1P G W W
α
α
∈ = −
. Vì α khá bé
nên 1-α khá gần 1. Theo nguyên lý xác suất lớn: Nếu một biến cố có xác suất rất gần 1 ta có
thể coi nó sẽ xảy ra trong một lần thực hiện phép thử, nếu trong một lần lấy mẫu ta thấy
tn
g W
α
∈
thì giả thuyết Ho tỏ ra hợp lí,chưa có cơ sở bác bỏ Ho. Vì vậy ta có quy tắc kiểm
định sau:
Từ đám đông ta lấy ra một mẫu cụ thể kích thước n: w=(x1,…,xn) và tính
tn
g
• Nếu
tn
g W
α
∈
thì bác bỏ Ho chấp nhận H1
• Nếu
tn
g W
α
∉
thì chưa có cơ sở bác bỏ Ho.
1.4 Các loại sai lầm
Theo quy tắc kiểm định trên ta có thể mắc hai loại sai lầm như sau:
• Sai lầm loại một là loại sai lầm bác bỏ giả thuyết Ho khí chính Ho đúng. Ta có xác
suất mắc sai lầm loại một bằng α. Giá tri α được gọi là mức ý nghĩa.
• Sai lầm loai hai là sai lầm chấp nhận Ho khi chính nó sai.Nếu ký hiệu xác suất mắc sai
lầm loại hai là ß thì ta có.
( )
1
/P G W H
α
β
∈ =
2. Các trường hợp kiểm định
2.1.Kiểm định giả thuyết về kỳ vọng toán của một ĐLNN
Giả sử cần nghiên cứu một dấu hiệu X thể hiện trên một đám đông. Kí hiệu E(X) =
µ, Var(X) = σ
2
, trong đó µ chưa biết, từ một cơ sở nào đó người ta tìm được µ = µ
0
, nhưng
nghi ngờ về điều này. Với mức ý nghĩa α cho trước ta cần kiểm định giả thuyết H
0
: µ = µ
0
.
Từ đám đông ta lấy ra mẫu : W=( ,……, ) và tính được các đặc trưng mẫu:
=
S’
2
=
a) ĐLNN X trên đám đông có phân phối chuẩn đã biết.
b) ĐLNN X trên đám đông có phân phối chuẩn chưa biết.
c) Chưa biết quy luật phân phối xác suất của X nhưng n>30.
Khi n lớn,
X
có phân phối xấp xỉ chuẩn. Mặt khác ta luôn có
( )
E X
µ
=
và
( )
2
Var X
n
σ
=
(
)
2
,X N
n
σ
µ
⇒ ;
* Xây dựng tiêu chuẩn kiểm định (XDTCKĐ):