Ước lượng tham số của tổng thể
Nguồn: thunhan.wordpress.com
(Nội dung phần này được trích từ giáo trình XSTK của Dự án Đào tạo giáo
viên THCS – tác giả Nguyễn Đình Hiển – NXB Đại học Sư Phạm Hà Nội)
Sau khi lấy mẫu và tính một số thống kê ta phải dùng các thống kê để ước lượng
các tham số của tổng thể. Có 2 cách tiếp cận:
1. Ước lượng điểm: Giả sử tổng thể có tham số Θ, sau khi khảo sát mẫu ta tính
được các thống kê, dựa vào các thống kê để đưa ra 1 số T thay thế Θ gọi là ước
lượng điểm của Θ.
• Không chệch: hiểu 1 cách đơn giản là ước lượng không chứa sai số hệ
thống, tức là không thiên về phía đưa ra các giá trị bé hơn Θ hoặc không
thiên về phía đưa ra các giá trị lớn hơn Θ
.
• Hiệu quả: trong các ước lượng có cùng tính chất, chọn ước lượng có
phương sai nhỏ nhất.
• Vững: khi tăng dung lượng mẫu n lên vô hạn thì ước lượng sẽ dần đến Θ
(dần đến theo xác suất).
• Chắc hay bền: không thay đổi nhiều khi trong mẫu có các số liệu quá nhỏ
hay quá lớn.
Nếu không thể chọn ước lượng tốt trên mọi phương diện thì, tùy theo mục đích, có
thể chọn ước lượng thỏa mãn 1 số tiêu chuẩn trong rất nhiều tiêu chuẩn đưa ra.
Ví dụ:
• Khi có phân phối chuẩn N(μ;σ
2
) thì ước lượng trên nhiều mặt là trung bình
cộng và phương sai mẫu σ
2
• Khi có phân phối nhị thức B(n,p) thì ước lượng tốt của tham số p là tần
suất.
2. Ước lượng khoảng: Đây là cách tiếp cận có nhiều ứng dụng trong các ngành
khoa học đòi hỏi phải thường xuyên xử lí số liệu như sinh học, y học, hóa học,
kinh tế… Theo cách tiếp cận này sau khi tính các thống kê của mẫu quan sát, ta
đưa ra khoảng [a;b] chứa tham số Θ . Cận dưới a và cận trên b tính theo 1 quy tắc
cụ thể dựa trên các thống kê và dựa trên mức độ tin cậy P.
Sau khi chọn mẫu, ta đưa ra khoảng tin cậy [a; b], nếu Θ ở trong [a; b] thì khoảng
tin cậy đưa ra đúng, nếu Θ ở ngoài khoảng [a; b], thì khoảng tin cậy đưa ra sai.
Như vậy mỗi khoảng tin cậy chỉ có thể đúng hoặc sai, xác suất đúng là P, xác suất
sai a = 1 – P, hiểu đơn giản là nếu tính khoảng tin cậy theo quy tắc đã đưa ra thì
trung bình trong 100 trường hợp, P.100 trường hợp có khoảng tin cậy đúng.
Không đi sâu vào lý thuyết, ta đưa ra quy tắc ước lượng tham số cho ba trường
hợp:
2.1. Ước lượng kỳ vọng μ của phân phối chuẩn khi biết phương sai σ
2
Các bước cần làm để ước lượng μ:
+ Chọn mẫu kích thước n, tính trung bình cộng . Chọn mức tin cậy γ (α = 1 - γ
gọi là mức sai cho phép hay mức ý nghĩa).
+ Dùng bảng tích phân hàm Laplace
để tính giá trị tới hạn
, tức là giá trị u sao cho:
+ Ước lượng m theo bất đẳng thức kép:
(1)
Lưu ý: nếu hàm phân phối chuẩn là
thì tính , tức là giá
trị u sao cho:
. Giá trị này ở 1 số sách còn được cho bởi bảng phân
vị chuẩn
Ví dụ: Cân 36 con gà được trọng lượng trung bình . Hãy ước lượng kỳ
vọng μ ở mức tin cậy 99% nếu trọng lượng gà phân phối chuẩn N(μ; 0,09)
Giải:
Với mức tin cậy 99%:
(Hoặc:
Tra bảng phân vị chuẩn
Ta có khoảng ước lượng trung bình:
Hay:
Ví dụ 2: Phân tích vitamin C của 17 mẫu được . Với mức tin cậy 95%,
hạy ước lượng kỳ vọng μ nếu lượng vitamin phân phối chuẩn N(μ;σ
2
) với σ = 3,98
mg
Với mức tin cậy 95%:
(Hoặc:
Tra bảng phân vị chuẩn
Khi đó khoảng ước lượng hàm lượng vitamin trung bình là:
Hay:
2. Ước lượng kỳ vọng của phân phối chuẩn khi không biết phương sai:
TH1: Khi n đủ lớn (n > 30): thay σ ở công thức (1) bằng độ lệch chuẩn hiệu
chỉnh s.
TH2: Khi n < 30
Các bước cần làm để ước lượng m:
+ Chọn mẫu kích thước n, tính trung bình cộng . Tính phương sai mẫu
+ Dùng bảng phân phối Student, tính giá trị tới hạn , tức là giá trị t ở cột
α, dòng n – 1
+ Ước lượng m theo bất đẳng thức kép:
(2)
Ví dụ: Để ước lượng năng suất một giống ngô, người ta theo dõi 25 mảnh ruộng.
Sau khi thu hoạch được
(đơn vị tạ/ha). Giả thiết năng suất ngô
phân phối chuẩn. Mức tin cậy P = 0,95.
Ta có:
. Tra bảng phân phối Student ta được: t(24; 0,05) =
2,064
Vậy khoảng ước lượng năng suất trung bình của giống ngô:
Hay:
3. Ước lượng xác suất p của phân phối nhị thức:
Một tổng thể gồm 2 loại cá thể với số lượng rất lớn, tỉ lệ loại A là p (chưa
biết). Lấy ngẫu nhiên 1 cá thể, có thể coi xác suất được các thể loại A là p. Lấy
ngẫu nhiên n cá thể, trong đó có m cá thể loại A.
Nếu n lớn (n > 100):
+ Lấy mẫu kích thước n, đếm tần số (m) xuất hiện cá thể loại A, tính tần suất
+ Dùng bảng tích phân hàm Laplace
để tính giá trị tới hạn
, tức là giá trị u sao cho:
+ Ước lượng m theo bất đẳng thức kép:
(3)
4. Tính kích thước mẫu khi ước lượng trung bình:
Theo (1), nửa chiều dài khoảng ước lượng: . Nếu muốn ước lượng
đạt độ chính xác ε thì phải lấy L ≤ ε. Từ đó:
5. Tính kích thước mẫu khi ước lượng xác suất p:
Theo (3), nửa chiều dài khoảng ước lượng . Từ đó:
. Hay: do