Chương 6
TỔNG THỂ VÀ MẪU
I. TỔNG THỂ
Khái niệm tổng thể:
Tổng thể là tập hợp các phần tử mang thông tin về dấu hiệu X
*
cần
nghiên cứu.
Ví dụ : Nghiên cứu về năng suất lúa ở đồng bằng sông Cửu Long.
⇒ Dấu hiệu X
*
cần nghiên cứu: năng suất lúa.
Thông tin cần thu thập: số tấn/ha.
Các phần tử mang thông tin: các thửa ruộng.
⇒ Tổng thể: tập hợp tất cả các thửa ruộng ở đồng bằng sông Cửu
Long.
I. TỔNG THỂ
Khái niệm tổng thể:
Đối với tổng thể, ta sử dụng một số khái niệm sau:
Kích thước tổng thể (N) : là số phần tử của tổng thể.
Giá trị của tổng thể (x
i
) : là các giá trị của X
*
đo được trên các
phần tử của tổng thể.
Tần số của x
i
(N
i
) : là số phần tử nhận giá trị x
i
.
Tần suất của x
i
(N
i
) : là tỷ số giữa tần số của x
i
và kích thước tổng
thể.
I. TỔNG THỂ
Khái niệm tổng thể:
Ta luôn có:
Giá trị của X
*
x
1
x
2
… x
k
Tần số N
i
N
1
N
2
… N
k
Tần suất p
i
p
1
p
2
… p
k
Bảng cơ cấu của tổng thể:
Trung bình tổng thể (µ):
k
i
i = 1
N = N
∑
k
i
i = 1
p = 1⇒
∑
k
i i
i = 1
μ = x p
∑
I. TỔNG THỂ
Khái niệm tổng thể:
Phương sai tổng thể (σ
2
):
Độ lệch chuẩn của tổng thể (σ):
Tỷ lệ tổng thể (p):
p = M/N
Trong đó M là số phần tử có tính chất A. ⇒ p cũng chính là xác suất
lấy được phần tử có tính chất A khi chọn ngẫu nhiên 1 phần tử từ
tổng thể.
k k
2 2 2 2
i i i i
i = 1 i = 1
σ = (x - μ) p = x p - μ
∑ ∑
2
σ = σ
I. TỔNG THỂ
Đại lượng ngẫu nhiên gốc:
Nếu lấy ngẫu nhiên từ tổng thể ra 1 phần tử và gọi X là giá trị của
dấu hiệu X
*
đo được trên phần tử ấy thì X là đại lượng ngẫu nhiên có
phân phối xác suất như sau:
X x
1
x
2
… x
k
P p
1
p
2
… p
k
X đgl ĐLNN gốc và quy luật phân phối xác suất của X đgl quy luật
phân phối gốc.
I. TỔNG THỂ
Đại lượng ngẫu nhiên gốc:
X x
1
x
2
… x
k
P p
1
p
2
… p
k
Các tham số của ĐLNN gốc:
Kỳ vọng toán:
Phương sai:
k
i i
i = 1
E(X) = x p = μ
∑
k
2 2
i i
i=1
k
2 2
i i
i=1
Var(X) = E[(X - E(X)) ] = [x - E(X)] p
= [x - μ] p = σ
∑
∑
II. MẪU
Khái niệm mẫu:
Từ tổng thể lấy ra n phần tử theo phương pháp có hoàn lại, khi đó
ta được 1 mẫu có kích thước n.
Gọi X
i
là giá trị của dấu hiệu X
*
đo được trên phần tử thứ i của mẫu
(i = 1, 2,…, n). Khi đó ta có X
1
, X
2
,…, X
n
là các ĐLNN độc lập có cùng
quy luật phân phối với ĐLNN gốc X.
II. MẪU
Khái niệm mẫu:
Mẫu ngẫu nhiên:
1 bộ gồm n ĐLNN X
1
, X
2
,…, X
n
độc lập và có cùng phân phối xác
suất với ĐLNN gốc X đgl 1 mẫu ngẫu nhiên kích thước n.
Ký hiệu mẫu ngẫu nhiên:
W
X
=(X
1
, X
2
,…, X
n
)
Mẫu cụ thể:
Khi phép thử đã được thực hiện, ta thu được kết quả là (x
1
, x
2
,…, x
n
)
thì (x
1
, x
2
,…, x
n
) đgl 1 mẫu cụ thể kích thước n.
Ký hiệu mẫu cụ thể: W
x
= (x
1
,x
2
,…,x
n
).
II. MẪU
Khái niệm mẫu:
Một mẫu cụ thể chính là một giá trị của mẫu ngẫu nhiên.
Ví dụ: Quan sát 1 khu nhà ở mới có 100 hộ gia đình sống ở đó và ghi
nhận số em bé có trong mỗi hộ, ta được bảng số liệu sau:
Số em bé trong mỗi hộ 0 1 2
Số hộ 20 30 50
Ta lấy 1 mẫu gồm 5 hộ gia đình. Gọi X
i
là số em bé có trong hộ thứ
i (i = 1, 2,…, 5).
II. MẪU
Khái niệm mẫu:
Mẫu ngẫu nhiên: (X
1
, X
2
, X
3
, X
4
, X
5
).
Số em bé trong mỗi hộ 0 1 2
Số hộ 20 30 50
Chọn ngẫu nhiên (có lặp) 5 hộ gia đình và ghi nhận số em bé của
từng hộ này. Giả sử số em bé có trong hộ thứ 1, 2, 3, 4, 5 lần lượt là
1, 0, 0, 1, 2. Vậy ta được 1 mẫu cụ thể: (1, 0, 0, 1, 2).
Chọn 5 hộ gia đình khác, ta lại được 1 mẫu cụ thể khác: (0, 2, 0, 1,
1).
II. MẪU
Các tham số đặc trưng của mẫu:
Trung bình mẫu:
là hàm của các ĐLNN X
1
, X
2
,…, X
n
nên cũng là một ĐLNN.
Trung bình mẫu cụ thể:
là một giá trị cụ thể được tính dựa vào bộ số cụ thể (x
1
, x
2
,…, x
n
).
⇒ là một giá trị cụ thể của .
Trung bình mẫu ngẫu nhiên:
n
i
i = 1
1
X = X
n
∑
n
i
i = 1
1
x = x
n
∑
II. MẪU
Các tham số đặc trưng của mẫu:
Trung bình mẫu:
Ví dụ: Cho tập {1, 2, 3, 4}. Chọn ngẫu nhiên không hoàn lại 3 phần
tử từ tập này để tạo thành 1 mẫu. Tìm bảng phân phối xác suất của
và tính E(), Var().
II. MẪU
Các tham số đặc trưng của mẫu:
Tính chất của trung bình mẫu ngẫu nhiên:
E() = µ
Nếu chọn mẫu có hoàn lại:
Nếu chọn mẫu không hoàn lại:
Khi chọn mẫu có hoàn lại, dựa vào định lý giới hạn trung tâm, ta
có:
2
σ
Var(X) =
n
2
σ N - n
Var(X) = .
n N - 1
2
n
i
i = 1
1σ
X = X ~ N(μ; ) (n 30)
n n
≥
∑
II. MẪU
Các tham số đặc trưng của mẫu:
Phương sai mẫu:
là hàm của các ĐLNN X
1
, X
2
,…, X
n
nên cũng là một ĐLNN.
Phương sai mẫu cụ thể:
là một giá trị cụ thể được tính dựa vào bộ số cụ thể (x
1
, x
2
,…, x
n
).
⇒ là một giá trị cụ thể của .
Phương sai mẫu ngẫu nhiên:
n
2 2
i
i = 1
1
ˆ
S = (X - X)
n
∑
n
2 2
i
i = 1
1
ˆ
s = (x - x)
n
∑
II. MẪU
Các tham số đặc trưng của mẫu:
Phương sai mẫu điều chỉnh:
S
2
là hàm của các ĐLNN X
1
, X
2
,…, X
n
nên S
2
cũng là một ĐLNN.
Phương sai mẫu cụ thể:
s
2
là một giá trị cụ thể được tính dựa vào bộ số cụ thể (x
1
, x
2
,…,
x
n
).
⇒ s
2
là một giá trị cụ thể của S
2
.
Phương sai mẫu ngẫu nhiên:
n
2 2
i
i = 1
1
S = (X - X)
n - 1
∑
n
2 2
i
i = 1
1
s = (x - x)
n - 1
∑
II. MẪU
Các tham số đặc trưng của mẫu:
Phương sai mẫu điều chỉnh:
Ví dụ: Cho tập {1, 2, 3, 4}. Chọn ngẫu nhiên không hoàn lại 3 phần
tử từ tập này để tạo thành 1 mẫu. Tìm bảng phân phối xác suất của
S
2
và tính E(S
2
), Var(S
2
).
II. MẪU
Các tham số đặc trưng của mẫu:
Tính chất của phương sai mẫu điều chỉnh: Nếu chọn mẫu có hoàn
lại thì:
* E(S
2
) = σ
2
2
n
2
i
2
i = 1
(X - μ)
* ~ χ (n)
σ
∑
2
2
2
(n - 1)S
* ~ χ (n - 1)
σ
X - μ
* ~ T(n - 1)
S
n
II. MẪU
Các tham số đặc trưng của mẫu:
Độ lệch chuẩn mẫu:
Tỷ lệ mẫu:
Xét tập hợp có N phần tử, trong đó có M phần tử có tính chất A.
Từ tập này, chọn mẫu có hoàn lại gồm n phần tử.
Gọi Y
i
là số phần tử có tính chất A trong lượt lấy thứ i. Khi đó Y
i
là
các ĐLNN độc lập, có thể nhận một trong hai giá trị 0 hoặc 1 với xác
suất tương ứng: P(Y
i
= 1) = p và P(Y
i
= 0) = 1 – p.
2
S = S
II. MẪU
Các tham số đặc trưng của mẫu:
F là hàm của các ĐLNN X
1
, X
2
,…, X
n
nên F cũng là một ĐLNN.
Tỷ lệ mẫu cụ thể:
f là một giá trị cụ thể được tính dựa vào số lượng phần tử có tính
chất A trong mẫu (m) và kích thước mẫu (n).
⇒ f là một giá trị cụ thể của F.
Tỷ lệ mẫu:
Tỷ lệ mẫu ngẫu nhiên:
m
f =
n
n
i
i = 1
1
F = Y
n
∑
II. MẪU
Các tham số đặc trưng của mẫu:
Tính chất của tỷ lệ mẫu ngẫu nhiên:
E(F) = p
Var(F) =
Dựa vào định lý giới hạn trung tâm, ta có:
pq
n
n
i
i = 1
1 pq
F = X ~ N(p; ) (n 30)
n n
≥
∑
Tổng kết chương 6
•
Các tham số đặc trưng của tổng thể?
•
Các tham số đặc trưng của mẫu? Tính chất của các tham số đó?
•
Lập bảng phân phối xác suất của trung bình mẫu ngẫu nhiên,
phương sai mẫu điều chỉnh?