THỐNG KÊ
Bài 1. MỘT SỐ KHÁI NIỆM MỞ ĐẦU
1.1. Thống kê:
Là môn khoa học về phân tích dữ liệu (
bao gồm cả thu thập và xử lý ), nhằm thu
nhận thông tin chân thực về đối tượng
nghiên cứu với một độ tin cậy nhất định rồi
rút ra những kết luận hợp lý.
Những quyết định của thống kê có ứng
dụng như: dự báo; chẩn đóan; thăm dò…
1.2. Mẫu và đám đông:
Một số công việc hằng ngày phải thu
thập số liệu để lưu trữ và phân tích. Công
việc này gọi là thống kê mô tả.
Dãy số liệu thống kê thường được gọi
là mẫu.
Mẫu có nguồn gốc từ một tập lớn hơn
mà ta gọi là Đám đông.
Chọn mẫu có hai cách là chọn ngẫu
nhiên hay chọn có suy luận.
1.3. Phân lọai và mô tả số liệu mẫu
1.3.1. Mẫu đơn: Giả sử từ một đám đông ta
chọn ra mẫu có n phần tử là x1; x2; ..; xn.
Mẫu như vậy gọi là mẫu đơn.(n gọi là kích
thước mẫu)
Trong mẫu cũng có thể có nhiều giá trị
giống nhau. Chẳng hạn x1 có n1 lần xuất
hiện, x2 có n2 lần xuất hiện, …, xk có nk lần
xuất
hiện.
Trong
đó n1nhiên
+n2+..+n
k=n.
Ví dụ:
Kiểm
tra ngẫu
điểm
Tóan của
10 sinh viên ta có kết quả:
5; 6; 7; 0; 9; 4; 1; 2; 3; 10.
Đây là một mẫu đơn.
Có thể sắp xếp trên bảng sau:
Điểm X 0
1
2
3
4
5
6
7
8
9
10
Số SV ni 1
1
1
1
1
1
1
1
0
1
1
Ví dụ 2: Kiểm tra ngẫu nhiên 50 học sinh ta
có kết qủa điểm môn Tóan như sau:
2 đ có 4 sv; 4 đ có 6 sv; 5 đ có 20 sv; 6
đ có 10 sv; 7 đ có 5 sv; 8 đ có 2 sv; 9 đ có 2
sv; 10 đ có 1 sv.
Ta có thể sắp xếp trên bảng sau
X (đ)
2
4
5
6
7
8
9
10
ni (SV) 4
6
20
10
5
2
2
1
1.3.2. Mẫu lớp: Giả sử từ một đám đông ta
chọn ra một mẫu có kích thước n, trong đó
có n1 phần tử nằm trong khỏang (x1; x2); n2
phần tử nằm trong khỏang (x2; x3); …; nk
phần tử nằm trong khỏang (xk; xk+1). Lúc
này ta có một mẫu, gọi là mẫu lớp.
Ví dụ: Đo chiều cao của 300 h/s 12 tuổi ta
có bảng số liệu sau: (Gọi là mẫu lớp)
X (cm)
ni (số học sinh)
117.5 – 122.5
9
122.5 – 127.5
33
127.5 – 132.5
74
132.5 – 137.5
93
137.5 – 142.5
64
142.5 – 147.5
21
147.5 – 152.5
6
1.3. Tần số, tần suất, bảng phân phối thực
nghiệm:
1.3.1.Tần số: Là số lần xuất hiện xi hoặc lớp
thứ i trong mẫu.
Ví dụ : x1=2 có tần số n1=4; lớp thứ 3
[127.5 - 132.5) có tần số n3=74.
ni
1.3.2. Tần suất: là tỷ số fi = n ; đặc trưng
cho sự xuất hiện của giá trị xi hoặc khỏang
[xi; xi+1) trong mẫu.
Bảng sau đây bảng tần số
X
x1
x2
…
xk
ni
n1
n2
…
nk
Từ bảng trên ta có bảng tần suất cũng gọi là
bảng phân phối thực nghiệm
X
x1
x2
…
xk
fi
f1
f2
…
fk
Bài 2: CÁC SỐ ĐẶC TRƯNG CỦA MẪU
2.1. Trung bình của mẫu:
Cho mẫu x1; x2;…; xn (1). Trung bình
của mẫu được xác định như sau
x1 + x2 + .. + xn
X =
n
Nếu mẫu cho dưới dạng bảng tần số (2)
X
x1
x2
…
xk
ni
n1
n2
…
nk
n1 x1 + n2 x2 + .. + nk xk
X=
n
2.2. Phương sai của mẫu:
(S )
*
2
( )
=σ = X − X
2
n
2
2
=
2
n x + n x + .. + nk x n1 x1 + n2 x2 + .. + nk xk
=
−
÷
n
n
2
1 1
2
2 2
2
k
Phương sai hiệu chỉnh của mẫu
2
n
n 2
2
2
*
S = σ n −1 =
S ) =
σn
(
n −1
n −1
Ví dụ 1: Cân 150 con vịt của một giống
mới ta có kết qủa như sau:
X (kg)
1.25
1.50
Ni (Số
con vịt)
2
6
1.75 2.00 2.25
24
35
39
2.50 2.75 3.00
24
14
6
Hãy tính các đặc trưng mẫu của trong
lượng các con vịt.
Giải:
Trung bình mẫu
n1 x1 + n2 x2 + .. + nk xk
X =
n
2 ×1.25 + 6 ×1.50 + 24 ×1.75 + .. + 6 × 3.00
X=
150
= 2.185
Phương sai của mẫu
(S )
*
2
( )
=σ = X − X
2
n
2
2
=
2
n x + n x + .. + n x n1 x1 + n2 x2 + .. + nk xk
=
−
÷
n
n
2
2
2
2
2 ×1.25 + 6 ×1.50 + 24 ×1.75 + .. + 6 × 3.00
2
=
− ( 2.185 )
150
2
1 1
2
2 2
= 0.142025
2
k k
Phương sai hiệu chỉnh
2
n
n
*
2
S =σ
=
S
=
σn
n −1
n −1
0.142025 ×150
=
= 0.142978187
149
2
2
n −1
( )
Ví dụ 2: Hãy tính các đặc trưng của mẫu
khi đo chiều cao của 300 h/s 12 tuổi ta có
bảng số liệu sau: (mẫu lớp)
X (cm)
ni (số học
sinh)
X (cm)
117.5 – 122.5
122.5 – 127.5
127.5 – 132.5
9
33
74
120
132.5 – 137.5
93
135
137.5 – 142.5
64
140
142.5 – 147.5
21
145
147.5 – 152.5
6
150
125
130
X = 134.2833; S = σ n = 40.2363; S = σ n −1 = 40.3709
*2
2
Bài 3.
ƯỚC LƯỢNG
Ước lượng tham số. Có thể phát biểu
tổng quát bài toán ước lượng như sau:
Cho biến ngẫu nhiên gốc X có quy luật
phân phối xác suất đã biết, nhưng chưa biết
tham số θ nào đó (chẳng hạn: kỳ vọng;
phương sai hay tỷ lệ)
Ta phải xác định giá trị của θ dựa
trên các thông tin thu được từ mẫu quan sát
x1; x2;…; xn của X.
Quá trình xác định θ được gọi là quá
trình ước lượng tham số.
Có hai loại ước lượng: ước lượng điểm
và ước lượng khoảng.
3.1. Ước lượng điểm của tham số θ :
3.1.1. Ước lượng điểm cho kỳ vọng:
Dùng trung bình mẫu để ước lượng cho
kỳ vọng (hay trung bình) của đám đông
3.1.2. Ước lượng điểm cho phương sai:
Dùng phương sai mẫu hay phương sai hiệu chỉnh
mẫu để ước lượng cho phương sai của đám đông
3.1.3.Ước lượng điểm cho tỷ lệ hay xác suất
ni
Tần suất f i = dùng ước lượng điểm
n
cho tỷ lệ hay xác suất của biến cố [ X=xi ]
Ví dụ: Điều tra điểm môn Toán của lớp
KT3. Người ta chọn ngẫu nhiên 30 sinh
viên và được kết qủa sau:5;7; 8; 9; 10; 5; 3;
6; 1; 2; 9; 10; 2; 8; 7; 7; 8; 4; 3; 7; 2; 8; 5;
3; 9; 6; 6; 6; 9; 1.
Hãy ước lượng điểm trung bình và
phương sai của lớp. Tỷ lệ số sinh viên đạt