Tải bản đầy đủ (.pdf) (88 trang)

BÀI GIẢNG THỐNG KÊ - CÁC KHÁI NIỆM CƠ BẢN VỀ THỐNG KÊ potx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (304.32 KB, 88 trang )


Chương THỐNG KÊ

§ Thống kê là gì? Tại sao phải thống kê?
Vai trò quan trọng của các đặc trưng của một BNN (?)
Thí dụ. Một hộp chứa 3 bi trắng và 1 bi đen. Trò chơi đặt
ra: Người tham gia chơi sẽ bốc ngẫu nhiên một viên bi. Sẽ
nhận được 2 đô la nếu bốc được bi trắng, sẽ phải trả 3 đô
la nếu bốc phải bi đen. Biết rằng xác suất b
ốc được của
mỗi viên bi là như nhau. Có nên tham gia trò chơi?
Thí dụ. Một công ty chăn nuôi lợn lấy thịt, mỗi lứa nuôi
khoảng 500 ngàn con.
a) Dựa vào tiêu chí nào để đưa ra quyết định thu
hoạch?
b) Nếu biết trọng lượng của các con lợn đang tuân
theo quy luật chuẩn
(
)
2
43, 4,7N thì đã thu hoạch
được chưa?
Thí dụ. Một sư đoàn có kế hoạch may quân phục cho
khoảng 1 triệu tân binh.
a) Dựa vào tiêu chí nào để đưa ra các kích cỡ
quân phục phù hợp?
b) Nếu biết các chỉ số về kích thước của các tân
binh tuân theo quy luật chuẩn
(
)
2


1, 7; 0, 31N
và dự
kiến đưa ra 3 kích cỡ quân phục thì nên đưa ra các
kích cỡ như thế nào cho phù hợp?
Thí dụ. Có hai giống lúa. Nên dựa vào tham số nào để
so sánh năng suất của hai giống lúa? Làm thế nào để
tính các tham số đó?
Kết luận: Trong nhiều tình huống, để đưa ra quyết
định, đánh giá hay giải quyết một vấn đề nào đó … Æ
ta dựa vào các tham số
, , pμσ
Lưu ý rằng khi xét BNN nào đó, thì mỗi tham số là duy
nhất.
Æ thống kê để có các thông tin về các tham số.
§ Cơ sở lý thuyết mẫu
Các khái niệm cơ bản
a) Mẫu ngẫu nhiên
Thí dụ. Gọi
X là số chấm thu được khi tung một con
xúc xắc,
X là biến ngẫu nhiên tuân theo quy luật
X 1 2 3 4 5 6
P 1/6 1/6 1/6 1/6 1/6 1/6
Nếu tung con xúc xắc 3 lần và gọi
(
)
1, 3
i
Xi= là số
chấm xuất hiện ở lần thứ i thì ta có 3 biến ngẫu nhiên

độc lập tạo nên mẫu ngẫu nhiên kích thước n = 3.
W = (X
1
, X
2
, X
3
)
X
i
tuân theo quy luật nào?
?
i
EX = và ?
i
DX =
Mẫu ngẫu nhiên kích thước n là tập hợp
n biến ngẫu nhiên độc lập X
1
, X
2
, …, X
n

được thành lập từ biến ngẫu nhiên X.
Giả sử X
1
nhận giá trị x
1
; X

2
nhận giá trị x
2
; …, X
n
nhận
giá trị x
n
. Tập hợp n giá trị x
1
, x
2
, …, x
n
tạo thành một
mẫu cụ thể, ký hiệu
w = (x
1
, x
2
, …, x
n
)
§ Các phương pháp mô tả số liệu mẫu

a) Bảng phân bố thực nghiệm
Bảng phân bố thực nghiệm của dấu hiệu điều tra X:
X x
1
x

2
… x
k
Tổng
Tần số n
1
n
2
… n
k

∑n
i
= n
Tần suất f
1
f
2
… f
k
∑f
i
= 1
trong đó
i
i
n
f
n
=

Nhận xét.
(i) Nếu tách riêng từng đại lượng thì ta được
bảng phân bố tần số thực nghiệm và bảng
phân bố tần suất thực nghiệm.
(ii)
1
k
i
i
nn
=
=


1
1
k
i
i
f
=
=


Thí dụ. Điều tra điểm thi tốt nghiệp môn toán của một
thành phố, người ta điều tra ngẫu nhiên 400 em học sinh (n
= 400).
X (điểm bài thi) Tần số Tần suất
0
1

2
3
4
5
6
7
8
9
10
6
15
43
53
85
72
55
33
18
10
10
6/400 = 0,015
0,0375
0,1075
0,1325
0,2125
0,18
0,1375
0,0825
0,045
0,025

0,025
Tổng 400 1
b) Bảng phân bố ghép lớp
trong một số trường hợp giá trị điều tra khá gần nhau,
cỡ mẫu n lớn Æ chia khoảng, sao cho mỗi giá trị điều
tra thuộc và chỉ một khoảng.

Thí dụ. Chiều cao (dm) của 400 cây được trình bày
thành bảng phân bố ghép lớp
Khoảng Tần số Tần suất Độ rộng khoảng
4,5 – 9,5
9,5 – 11,5
11,5 – 13,5
13,5 – 16,5
16,5 – 19,5
19,5 – 22,5
22,5 – 26,5
26,5 – 36,5
18
58
62
72
57
42
36
10
0,045
0,145
0,155
0,18

0,1425
0,105
0,09
0,025
5
2
2
3
3
3
4
10
Tổng 400 1


c) Tần số tích lũy và tần suất tích lũy
*
()
ii
i
i
xx xx
n
Fx f
n
<<
==
∑∑

gọi là hàm phân bố thực nghiệm của mẫu (hàm tần số

tích lũy)
Nhận xét.
(i)
(
)
*
Fx
xác định tần suất của biến cố
{}
Xx<
(?)
(ii) Khi cỡ mẫu đủ lớn thì
(
)
*
Fx và
(
)
Fx sai khác
nhau không đáng kể. (?)
§ Biểu diễn bằng biểu đồ, tổ chức đồ

Giả sử ta có bảng phân bố thực nghiệm
X 31 34 35 36 38 40 42 44
Tần số 10 20 30 15 10 10 5 20
Tần suất 1/12 2/12 3/12 1/8 1/12 1/12 1/24 1/6







0
5
10
15
20
25
30
31 34 35 36 38 40 42 44
tần số

0
5
10
15
20
25
30
35
31 34 35 36 38 40 42 44
tần số

Đối với bảng ghép lớp, ta dùng tổ chức đồ (histogram)
để biểu diễn và lưu ý rằng hai trường hợp sau đây cách
lấy chiều cao các cột là khác nhau.
(i) Độ rộng các khoảng bằng nhau
(ii) Độ rộng các khoảng không bằng nhau.








Thí dụ. Doanh thu 51 cửa hàng của một công ty
năm 1996 (đơn vị là triệu đồng vn)
120
88
71
135
156
120
112
123
95
195
109
93
97
88
75
79
152
90
121
147
67
166
64

113
87
60
27
129
118
62
83
49
155
88
83
114
148
57
114
101
48
141
144
95
128
103
66
79
104
55
84
a) lập bảng ghép lớp, sử dụng 8 khoảng với độ
rộng 22

b) vẽ tổ chức đồ tần suất



Khoảng Tần số Tần suất
26,5-48,5
48,5-70,5
70,5-92,5
92,5-114,5
114,5-136,5
136,5-158,5
158,5-180,5
180,5-202,5
2
8
12
12
8
7
1
1
0,04
0,16
0,24
0,26
0,16
0,14
0,02
0,02
Tổng 51 1

0
0.05
0.1
0.15
0.2
0.25
0.3
26.5-4
8
.5
48
.5
-70
.
5
70
.5
-92.5
92.5-114
.5
1
1
4.5
-1
3
6.5
1
3
6.5
-

15
8.5
1
5
8.5
-
18
0.
5
1
80
.5
-2
0
2.5
tần suất
Trong trường hợp độ rộng các khoảng không bằng nhau,
ta dựng các hình chữ nhật đó có diện tích đúng bằng tần
số tương ứng (bằng tần suất nếu là biểu đồ tần suất)
nghĩa là trên các khoảng thứ i có độ rộng l
i
ta dựng hình
chữ nhật có chiều cao
(
ii
ii
ii
rf
yy
ll

==
nếu là biểu đồ tần
suất)


Thí dụ. Chiều cao (dm) của 400 cây được trình bày
thành bảng phân bố ghép lớp
Khoảng Tần số Tần suất Độ rộng khoảng
4,5 – 9,5
9,5 – 11,5
11,5 – 13,5
13,5 – 16,5
16,5 – 19,5
19,5 – 22,5
22,5 – 26,5
26,5 – 36,5
18
58
62
72
57
42
36
10
0,045
0,145
0,155
0,18
0,1425
0,105

0,09
0,025
5
2
2
3
3
3
4
10
Tổng 400 1

Khoảng r
i
l
i
i
i
i
r
y
l
=
4,5 – 9,5
9,5 – 11,5
11,5 – 13,5
13,5 – 16,5
16,5 – 19,5
19,5 – 22,5
22,5 – 26,5

26,5 – 36,5
18
58
62
72
57
42
36
10
5
2
2
3
3
3
4
10
3,6
29
31
24
19
14
9
5,5
Tổng 400 1
§ Thống kê

Khi nghiên cứu một dấu hiệu nào đó mà ta gọi là BNN
X, một việc làm rất tự nhiên là rút ra một mẫu ngẫu

nhiên
(
)
12
, , ,
n
XX X
để quan sát. Các BNN
i
X mặc dù
là cùng quy luật với
X nhưng vì quy luật của X chưa
biết nên các BNN
i
X cũng vậy.
Tuy nhiên, nếu tổng hợp các biến ngẫu nhiên này
thì sẽ bộc lộ những thông tin về BNN
X .
Việc tổng hợp mẫu
(
)
12
, , ,
n
WXXX= được thực hiện
dưới dạng một hàm nào đó của các giá trị
1
X
,
2

X
, …,
n
X , nó được gọi là thống kê, và kí hiệu là G.
Bản chất của G cũng là một BNN, tuân theo một quy
luật nào đó và cũng có các tham số đặc trưng như
(), ()EG DG .
Khi mẫu ngẫu nhiên nhận một giá trị cụ thể
(
)
12
, , ,
n
wxx x= thì thống kê G cũng nhận một giá trị
cụ thể.
§ Một số thống kê đặc trưng của mẫu ngẫu nhiên

Các thống kê đặc trưng của mẫu ngẫu nhiên chia thành
ba loại.
(*) Đặc trưng cho biết xu hướng trung tâm của mẫu:
cho biết các số liệu của mẫu tập trung xung quanh
những con số nào. Đó là các đặc trưng như trung
bình mẫu, trung vị, và mode.
(**) đặc trưng cho biết mức độ phân tán của các số

liệu, mức độ biến động: biên độ, độ lệch trung bình,
độ lệch tiêu chuẩn và phương sai.
(***) các thống kê đặc trưng dạng phân phối.

a) Trung bình mẫu.

Giả sử từ BNN gốc
X trong tổng thể lập mẫu ngẫu
nhiên kích thước n:
(
)
12
, , ,
n
WXXX=
Trung bình mẫu là một thống kê, kí hiệu là
X
1
1
n
i
i
XX
n
=
=


×