Tải bản đầy đủ (.pdf) (15 trang)

bài giảng xác suất thống kê toán chương 6 tổng thể và mẫu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (100.17 KB, 15 trang )


THỐNG KÊ TOÁN
CHƯƠNG 6
Tổng thể và mẫu
1. Tổng thể và các số đặc trưng
Một đợt thi tuyển sinh có 50.000 thí sinh tham
dự. Ta quan tâm đến điểm thi môn Toán của mỗi thí
sinh.
Trên đây là một ví dụ về tổng thể. Lượng thí
sinh gọi là kích thước tổng thể, ký hiệu N. Điểm
thi môn Toán là dấu hiệu quan tâm, ký hiệu X
*
.
Gọi X là giá trò của dấu hiệu X
*
(được đo hoặc
được lượng hoá) tại một phần tử của tổng thể được
chọn ngẫu nhiên thì X là ĐLNN. Kỳ vọng, phương

sai, độ lệch chuẩn của ĐLNN này gọi là trung bình
tổng thể (µ
µµ
µ), phương sai tổng thể (σ
σσ
σ
2
), độ lệch
chuẩn tổng thể (σ
σσ
σ).
Nếu quy đònh thêm một chỉ tiêu, chẳng hạn


trong ví dụ trên chỉ tiêu đạt môn Toán là từ 5 điểm
trở lên, gọi M là số phần tử của tổng thể đạt chỉ tiêu
này thì p = M/N gọi là tỷ lệ tổng thể.
µ, σ
2
, σ, p là các số đặc trưng của tổng thể.

2. Mẫu
2.1 Khái niệm mẫu
2.1.1 Mẫu ngẫu nhiên
Vì nhiều lý do, không thể có số liệu tổng thể,
vậy các số đặc trưng của tổng thể là không biết được.
Lấy n phần tử tổng thể (có hoàn lại) ta được n
ĐLNN X
1
, X
2
, X
n
độc lập có cùng phân phối với
ĐLNN của tổng thể. Ta gọi đây là một mẫu ngẫu
nhiên kích thước n, ký hiệu W
X
(X
1
, X
2
, , X
n
).

Từ n ĐLNN X
1
, X
2
, , X
n
ta thành lập các
ĐLNN đặc trưng mẫu:


Trung bình mẫu ngẫu nhiên:
X
=

n
i
i 1
1
X
n
=



Phương sai mẫu ngẫu nhiên (hiệu chỉnh)
:
S
2

=


( )
n
2
i
i 1
1
X X
n 1
=





Độ lệch chuẩn mẫu ngẫu nhiên
: S
=

2
S


Tỷ lệ mẫu ngẫu nhiên
:

F
=

n

i
i 1
1
Y
n
=


Y
i
là ĐLNN bằng 1 nếu phần tử thứ i được chọn
vào mẫu đạt chỉ tiêu và bằng 0 nếu không đạt.

2.1.2 Mẫu cụ thể
Từ W
X
(X
1
, X
2
, , X
n
), lấy số đo cụ thể của X
1
, X
2
,
, X
n
là x

1
, x
2
, , x
n
, ta được một
mẫu cụ thể kích
thước n
, ký hiệu W
X
(x
1
, x
2
, , x
n
).
Các số đặc trưng của mẫu cụ thể:
Trung bình mẫu
:
x

=

n
i
i 1
1
x
n

=


Phương sai mẫu (hiệu chỉnh)
:
s
2

=

( )
n
2
i
i 1
1
x x
n 1
=




Độ lệch chuẩn mẫu
: s
=

2
s


Tỷ lệ mẫu
:

f
=

T
n
n
n
T
: số ph.tử (mẫu) đạt chỉ tiêu.

2.2 Các dạng số liệu của mẫu cụ thể
Trong thực tế, số liệu của mẫu cụ thể được trình
bày dưới nhiều dạng khác nhau và ta sẽ dùng các
công thức thích hợp để tính các số đặc trưng mẫu.
2.2.1 Số liệu dạng điểm không có tần số
Số liệu là dãy gồm các giá trò x
i
. Công thức:
x
=
==
=
n
i
i 1
1
x

n
=
==
=

∑∑


s
2

=
==
=


2
n n
2
i i
i 1 i 1
1 1
x x
n 1 n
= =
= == =
= =
 
  
 

 
  
 
 
  
 

−−

 
  
 
 
  
 
 
  
 

−−

 
  
 
 
  
 
∑ ∑
∑ ∑∑ ∑
∑ ∑


Excel
n ≤ 30, x
1
, x
2
, ,x
n
ghi trong miền M thì:


x

=AVERAGE(M)
s
2

=VAR(M)
s
=STDEV(M)


Ghi chú
Có thể xem “điểm không tần số” là “điểm có tần
số bằng 1”.
Ví dụ
Chi phí hoạt động hàng tháng (triệu đồng) của
một doanh nghiệp trong năm 2012:
100,


106,

60,

160,

70,

170,

140,

120,

116,

120,

140,

150
Tính trung bình mẫu và phương sai mẫu.

2.2.2 Số liệu dạng điểm có tần số
Số liệu là dãy x
1
, x
2
, x
k

ứng với các tần số n
1
,
n
2
, n
k
. Ta dùng công thức:
n

=

k
i
i 1
n
=
==
=

∑∑


x

=
==
=

k

i i
i 1
1
n x
n
=
==
=

∑∑


s
2

=
==
=


2
k k
2
i i i i
i 1 i 1
1 1
n x n x
n 1 n
= =
= == =

= =
 
  
 
 
  
 
 
  
 

−−

 
  
 
 
  
 
 
  
 

−−

 
  
 
 
  

 
∑ ∑
∑ ∑∑ ∑
∑ ∑


Ví dụ
Điều tra về số xe bán được trong ngày của một số đại
lý chọn ngẫu nhiên ta có bảng số liệu sau:
Số xe bán được 1 2 3

4

5

6

Số đại lý 15

12

9

5

3

1

Tính trung bình


mẫu, phương

sai mẫu.
n

=

45
x

=

107/45



2,38 s
2



1,83

2.2.3 Số liệu dạng khoảng có tần số
Số liệu gồm k khoảng dạng [a
i
, b
i
) hoặc (a

i
, b
i
] và
tần số tương ứng n
1
, n
2
, …, n
k
.
Thay mỗi khoảng bởi giá trò trung tâm của
khoảng là
x
i

=
==
=

i i
a b
2
+
++
+
thì có được số liệu dạng điểm
có tần số. Lúc này có thể tính các số đặc trưng mẫu
theo cách đã biết.


Ví dụ
Điều tra về thu nhập năm 2005 (triệu đồng) của
một số nhân viên ngân hàng ta có bảng:
Thu
nhập
Số
NV
Thu nhập
Số
NV

Thu
nhập
Số
NV
80–85

9 95–100 36 110–115

16
85–90

12 100–105 25 115–120

10
90–95

24 105–110 20 120–130

8

n = 60
x

=

101,3125 s
2

=

111,7885

1.3.4 Số liệu dạng bảng hai chiều
Khi quan tâm và đo cùng lúc hai thuộc tính của
các phần tử thuộc mẫu ta có ĐLNN hai chiều (X, Y).
Lúc này tại mỗi phần tử của một mẫu cụ thể sẽ có
hai giá trò x
i
và y
j
.
Bảng số liệu hai chiều có tần số liệt kê các giá
trò của x
i
, của y
j
và tần số n
ij
cho biết số lần xuất
hiện của cặp (x

i
, y
j
) trong mẫu cụ thể:
X Y

y
1
y
2


y
h

x
1
n
11
n
12


n
1h

x
2
n
21

n
22


n
2h




x
k
n
k1
n
k2


n
kh


Từ bảng này, cộng tần số theo dòng (cột) ta có
bảng phân phối thực nghiệm theo X (Y). Lấy tần số
theo cột j (dòng i) ta có bảng tần số thực nghiệm
theo X (Y) với điều kiện Y

=

y

j
(X

=

x
i
).
Từ các bảng phân phối theo thực nghiệm, ta
tính trung bình mẫu, phương sai mẫu theo công thức
số liệu dạng điểm có tần số. Các ký hiệu sau:
* Trung bình mẫu, phương sai mẫu của X:
x
,

2
X
s
.
* Trung bình mẫu, phương sai mẫu của Y:
y
,

2
Y
s
.
* Trung bình mẫu, phương sai mẫu của X với
điều kiện Y
=

y
j
:
j
/ y
x
,


j
2
X / y
s .
* Trung bình mẫu, phương sai mẫu của Y với
điều kiện X
=
x
i
:
i
/ x
y
,


i
2
Y / x
s .


Ví dụ
Khảo sát về tỷ lệ thu nhập chi cho giáo dục (%) và
thu nhập bình quân đầu người (triệu đồng/tháng) của
400 hộ gia đình ta có bảng:
Chi Giáo dục
Thu nhập
10

20

30

40

50

1–3 10

40

20


3–7 40

60

20



7–11 20

80

40


11–17 30

30

10

Ta muốn tính: trung bình tỷ lệ thu nhập chi cho giáo
dục, thu nhập bình quân đầu người, trung bình và độ
lệch chuẩn thu nhập bình quân đầu người của những
hộ chi 30% thu nhập cho giáo dục.

Gọi X là tỷ lệ thu nhập chi cho giáo dục, Y là
thu nhập bình quân đầu người.

x
= 7,45



y
= 29,75



/30
x
=
7,79


2
X /30
s
=
12,76

X /30
s
=
3,57
Trung bình tỷ lệ thu
nhập chi cho GD là 7,45%, TN bình quân 1 người là
29,75 triệu/tháng, TN bình quân 1 người (30%) là
7,79 triệu/tháng, độ lệch chuẩn là 3,57.
a
i


b
i

1–3

3–7


7–11

11–17

Σ

x
i
2 5 9 14
n
i
70

120

140

70 400

y
j

10

20

30

40


50

Σ

n
j

10

100

190

90

10

400

a
i
− b
i

1–3

3–7

7–11


11–17

Σ

x
i /30

2 5 9 14
n
i /30

20

60

80 30 190

×