Tải bản đầy đủ (.pptx) (47 trang)

BÀI THUYẾT TRÌNH THỐNG KÊ pot

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.87 MB, 47 trang )

t n
â
p
Đ

h
n á
Đ phân tánộ
CÁC ĐẶC TRƯNG ĐO LƯỜNG
Lương Hoàng Uyên - KT5
5
Nguyễn Thị Hương Sen - KT5
2
3
Trần Thanh Trúc - KT5
4
Nguyễn Thị Nhâm - KT6
6
Hnh
Lê Thị Hiệp - KT5
1
C Á C T H À N H V I Ê N C Ủ A N H Ó M
:
Phan Thị Thanh Trầm - KT5
CÁC ĐẠI LƯỢNG ĐO LƯỜNG ĐỘ PHÂN TÁN
CÁC ĐẠI LƯỢNG ĐO LƯỜNG ĐỘ PHÂN TÁN
Khái niệm
Các đặc trưng đo lường độ phân tán
Khoảng biến thiên ( R )
Độ trải giữa ( R
Q


)
Độ chênh tuyệt đối trung bình
Phương sai
Độ lệch chuẩn
Hệ số biến thiên ( CV )
MỤC LỤC
Tứ phân vị ( Q )
Khảo sát hình dáng phân phối của dãy số
K
Thí dụ:
Ta quan sát độ tuổi của 2 nhóm công nhân, mỗi nhóm gồm 5
người như sau : * Nhóm 1: 20 30 40 50 60 = 40 tuổi
* Nhóm 2: 38 39 40 41 42 = 40 tuổi
Nhận xét :

Độ tuổi trung bình của 2 nhóm bằng nhau ( = 40 tuổi ), nhưng ta chưa thể đánh giá chính
xác rằng mức độ đồng đều về tuổi tác của 2 nhóm này như thế nào.

Nếu ta quan sát từng lượng biến trong mỗi nhóm , ta thấy nhóm 2 lượng biến biến động
ít và đồng đều hơn nhóm 1

Có thể nhận định rằng độ tuổi bình quân nhóm 2 đạidiện cao
hơn nhóm 1.

Chứng tỏ sự biến động lượng biến tiêu thức có liên quan rất lớn đến mức độ đại
biểu của số bình quân.
H Á NI I Ệ M
x
x
K

Sự biến động về lượng biến của các đơn
vị tổng thể theo một tiêu thức nào đó gọi là
độ phân tán của hiện tượng.

Để đo mức độ phân tán hay mức độ đại
biểu của số bình quân

sử dụng các
chỉ tiêu đo độ biến động tiêu thức.
H Á NI I Ệ M
Độ lệch chuẩn
Phương sai
Độ lệch tuyệt đối trung bình
Độ trải giữa ( R
Q
)
Khoảng biến thiên ( R )
Hệ số biến thiên CV
1
Khái niệm :
Là độ chênh lệch giữa giá trị lớn nhất và giá trị
bé nhất của dãy số.
Công thức : R = Xmax – Xmin
Trong đó : Xmax : giá trị lớn nhất
Xmin : giá trị bé nhất
Ý nghĩa :
R càng nhỏ tổng thể càng đồng đều,số trung bình càng có tính đại diện cao và ngược lại.
. K H O NẢ G B 1Ế N T H 1 NÊ
1
Ưu điểm :

* Đơn giản
* Cho nhận xét nhanh về mức độ
biến thiên của tổng thể
Nhược điểm :
Cho nhận xét không chính xác khi có các
lượng biến đột xuất ( quá lớn hoặc quá nhỏ )
. K H O NẢ G B 1Ế N T H 1 NÊ
1
VÍ D :Ụ
Ta quan sát độ tuổi của 2 nhóm công nhân, mỗi nhóm gồm 5 người như sau :
* Nhóm 1: 20 30 40 50 60 tuổi
* Nhóm 2: 38 39 40 41 42 tuổi

R1 = 60 - 20 = 40
R2 = 42 - 38 = 4
R1 > R2 có nghĩa là các độ tuổi trong nhóm 1 biến thiên nhiều hơn trong
nhóm 2
Do đó :
Số trung bình của nhóm 2 đại diện tốt hơn so với nhóm 1

. K H O NẢ G B 1Ế N T H 1 NÊ
40
1
=x
40
2
=x
R
Q


Đ ộ
tr ải
gi a
Độ trải giữa R
Q
Định nghĩa :
Là chênh lệch giữa tứ phân vị thứ ba và tứ phân
vị thứ nhất.
Công thức :
R
Q
= Q
3
– Q
1

Trong đó :
R
Q
: độ trải giữa
Q
3
:tứ phân vị thứ ba
Q
1
:tứ phân vị thứ nhất
R
Q

Đ ộ

tr ải
gi a
Độ trải giữa R
Q
Ý nghĩa :
R
Q
càng lớn thì các lượng biến của tổng thể biến
thiên càng nhiều
Nhược điểm :
Không phản ánh được tốt mức độ biến thiên của
tập dữ liệu


R
Q

Đ ộ
tr ải
gi a
Độ trải giữa R
Q
Ví dụ :
Năng suất lao động (kg) tháng 12/2010 2 tổ
sản xuất,mỗi tổ gồm 8 người như sau :

Tổ 1 : 200 250 300 350 400 450 500 550

Tổ 2 : 280 300 320 330 350 400 470 550


Tính Q1,Q3,R
Q
?
n=8 , ( n + 1) / 2 = 2
1
/
4
Tổ 1 : Q1 = 250 + ¼ ( 300 – 250 ) = 262,5 kg
Q3 = 450 + ¾ ( 500 – 450 ) = 487,5 kg
Tổ 2 : Q1 = 300 + ¼ ( 320 – 300 ) = 305,0 kg
Q3 = 400 + ¾ ( 470 – 400 ) = 452,5 kg
R
Q

Đ ộ
tr ải
gi a
Độ trải giữa R
Q
Tính Q1,Q3,R
Q
?
n=8 , ( n + 1) / 2 = 2
1
/
4
Tổ 1 : Q1 = 250 + ¼ ( 300 – 250 ) = 262,5 kg
Q3 = 450 + ¾ ( 500 – 450 ) = 487,5 kg
Tổ 2 : Q1 = 300 + ¼ ( 320 – 300 ) = 305,0 kg
Q3 = 400 + ¾ ( 470 – 400 ) = 452,5 kg


Tổ 1 : R
Q1
= Q
3
– Q
1
= 225,0 kg

Tổ 2 : R
Q2
= Q
3
– Q
1
= 147,5 kg
 R
Q1
>R
Q2
Do đó,các mức năng suất trong tổ 1 biến thiên nhiều hơn
trong tổ 2
Khái niệm :
Là số trung bình cộng của các độ lệch tuyệt đối giữa các
giá trị của từng quan sát ( xi ) và số trung bình cộng của
các giá trị đó
Công thức tính :

hoặc



Độ lệch tuyệt đối trung bình
d
n
xx
d
n
i
i

=

=
1
Trong đó :
: độ lệch tuyệt đối trung bình
x
i
: giá trị quan sát thứ I
:số trung bình cộng giá trị
các quan sát
n : tổng số quan sát
d
x


=
=

=

n
i
i
n
i
ii
f
fxx
d
1
1
( khi x
i
có tần số f
i
khác nhau )
Độ lệch tuyệt đối trung bình
Ví dụ :
Ta quan sát độ tuổi của 2 nhóm công nhân, mỗi nhóm gồm 5 người như sau :
* Nhóm 1: 20 30 40 50 60 tuổi

Nhóm 2: 38 39 40 41 42 tuổi
Nhân xét :
= 60/5 = 12
= 6/5 = 1,2
Do > nên đại diện <
d
40=x
40=x
1x

2x
1
d
1
d
2
d
2
d
n
xx
d
n
i
i

=

=
1
Ý nghĩa :
Độ lệch tuyệt đối trung bình càng nhỏ,có nghĩa là độ biến thiên lượng biến càng ít  tính đại biểu của số bình quân càng lớn và ngược lại
Ưu điểm :
Thể hiện biến thiên của các lượng biến chặt chẽ,đầy đủ hơn vì nó xét đến sự biến thiên của tất cả các lượng biến so với số bình quân .
Nhược điểm :
Bỏ qua sự khác nhau thực tế về dấu.

Độ lệch tuyệt đối trung bình
d
P

H
Ư
Ơ N
G
S
A
P H Ư
Ơ
N G S A
P H Ư Ơ N G S
A
P
P H
Ư Ơ
N G
S
A
I
I
I
I
σ
2
σ
2
σ
2
σ
2
σ

2
P
P H
Ư Ơ
N G
S
A
I
Khái niệm :
Là số bình quân cộng của bình phương các
độ lệch giữa lượng biến với bình quân các
lượng biến đó.
Công thức : Phương sai tính từ tổng thể:

hay


∑∑
=
=
==

=
−=−=

=
k
i
i
k

i
ii
N
i
i
N
i
i
f
fx
x
N
x
N
x
1
1
2
2
222
1
2
1
2
2
)(
)(
µ
σ
µµ

µ
σ

=
=
k
i
i
fN
1
σ
2
σ
2
σ
2
σ
2
σ
2
P
P H
Ư Ơ
N G
S
A
I
Công thức :
Phương sai mẫu:


Hoặc
Hoặc
,
22
1
1
2
2
1
2
2
)(
ˆ
)(
ˆ
)(
ˆ
xxS
f
fxx
S
n
xx
S
k
i
i
k
i
ii

n
i
i
−=

=

=



=
=
=

=
=
k
i
i
fn
1
σ
2
σ
2
σ
2
σ
2

σ
2
P
P H
Ư Ơ
N G
S
A
I
Công thức :
Phương sai mẫu hiệu chỉnh:

Hay
,
( khi x
i
có các tần số f
i
khác nhau)



=
=
=


=



=
k
i
i
k
i
ii
n
i
i
f
fxx
S
n
xx
S
1
1
2
2
1
2
2
1
)(
1
)(

=
=

k
i
i
fn
1
σ
2
σ
2
σ
2
σ
2
σ
2
P
P H
Ư Ơ
N G
S
A
I
Ý nghĩa :
Phương sai càng bé thì mức độ biến động của tiêu thức ít,tính chất đại biểu của số
trung bình càng cao và ngược lại.
Ưu điểm :
Khắc phục được vấn đề về dấu của các độ lệch tuyệt đối.
Nhược điểm :
- Khuếch đại sai số
- Đơn vị tính toán không phù hợp.

σ
2
σ
2
σ
2
σ
2
σ
2
P
P H
Ư Ơ
N G
S
A
I
Ví dụ :
Quan sát độ tuổi của 2 nhóm công nhân đóng giày, mỗi nhóm gồm 5 người như
sau:
Nhóm 1: 20 30 40 50 60 x1 = 40 tuổi⎯
Nhóm 2: 38 39 40 41 42 x2 = 40 tuổi ⎯

Tính phương sai của mỗi nhóm ?
Nhận xét?
-
σ
2
σ
2

σ
2
σ
2
σ
2
P
P H
Ư Ơ
N G
S
A
I
Nhóm 1 (n= 5, ) Nhóm 2 (n = 5, )

20 -20 400 38 -2 4
30 -10 100 39 -1 1
40 0 0 40 0 0
50 10 100 41 -1 1
60 20 400 42 -2 4
1
xx
i

2
1
)( xx
i

2

xx
i

2
2
)( xx
i

i
x
i
x
40
1
=x
40
2
=x
200
)(
ˆ
1
2
1
2
1
=

=


=
n
xx
s
n
i
i
2
)(
ˆ
1
2
2
2
2
=

=

=
n
xx
s
n
i
i

có nghĩa là mức độ biến thiên của độ tuổi ở
nhóm 1 nhiều hơn nhóm 2  có tính đại diện
thấp hơn

2
2
2
1
ˆˆ
ss >
NẨUH
HCỆộĐ L C
Khái niệm :
Độ lệch chuẩn là căn bậc hai của phương sai.
Công thức tính :

Đối với tổng thể :


Đối với mẫu :
Ý nghĩa :

SD để so sánh độ phân tán của hai dãy số

SD để nhận biết sự phân phối của các giá
trị trong một tập dữ liệu (thể hiện trên 2 quy
tắc: quy tắc Tchebychev và quy tắc
thực nghiệm ).
2
σσ
=
2
ss =
i

x
2
2
)( xx
i

1
xx
i

2
1
)( xx
i

i
x
2
xx
i

Nhóm 1 ( n = 5, ) Nhóm 2 ( n= 5, )

20 -20 400 38 -2 4
30 -10 100 39 -1 1
40 0 0 40 0 0
50 10 100 41 -1 1
60 20 400 42 -2 4
NẨUH
HCỆộĐ L C

142,14
)(
ˆ
1
2
1
1
=

=

=
n
xx
s
n
i
i
40
1
=x
40
2
=x
4142,1
)(
ˆ
1
2
2

2
=

=

=
n
xx
s
n
i
i

chứng tỏ rằng số
trung bình của nhóm có tính đại diện thấp
hơn số trung bình của
nhóm 2
VÍ DỤ
21
ˆˆ
ss >

×