Tải bản đầy đủ (.ppt) (31 trang)

ĐO LƯỜNG VỊ TRÍ TRUNG TÂM VÀ BIẾN THIÊN, LỚP CN YTCC K10

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (226.64 KB, 31 trang )

08/02/15 1
Đo lường vị trí trung tâm và
biến thiên
Lớp CN YTCC K10
08/02/15 2
Mục tiêu

Tính được các giá trị: trung bình, trung vị,
phương sai, độ lệch chuẩn.

Trình bày được ý nghĩa của những chỉ số:
Trung bình, trung vị, phương sai, độ lệch
chuẩn.
08/02/15 3
Ví dụ 1

Số liệu Hemoglobin ở 70 phụ nữ

Làm thế nào để tóm tắt số liệu này?
08/02/15 4
Tóm tắt số liệu
Đặc trưng chung của bộ số liệu này là gì?
xi
08/02/15 5
Tóm tắt số liệu

Thông qua các con số thống kê cơ bản:

Mức độ tập trung

Trung bình



Trung vị

Mode (yếu vị)

Mức độ phân tán

Khoảng

Phương sai – Độ lệch chuẩn

Khoảng phân vị
08/02/15 6
Đo lường độ tập trung

Trung bình

Trung vị

Mode (yếu vị)
08/02/15 7
Trung bình

Giá trị
trung bình
trung bình :

Trung bình của 2, 5, và 8 là 5, vì 15/3 = 5

Trung bình của 1, 3, 2, và 8 là 3.5, vì 14/4 = 3.5

 Tính trung bình Hb của 70 phụ nữ ở ví dụ 1
08/02/15 8
Trung vị

Trung vị của 1 bộ số liệu là giá trị đứng giữa các quan sát đó
nếu chúng ta xếp các quan sát theo thứ tự.

Có sự khác biệt giữa giá trị trung vị của bộ số liệu có số quan
sát chẵn và lẻ.

Ví dụ:

Trung vị của 1, 3, 15, 16, và 17 (5 số liệu): là 15.

Trung vị của 1, 2, 3, 5, 8, và 9 (6 số liệu): là giá trị trung bình của
hai giá trị đứng giữa các quan sát đó
 Tính trung vị của số liệu ví dụ 1, giải thích ý nghĩa?
08/02/15 9
Mode (yếu vị)

Giá trị mode của một tập hợp các quan sát là giá trị
có tần số xuất hiện nhiều nhất trong tập hợp đó.

Ví dụ

Mode của 1, 2, 2, 3, 4, 5
là 2.

Tập hợp 1, 2, 3, 4, 5
không có mode.


Tập hợp 1, 2, 3, 3, 4, 5, 5
có 2 mode: 3 và 5
 Tìm mode trong ví dụ 1
08/02/15 10
Tại sao?

Tại sao lại có các giá trị thống kê khác nhau
dùng để đo lường độ tập trung?

Vì: Chúng có các tính chất, điểm mạnh điểm
yếu để giúp chúng ta hiểu bản chất của bộ số
liệu.
08/02/15 11
Trung bình

Điểm mạnh

Tính toán rất đơn giản

Giá trị trung bình là duy nhất

Điểm yếu

Dễ bị ảnh hưởng bởi các giá trị đầu cùng của bộ số liệu

Ví dụ

Trung bình của 1, 2, và 1.000.000 là 333.334,33, Không
thể nói là đại diện cho bộ số liệu được


Hoặc giá trị trung bình của 1; 2; 9500; 9600; 9700 và
9900 là 6450.5 !
08/02/15 12
Trung vị

Điểm mạnh

Duy nhất đối với mỗi bộ số liệu

Tiện dụng trong việc mô tả độ lệch của các quan
sát bao gồm cả các quan sát cực lớn hoặc cực
nhỏ.

Điểm yếu

Do việc xác định giá trị trung vị có sự khác biệt
giữa bộ số liệu chẵn lẻ do đó nó ít được sử dụng
trong các thống kê suy luận
08/02/15 13
Mode (yếu vị)

Điểm mạnh

Nếu một bộ số liệu có giá trị mode, thì sẽ rất hữu
dụng cho ta khi mô tả bộ số liệu đó. Ví dụ: hầu hết
các trường hợp tự tử đều là trẻ em gái tuổi 14-19.

Điểm yếu


Có nhiều bộ số liệu không có mode, hoặc có quá
nhiều mode, và trong trường hợp này sử dụng giá
trị mode sẽ không có tác dụng gì nhiều
08/02/15 14
Đo lường độ phân tán

Khoảng

Phương sai – Độ lệch chuẩn

Khoảng phân vị
08/02/15 15
Khoảng

Giá trị Khoảng là khoảng cách giữa giá trị lớn
nhất và giá trị nhỏ nhất của bộ số liệu.

Ví dụ

Khoảng của bộ số liệu 2, 4, 7 là 5.

Khoảng của bộ số liệu -10, -3, 4 là 14.

Thông thường trong mô tả: ghi rõ số nhỏ nhất
– số lớn nhất

Số ngày nằm viện trung bình là 10 ngày (1-50 ngày)
 Nêu khoảng của bộ số liệu ví dụ 1?
08/02/15 16
Phân tán

Trung bình
So với trung bình, mức độ phân tán
của bộ số liệu này được đánh giá như thế nào?
xi
0
08/02/15 17
Vấn đề

Nếu cộng tất cả các chênh lệch, vấn đề gì sẽ
xảy ra?

Giải pháp
(xi - )²

Khi đó, phương sai được tính là
S
x x
n
x n x
n
x n x
n
i
i
n
i
i
n
2
2

1
2 2
1
2 2
1 1 1
=


=


=


= =
∑ ∑

( )
08/02/15 18
Ví dụ 2

Tuổi của 10 đối tượng:
42 28 28 61 31 23 50 34 32 37

Tính phương sai của tuổi
08/02/15 19
Các bước

Tính trung bình


Tính hiệu số (xi - )

Bình phương hiệu
số trên

Cộng tất cả các bình
phương

Chia cho (n-1)

Tính trung bình

Bình phương mỗi
giá trị quan sát

Cộng các bình
phương

Tính ( )

Chia cho (n-1)
08/02/15 20
Độ lệch chuẩn

Điểm yếu của phương sai: đơn vị đo lường
bình phương

Độ lệch chuẩn (standard deviation – SD, S):
lấy căn của phương sai


Tính độ lệch chuẩn của ví dụ 2
08/02/15 21
Ý nghĩa

Minh họa mức độ phân tán của số liệu

Khoảng 68% các giá trị quan sát sẽ nằm trong
khoảng (trung bình ± s)

Khoảng 95% các giá trị quan sát nằm trong
khoảng (trung bình ± 2s)

Hầu hết nằm trong khoảng (trung bình ± 3s)
 Minh họa mức độ phân tán của ví dụ 2
08/02/15 22
Ví dụ 3

Khoảng bách phân vị trong theo dõi dinh
dưỡng trẻ em

Phân vị là gì?
08/02/15 23
Phân vị

Mô tả tỷ lệ số liệu có giá trị dưới giá trị phân
vị

Phiên giải:

Phân vị 25% của 1 bộ số liệu là 3?


Phân vị 50% của 1 bộ số liệu là 8?

Phân vị 75% của 1 bộ số liệu là 11?

Phân vị 100%?
08/02/15 24
Ví dụ 4
0.5 1.2 2.1 2.5 2.5 3.0 3.8 4.0 4.2 4.5
5.0 5.0 5.0 5.0 6.0 6.5 7.0 8.0 9.5 13.0
Đường kính (tính bằng cm) của khối u Sarcomas
được lấy ra từ ngực của 20 phụ nữ
-
Nhận xét bộ số liệu
Tính phân vị 25%, 50%, 75%
Vấn đề?
08/02/15 25
Phân vị (tt)

Phân vị ¼

Q
1
= giá trị quan sát thứ (n+1)/4

Q
2
= giá trị quan sát thứ (n+1)/2

Q

3
= giá trị quan sát thứ 3(n+1)/4

×