Tải bản đầy đủ (.pdf) (31 trang)

Bài giảng thống kê y tế bài 2

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (256.18 KB, 31 trang )

5/29/2014 1
Đo lường vị trí trung tâm và
biến thiên
Lớp CN YTCC Đồng Tháp
5/29/2014 2
Mục tiêu
• Tính được các giá trị: trung bình, trung vị,
phương sai, độ lệch chuẩn.
• Trình bày được ý nghĩa của những chỉ số: Trung
bình, trung vị, phương sai, độ lệch chuẩn.
5/29/2014 3
Ví dụ 1
• Số liệu Hemoglobin ở 70 phụ nữ
• Làm thế nào để tóm tắt số liệu này?
5/29/2014 4
Tóm tắt số liệu
Đặc trưng chung của bộ số liệu này là gì?
x
i
5/29/2014 5
Tóm tắt số liệu
• Thông qua các con số thống kê cơ bản:
– Mức độ tập trung
• Trung bình
• Trung vị
• Mode (yếu vị)
– Mức độ phân tán
• Khoảng
• Phương sai – Độ lệch chuẩn
• Khoảng phân vị
5/29/2014 6


Đo lường độ tập trung
• Trung bình
• Trung vị
• Mode (yếu vị)
5/29/2014 7
Trung bình
• Giá trị trung bình :
– Trung bình của 2, 5, và 8 là 5, vì 15/3 = 5
– Trung bình của 1, 3, 2, và 8 là 3.5, vì 14/4 = 3.5
 Tính trung bình Hb của 70 phụ nữ ở ví dụ 1
5/29/2014 8
Trung vị
• Trung vị của 1 bộ số liệu là giá trị đứng giữa các quan sát đó nếu
chúng ta xếp các quan sát theo thứ tự.
• Có sự khác biệt giữa giá trị trung vị của bộ số liệu có số quan sát
chẵn và lẻ.
• Ví dụ:
– Trung vị của 1, 3,
15
, 16, và 17 (5 số liệu): là 15.
– Trung vị của 1, 2, 3, 5, 8, và 9 (6 số liệu): là giá trị trung bình của hai
giá trị đứng giữa các quan sát đó
 Tính trung vị của số liệu ví dụ 1, giải thích ý nghĩa?
5/29/2014 9
Mode (yếu vị)
• Giá trị mode của một tập hợp các quan sát là giá trị có
tần số xuất hiện nhiều nhất trong tập hợp đó.
• Ví dụ
– Mode của 1, 2, 2, 3, 4, 5
là 2.

– Tập hợp 1, 2, 3, 4, 5
không có mode.
– Tập hợp 1, 2, 3, 3, 4, 5, 5
có 2 mode: 3 và 5
 Tìm mode trong ví dụ 1
5/29/2014 10
Tại sao?
• Tại sao lại có các giá trị thống kê khác nhau
dùng để đo lường độ tập trung?
• Vì: Chúng có các tính chất, điểm mạnh điểm yếu
để giúp chúng ta hiểu bản chất của bộ số liệu.
5/29/2014 11
Trung bình
• Điểm mạnh
– Tính toán rất đơn giản
– Giá trị trung bình là duy nhất
• Điểm yếu
– Dễ bị ảnh hưởng bởi các giá trị đầu cùng của bộ số
liệu
– Ví dụ
• Trung bình của 1, 2, và 1.000.000 là 333.334,33,
Không thể nói là đại diện cho bộ số liệu được
• Hoặc giá trị trung bình của 1; 2; 9500; 9600; 9700
và 9900 là 6450.5 !
5/29/2014 12
Trung vị
• Điểm mạnh
– Duy nhất đối với mỗi bộ số liệu
– Tiện dụng trong việc mô tả độ lệch của các quan sát
bao gồm cả các quan sát cực lớn hoặc cực nhỏ.

• Điểm yếu
– Do việc xác định giá trị trung vị có sự khác biệt giữa
bộ số liệu chẵn lẻ do đó nó ít được sử dụng trong các
thống kê suy luận
5/29/2014 13
Mode (yếu vị)
• Điểm mạnh
– Nếu một bộ số liệu có giá trị mode, thì sẽ rất hữu
dụng cho ta khi mô tả bộ số liệu đó. Ví dụ: hầu hết
các trường hợp tự tử đều là trẻ em gái tuổi 14-19.
• Điểm yếu
– Có nhiều bộ số liệu không có mode, hoặc có quá
nhiều mode, và trong trường hợp này sử dụng giá trị
mode sẽ không có tác dụng gì nhiều
5/29/2014 14
Đo lường độ phân tán
• Khoảng
• Phương sai – Độ lệch chuẩn
• Khoảng phân vị
5/29/2014 15
Khoảng
• Giá trị
Khoảng
là khoảng cách giữa giá trị lớn
nhất và giá trị nhỏ nhất của bộ số liệu.
• Ví dụ
– Khoảng của bộ số liệu 2, 4, 7 là 5.
– Khoảng của bộ số liệu -10, -3, 4 là 14.
• Thông thường trong mô tả: ghi rõ số nhỏ nhất –
số lớn nhất

– Số ngày nằm viện trung bình là 10 ngày (1-50 ngày)
 Nêu khoảng của bộ số liệu ví dụ 1?
5/29/2014 16
Phân tán
Trung bình
So với trung bình, mức độ phân tán
của bộ số liệu này được đánh giá như thế nào?
x
i
0
5/29/2014 17
Vấn đề
• Nếu cộng tất cả các chênh lệch, vấn đề gì sẽ
xảy ra?
• Giải pháp
(
x
i - )²
• Khi đó, phương sai được tính là
S
x x
n
x nx
n
x n x
n
i
i
n
i

i
n
2
2
1
2 2
1
2 2
1
1
1









 
 

( )
5/29/2014 18
Ví dụ 2
• Tuổi của 10 đối tượng:
42 28 28 61 31 23 50 34 32 37
Tính phương sai của tuổi
5/29/2014 19

Các bước
• Tính trung bình
• Tính hiệu số (xi - )
• Bình phương hiệu số
trên
• Cộng tất cả các bình
phương
• Chia cho (n-1)
• Tính trung bình
• Bình phương mỗi giá
trị quan sát
• Cộng các bình
phương
• Tính ( )
• Chia cho (n-1)
5/29/2014 20
Độ lệch chuẩn
• Điểm yếu của phương sai: đơn vị đo lường
bình phương
• Độ lệch chuẩn (standard deviation – SD, S): lấy
căn của phương sai
• Tính độ lệch chuẩn của ví dụ 2
5/29/2014 21
Ý nghĩa
• Minh họa mức độ phân tán của số liệu
– Khoảng 68% các giá trị quan sát sẽ nằm trong
khoảng (trung bình ± s)
– Khoảng 95% các giá trị quan sát nằm trong khoảng
(trung bình ± 2s)
– Hầu hết nằm trong khoảng (trung bình ± 3s)

 Minh họa mức độ phân tán của ví dụ 2
5/29/2014 22
Ví dụ 3
• Khoảng bách phân vị trong theo dõi dinh
dưỡng trẻ em
• Phân vị là gì?
5/29/2014 23
Phân vị
• Mô tả tỷ lệ số liệu có giá trị dưới giá trị
phân vị
• Phiên giải:
– Phân vị 25% của 1 bộ số liệu là 3?
– Phân vị 50% của 1 bộ số liệu là 8?
– Phân vị 75% của 1 bộ số liệu là 11?
– Phân vị 100%?
5/29/2014 24
Ví dụ 4
0.5 1.2 2.1 2.5 2.5 3.0 3.8 4.0 4.2 4.5
5.0 5.0 5.0 5.0 6.0 6.5 7.0 8.0 9.5 13.0
Đường kính (tính bằng cm) của khối u Sarcomas
được lấy ra từ ngực của 20 phụ nữ
-Nhận xét bộ số liệu
Tính phân vị 25%, 50%, 75%
Vấn đề?
5/29/2014 25
Phân vị (tt)
• Phân vị ¼
– Q
1
= giá trị quan sát thứ (n+1)/4

– Q
2
= giá trị quan sát thứ (n+1)/2
– Q
3
= giá trị quan sát thứ 3(n+1)/4

×