Thống kê mô tả
Biến số định lượng
Đỗ Văn Dũng
Đại học Y Dược TP Hồ Chí Minh
DoDzung - Trinh bay so lieu 1
Các bước phân tích số liệu
1- Kiểm tra và làm sạch số liệu nếu cần
2- Mô tả dân sơ
3- Phân tích liên quan giữaa 2 biến
4- Phân tích đa biến (n
DoDzung - Trinh bay so lieu 2
DoDzung - Trinh bay so lieu 3
Biến số
Biến số: Đại lượng hay đặc tính khác nhau giữa các đối
tượng
Các loại biến số:
BS Định lượng (biến số liên tục): Đại lượng có thể đo lường (có
đơn vị)
Biến tỉ số (ratio)
Biến khoảng (interval)
BS Định tính (BS phân loại): mơ tả đặc tính
Danh định (nominal): khơng có tính thứ tự
Thứ tự (ordinal): có tính thứ tự
Nhị giá (binary): chỉ có hai giá trị
Biến sống còn
DoDzung - Trinh bay so lieu 4
Biến số, thống kê, tham số
Biến số: Đặc tính hay đại lượng có thể thay đổi của các đối
tượng:
Có hút thuốc lá hay khơng hút thuốc lá
Chiều cao của một người
Thống kê: đặc trưng của đặc tính hay đại lượng của mẫu
Tỉ lệ hút thuốc lá ở trong mẫu nghiên cứu gồm 100 thanh niên
Chiều cao trung bình 100 thanh niên trong mẫu nghiên cứu
Tham số: Đặc trưng của đặc tính hay đại lượng của dân số
Tỉ lệ hút thuốc lá ở nam thanh niên Việt Nam
Chiều cao trung bình của nam thanh niên Việt Nam
DoDzung - Trinh bay so lieu 5
Số thống kê tóm tắt
Giá trị tiêu biểu x xi
N
Trung bình (mean)
Trung vị: (median) Giá trị ở giữa của số liệu được sắp thứ tự
(Nếu có 2 giá trị ở giữa, trung vị là trung bình của 2 giá trị này)
Yếu vị: (mode) Giá trị phổ biến nhất (tần suất cao nhất)
Độ phân tán n s (xi x)2
Độ lệch chuẩn (standard deviation) i1 N 1
Phương sai (variance) s2 n (xi x)2
i1 N 1
Khoảng phân tứ phân vị: (IQR) các giá trị chia số liệu làm 4 phần
bằng nhau
Phạm vi: Giá trị tối thiểu – tối đa
DoDzung - Trinh bay so lieu 7
DoDzung - Trinh bay so lieu 8
Tính trung vị của số liệu sau
5
6
8
7
9
DoDzung - Trinh bay so lieu 9
Tính trung vị của số liệu sau
5
6
7
8
9
10
DoDzung - Trinh bay so lieu 10
° Một cơng ty có 100 cơng nhân và 1 giám đốc.
Công nhân lãnh lương 1 triệu đồng /tháng và giám
đốc lãnh 100 triệu đồng/tháng. Lương bình quân là
2 triệu đồng
DoDzung - Trinh bay so lieu 11
Phân phối bình thường Lệch dương Lệch âm
Phân phối hai đỉnh Phân phối J ngược
DoDzung - Trinh bay so lieu 12
Số thống kê tóm tắt
Giá trị tiêu biểu x xi
N
Trung bình (mean)
Trung vị: (median) Giá trị ở giữa của số liệu được sắp thứ tự
(Nếu có 2 giá trị ở giữa, trung vị là trung bình của 2 giá trị này)
Yếu vị: (mode) Giá trị phổ biến nhất (tần suất cao nhất)
Độ phân tán n s (xi x)2
Độ lệch chuẩn (standard deviation) i1 N 1
Phương sai (variance) s2 n (xi x)2
i1 N 1
Khoảng phân tứ phân vị: (IQR) các giá trị chia số liệu làm 4 phần
bằng nhau
Phạm vi: Giá trị tối thiểu – tối đa
DoDzung - Trinh bay so lieu 13
° Số liệu đường huyết (mg%) của 5 người khỏe
mạnh là: 80, 90, 100, 110, 120. Đường huyết trung
bình là 100 mg%. Độ lệch chuẩn (standard
deviation = Std. dev) của đường huyết là:
a. 5
b. 15
c. 40
d. 225
DoDzung - Trinh bay so lieu 14
DoDzung - Trinh bay so lieu 15
Tứ phân vị (quartile)
Tứ phân vị trên (upper quartile) còn gọi là
bách phân vị (percentile) 75%
Tứ phân vị dưới (lower quartile) còn gọi là
bách phân vị (percentile) 25%
Trung vị (median) còn gọi là bách phân vị
(percentile) 50%
DoDzung - Trinh bay so lieu 16
Nguyên tắc chung cho bảng
– Đơn giản
• Đặc tính của khơng q 2 biến phân nhóm
• Tối ưu hóa số số lẻ của số thống kê
– Đầy đủ thơng tin
• Bảng, hàng, cột phải có tiêu đề
• Biến định lượng có đơn vị; biến định tính có liệt kê đủ giá trị
• Biến số định lượng phải có trung bình và độ lệch chuẩn; biến định tính
phải có tỉ lệ %
• Các chữ viết tắt và kí hiệu phải được chú thích
• Phải ghi nhận cỡ mẫu N
DoDzung - Trinh bay so lieu 17
DoDzung - Trinh bay so lieu 18
DoDzung - Trinh bay so lieu 19
DoDzung - Trinh bay so lieu 20