Trường đại học Y tế Công cộng
Bộ môn Thống kê
Nguyễn thị Trang Nhung
Thống kê mô tả cho biến liên tục
Mục tiêu bài học
Sau khi hoàn thành bài học này sinh viên có thể:
1.
Thao tác để tìm hiểu bộ số liệu cần phân tích
2.
Kiểm tra tính chuẩn của biến
3.
Tính toán các đại lượng thống kê phù hợp với phân bố của biến
Nội dung
Đếm số quan sát, số biến
Mã hóa một biến
Kiểm tra tính chuẩn của biến
Tính toán các đại lượng thống kê mô tả
Đếm số quan sát và số biến
Dùng cửa sổ variable view để xem số biến
Dùng lệnh frequency để xem số quan sát trong mỗi biến
Mã hóa biến
Chuyển một biến dạng liên tục thành dạng phân loại
Ví dụ: Mã hóa biến tuổi của mẹ thành 3 nhóm:
Nhóm 1: Dưới 30 tuổi
Nhóm 2: 30-34 tuổi
Nhóm 3: 35-39 tuổi
Nhóm 4: 40 và trên 40 tuổi
Mã hóa lại biến
Mã hóa lại biến
Mã hóa lại biến
Dán nhãn cho biến mới mã hóa
Sinh viên hãy tự dán nhãn cho các giá trị biến tuổi của mẹ được mã hóa ở trên
Tính toán giá trị thống kê mô tả
Hãy tính toán đại lượng mô tả cân nặng khi sinh của trẻ trong nghiên cứu này
Đại lượng mô tả cho biến phụ thuộc vào
Loại biến
Phân bố của biến
Tính toán thống kê mô tả
Biến cân nặng khi sinh là biến
Liên tục
Biến có phân bố chuẩn ???? (kiểm tra phân bố chuẩn)
Nếu biến có phân bố chuẩn :
Giá trị trung bình và độ lệch chuẩn được dùng để mô tả
Nếu biến không có phân bố chuẩn thì:
Giá trị trung vị, khoảng (giá trị lớn nhất và giá trị nhỏ nhất) dùng để mô tả biến đó
Kiểm tra tính chuẩn của biến
-Dùng biểu đồ Đa giác tần số (histogram)
Dùng biểu đồ P- P plot
Dùng đa giác tần số
Dùng biểu đồ P- P plot
Biểu đồ P-P plot
Kết luận
Biến cân nặng khi sinh có dạng xấp xỉ chuẩn nên giá trị trung bình và độ lệch chuẩn được
dùng để mô tả biến
Lưu ý
Đánh giá phân bố qua biểu đồ tương đối chủ quan và linh hoạt
Tóm tắt
Mã hóa biến bằng lệnh Recode
Kiểm tra tính chuẩn của biến liên tục bằng biểu đồ Đa giác tần số và biểu đồ P –P plot
Tính tóan giá trị trung bình, độ lệch chuẩn , trung vị , giá trị nhỏ nhất và giá trị lớn nhất bằng
lệnh frequency
Bài tập thực hành