GS TS LÊ HOÀNG NINH
Mục tiêu
Tổng quan về các khái niệm và các
từ dùng trong sinh thống kê
Áp dụng các test thống kê
Tại sao dùng thống kê?
Thống kê mô tả
•
•
Nhận diện kiểu hình
Đặt một giả thuyết
Thống kê suy lý
•
Phân biệt , làm rõ các sự khác biệt thật
•
Cho phép kiểm định một giả thuyết
Tại sao dùng thống kê?
Cardiovascular Mortality in Males
1.2
1
0.8
SMR 0.6
0.4
0.2
0
'35-'44 '45-'54 '55-'64 '65-'74 '75-'84
Bangor
Roseto
AJPH 1992
Các loại dữ liệu
Số
Liên tục
Rời
Loại
tên
Thứ tự
Thống kê mô tả
Nhận ra kiểu hình dữ liệu
Nhận ra những ngoại lệ, bên ngoài
Hướng chọn test thống kê
Thống kê mô tả
Tỷ lệ mẫu dương tính với bệnh X
năm 1998-99
35
30
25
20
15
10
5
0
South
Northeast
West
Midwest
Mô tả dữ liệu bằng con
số
Số đo khuynh hướng trung tâm
•
•
•
Số trung bình --MEAN
Số trung vị -- trị số ở giữa
MODE – các trị số có tần số xuất hiện cao
nhất
Phân bố thứ hạng sinh
viên trong khóa học 2013
14
12
10
Number of
Students
8
6
4
2
0
A
A- B+
B
B- C+ C
Grade
C- D+ D
D-
F
Mô tả dữ liệu bằng con
số
Các số đo độ phân tán
•
•
•
Biên độ
Độ lệch chuẩn STANDARD DEVIATION
Độ nghiên SKEWNESS
Số đo độ phân tán
• Biên độ
•
Độ lệch chuẩn SD
•
Trị số cao và thấp nhất
Đo độ gần của dữ liệu so với trị số trung
bình
Độ nghiên
Xem tính đối xứng của đường cong
Số đo độ phân tán
• RANGE
•
Độ lệch chuẩn
•
highest to lowest values
how closely do values cluster around the
mean value
Độ nghiên
refers to symmetry of curve
Độ lệch chuẩn
Standard Deviation
Curve A
Curve B
B
A
Số đo độ phân tán
•
RANGE
•
STANDARD DEVIATION
•
highest to lowest values
how closely do values cluster around the
mean value
Độ nghiên SKEWNESS
refers to symmetry of curve
Skewness
Mean
Median
Mode
Curve A
Curve B
negative
skew
Phân phối bình thường
TB = TV = Mode
Độ nghiên = 0
68% trị số trong
khoảng 1 SD
95% trị số trong
khoảng 2 SDs
Mean, Median, Mode
.
1
2
Thống kê suy lý
Dùng để xác định khả năng một kết luận
dựa trên bô dữ liệu trên một mẫu là đúng
trên quần thể.
Các từ
Giá trị p : khả năng, xác suất sự khác biệt
quan sát được có thể xảy ra là do cơ hội.
(chance)
Thử nghiệm cao huyết áp
DRUG Baseline mean SBP F/u mean SBP
A
150
130
B
150
125
Từ
Khoảng tin cậy:
Là biên độ các trị số mà chắc chắn là có
chứa trị số thật trên quần thể
30 Day % Mortality
Study
IC STK Control
p
N
Khaja
5.0
10.0
0.55
40
Anderson
4.2
15.4
0.19
50
Kennedy
3.7
11.2
0.02 250
95% Confidence Intervals
Khaja
(n=40)
Anderson
(n=50)
Kennedy
(n=250)
-.40 -.35 -.30 -.25 -.20 -.15 -.10 -.05
.00
.05
.10
.15
.20
Các kiểu sai lầm
Sự thật
No
difference
Kết luận
No
difference
Difference
Difference
TYPE II
ERROR ( )
TYPE I
ERROR ( )
Power = 1
Test nào được sử dụng?
1. What type of data?
2. How many samples?
3. Are the data normally distributed?
4. What is the sample size?