Tải bản đầy đủ (.pdf) (24 trang)

Bài giảng Sinh thống kê căn bản

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (420.74 KB, 24 trang )

GS TS LÊ HOÀNG NINH


Mục tiêu

 Tổng quan về các khái niệm và các

từ dùng trong sinh thống kê
 Áp dụng các test thống kê


Tại sao dùng thống kê?
 Thống kê mô tả



Nhận diện kiểu hình
Đặt một giả thuyết

 Thống kê suy lý


Phân biệt , làm rõ các sự khác biệt thật



Cho phép kiểm định một giả thuyết


Tại sao dùng thống kê?
Cardiovascular Mortality in Males


1.2
1
0.8
SMR 0.6
0.4
0.2
0
'35-'44 '45-'54 '55-'64 '65-'74 '75-'84

Bangor
Roseto

AJPH 1992


Các loại dữ liệu
 Số

Liên tục
 Rời


 Loại

tên
 Thứ tự



Thống kê mô tả

 Nhận ra kiểu hình dữ liệu
 Nhận ra những ngoại lệ, bên ngoài
 Hướng chọn test thống kê


Thống kê mô tả
Tỷ lệ mẫu dương tính với bệnh X
năm 1998-99
35
30
25
20
15
10
5
0

South
Northeast
West
Midwest


Mô tả dữ liệu bằng con
số
Số đo khuynh hướng trung tâm





Số trung bình --MEAN
Số trung vị -- trị số ở giữa
MODE – các trị số có tần số xuất hiện cao
nhất


Phân bố thứ hạng sinh
viên trong khóa học 2013
14
12
10
Number of
Students

8
6
4
2
0

A

A- B+

B

B- C+ C
Grade

C- D+ D


D-

F


Mô tả dữ liệu bằng con
số
Các số đo độ phân tán




Biên độ
Độ lệch chuẩn STANDARD DEVIATION
Độ nghiên SKEWNESS


Số đo độ phân tán
• Biên độ



Độ lệch chuẩn SD




Trị số cao và thấp nhất
Đo độ gần của dữ liệu so với trị số trung

bình

Độ nghiên


Xem tính đối xứng của đường cong


Số đo độ phân tán
• RANGE



Độ lệch chuẩn




highest to lowest values
how closely do values cluster around the
mean value

Độ nghiên


refers to symmetry of curve


Độ lệch chuẩn
Standard Deviation

Curve A

Curve B

B
A


Số đo độ phân tán


RANGE




STANDARD DEVIATION




highest to lowest values
how closely do values cluster around the
mean value

Độ nghiên SKEWNESS


refers to symmetry of curve



Skewness

Mean

Median

Mode

Curve A

Curve B

negative
skew


Phân phối bình thường
 TB = TV = Mode
 Độ nghiên = 0
 68% trị số trong

khoảng 1 SD
 95% trị số trong
khoảng 2 SDs

Mean, Median, Mode

.


1

2


Thống kê suy lý
Dùng để xác định khả năng một kết luận
dựa trên bô dữ liệu trên một mẫu là đúng
trên quần thể.


Các từ
Giá trị p : khả năng, xác suất sự khác biệt
quan sát được có thể xảy ra là do cơ hội.
(chance)


Thử nghiệm cao huyết áp
DRUG Baseline mean SBP F/u mean SBP

A

150

130

B

150


125


Từ
Khoảng tin cậy:
Là biên độ các trị số mà chắc chắn là có
chứa trị số thật trên quần thể


30 Day % Mortality
Study

IC STK Control

p

N

Khaja

5.0

10.0

0.55

40

Anderson


4.2

15.4

0.19

50

Kennedy

3.7

11.2

0.02 250


95% Confidence Intervals
Khaja
(n=40)
Anderson
(n=50)

Kennedy
(n=250)

-.40 -.35 -.30 -.25 -.20 -.15 -.10 -.05

.00


.05

.10

.15

.20


Các kiểu sai lầm
Sự thật
No
difference

Kết luận

No
difference
Difference

Difference

TYPE II
ERROR ( )
TYPE I
ERROR ( )

Power = 1­



Test nào được sử dụng?
1. What type of data?
2. How many samples?
3. Are the data normally distributed?
4. What is the sample size?



×