Tải bản đầy đủ (.pdf) (16 trang)

Chuong 2 thong ke mo ta

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (947.54 KB, 16 trang )

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP THỰC PHẨM

KHOA CÔNG NGHỆ THỰC PHẨM

Bài giảng

THỐNG KÊ MÔ TẢ

Các tham số của dữ liệu liên tục

Đo lường xu hướng tại tâm
 Trung bình
 Trung vị
 Số mode
Đo lường độ phân tán
 Phương sai
 Độ lệch chuẩn, sai số chuẩn
 Khoảng phần tư

2

Các tham số mô tả dữ liệu liên tục

Giá trị trung bình (mean) là tổng tất cả giá trị của
các dữ liệu chia cho số lượng của dữ liệu.

1 𝑛 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛

𝑋 = 𝑛 𝑋𝑖 = 𝑛
𝑖=1


N: số phần tử
𝑋: giá trị trung bình

3

Các tham số mô tả dữ liệu liên tục

SỐ TRUNG VỊ (Median)
Trung vị (median) là giá trị của số liệu có vị trí nằm giữa bộ
số liệu sắp xếp theo trật tự. Đây chính là điểm giữa của phân
phối. Khi số quan sát là chẵn, trung vị là giá trị trung bình của
hai quan sát ở vị trí trung tâm.
`

SỐ YẾU VỊ (Mode)
Số yếu vị của tập dữ liệu là số có tần suất lớn nhất

4

Các tham số mô tả dữ liệu liên tục

0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6

5

Các tham số mô tả dữ liệu liên tục

Phương sai (Variance; σ2)


Là trung bình tổng các sai số bình phương

giữa các giá trị của các quan sát và giá trị

trung bình. 𝑛

σ2 = 1 𝑋𝑖 − 𝑋 2 𝐴 = 𝜋𝑟2
𝑛−1
𝑖=1

σ2: phương sai mẫu
n: số phần tử
𝑋: giá trị trung bình

6

Các tham số mô tả dữ liệu liên tục

Độ lệch chuẩn (Standard deviation; SD; σ)

Đo lường mức độ phân tán của số liệu xung quanh giá trị
trung bình.

SD   2

7

Các tham số mô tả dữ liệu liên tục


Độ Lệch Chuẩn (Standard Deviation – SD)

Ví dụ: Một biến số phản ảnh tình trạng của một
bệnh trong hai nhóm bệnh nhân (nhóm A gồm 6
bệnh nhân, và nhóm B gồm 4 bệnh nhân) như
sau:

Nhóm A: 6, 7, 8, 4, 5, 6
Nhóm B: 10, 2, 3, 9

8

Các tham số mô tả dữ liệu liên tục

Sai số chuẩn của giá trị trung bình (SE)

Đo lường phạm vi mà giá trị trung bình của quần
thể(μ) có thể xuất hiện với một xác suất cho trước

dựa trên giá trị trung bình của mẫu (mean)

SE = 𝑆𝐷

√𝑛

9

Các tham số mô tả dữ liệu liên tục

Sai số chuẩn (Standard Error – SE)


Sai số chuẩn bằng độ lệch chuẩn chia cho căn số bậc
hai của số cỡ mẫu (n)

SE = 𝑆𝐷 6 = 0.58
4 = 2.04
√𝑛

SEA = 1.41/
SEB = 4.08/

10

Các tham số mô tả dữ liệu liên tụcPercent (%)

6
5
4
3
2
1
0

22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 92

Weight (kg)

Phân phối về khối lượng của toàn bộ dân số có thể được thể hiện như sau

11


Các tham số mô tả dữ liệu liên tục

68 %

95 %

99.7 %

 -3  -2  -   +  +2  +3

Độ lệch chuẩn

12

Các tham số mô tả dữ liệu liên tục

Giá trị ở tại các vị trí 25%, 50%, 75% của phân phối chia làm
4 phần chứa vị trí ¼ của tập hợp

25% 25% 25% 25%

Q1  Q2  Q3 

13

Các tham số mô tả dữ liệu liên tục

Q1 Q2 Q3 Q1Q2Q3 Q1 Q2 Q3


14

Các tham số mô tả dữ liệu liên tục

𝑄2: trung vị của data
Vùng lower set: những quan sát nhỏ hơn 𝑄2
Vùng upper set: những quan sát lớn hơn 𝑄2
𝑄1: trung vị của vùng lower set
𝑄3: trung vị của vùng upper set

15

Câu hỏi ơn tập

1. Phân biệt trung bình mẫu và trung vị mẫu
2. Phân biệt tổng thể và mẫu
3. Phân biệt độ lệch chuẩn và sai số chuẩn
4. Phương sai mẫu đượiic tính như thế nào?
5. Xác định các giá trị Q trên biểu đồ boxplot
6. Kể tên các loại thang đo
7. Phân biệt biến độc lập và phụ thuộc
8. Kể tên các tham số của mẫu

16


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×