Tải bản đầy đủ (.pdf) (72 trang)

Bài giảng Thống kê kinh doanh Chương 4 Thống kê mô tả full

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.03 MB, 72 trang )

Bài giảng
THỐNG KÊ KINH DOANH
Chương 4. THỐNG KÊ MÔ TẢ

Thạc sĩ Nguyễn Công Nhựt
Khoa KHCB
Trường Đại học Văn Lang
Ngày 13 tháng 10 năm 2022
Nguyen Cong Nhut

Thống kê Kinh doanh

Ngày 13 tháng 10 năm 2022

1 / 71


THỐNG KÊ KINH DOANH

⋆ Hướng dẫn cách học - chi tiết cách đánh giá môn học
Tài liệu, video bài giảng được đưa lên elearning hàng tuần. Sinh viên tải về, in ra và mang
theo khi học. Điểm tổng kết môn học được đánh giá xuyên suốt quá trình học
⋆ Điểm quá trình: 50%
⋆ Thi cuối kỳ: 50%

⋆ Cán bộ giảng dạy








Thạc sĩ Nguyễn Công Nhựt
ĐT: 0933373432
Email:
Zalo: 0378910071
Facebook: />Website: />Nguyen Cong Nhut

Thống kê Kinh doanh

Ngày 13 tháng 10 năm 2022

2 / 71


Content

1

BIẾN NGẪU NHIÊN

2

MỘT SỐ PHÂN PHỐI XÁC SUẤT THÔNG DỤNG

3

NGUYÊN LÝ THỐNG KÊ

4


THỐNG KÊ MÔ TẢ

5

ƯỚC LƯỢNG KHOẢNG

6

KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

7

CHUỖI THỜI GIAN VÀ DỰ BÁO TRÊN CHUỖI THỜI GIAN

Nguyen Cong Nhut

Thống kê Kinh doanh

Ngày 13 tháng 10 năm 2022

3 / 71


Content

1

BIẾN NGẪU NHIÊN


2

MỘT SỐ PHÂN PHỐI XÁC SUẤT THÔNG DỤNG

3

NGUYÊN LÝ THỐNG KÊ

4

THỐNG KÊ MÔ TẢ

5

ƯỚC LƯỢNG KHOẢNG

6

KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

7

CHUỖI THỜI GIAN VÀ DỰ BÁO TRÊN CHUỖI THỜI GIAN

Nguyen Cong Nhut

Thống kê Kinh doanh

Ngày 13 tháng 10 năm 2022


4 / 71


Content

1

BIẾN NGẪU NHIÊN

2

MỘT SỐ PHÂN PHỐI XÁC SUẤT THÔNG DỤNG

3

NGUYÊN LÝ THỐNG KÊ

4

THỐNG KÊ MÔ TẢ

5

ƯỚC LƯỢNG KHOẢNG

6

KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

7


CHUỖI THỜI GIAN VÀ DỰ BÁO TRÊN CHUỖI THỜI GIAN

Nguyen Cong Nhut

Thống kê Kinh doanh

Ngày 13 tháng 10 năm 2022

5 / 71


Content

1

BIẾN NGẪU NHIÊN

2

MỘT SỐ PHÂN PHỐI XÁC SUẤT THÔNG DỤNG

3

NGUYÊN LÝ THỐNG KÊ

4

THỐNG KÊ MÔ TẢ


5

ƯỚC LƯỢNG KHOẢNG

6

KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

7

CHUỖI THỜI GIAN VÀ DỰ BÁO TRÊN CHUỖI THỜI GIAN

Nguyen Cong Nhut

Thống kê Kinh doanh

Ngày 13 tháng 10 năm 2022

6 / 71


CHƯƠNG 4 THỐNG KÊ MÔ TẢ
NỘI DUNG

4-1 Dạng 1 : Các đặc trưng đo mức tập trung của dữ liệu (trung bình, trung vị và yếu vị)
4-2 Dạng 2 : Các đặc trưng đo mức phân tán của dữ liệu (độ lệch tuyệt đối bình quân,
phương sai và độ lệch chuẩn mẫu, hệ số biến thiên)
4-3 Các hệ số đo vị trí tương đối của dữ liệu
4-4 Các hệ số tương quan của các bộ dữ liệu
4-5 Các hệ số đo hình dạng của quy luật phân phối

Nguyen Cong Nhut

Thống kê Kinh doanh

Ngày 13 tháng 10 năm 2022

7 / 71


CHƯƠNG 4 THỐNG KÊ MÔ TẢ
YÊU CẦU CẦN NẮM

Dựa trên mẫu dữ liệu sinh viên tính tốn được các đặc trưng số của dữ liệu gồm:

⋆ Các đặc trưng đo mức bình quân và tập trung của dữ liệu: trung bình, trung vị (median)
và yếu vị (mode)
⋆ Các đặc trưng đo mức độ phân tán của dữ liệu: khoảng biến thiên, độ lệch tuyệt đối bình
quân, phương sai, độ lệch chuẩn, hệ số biến thiên.
⋆ Các đặc trưng đo vị trí tương đối của dữ liệu: tứ phân vị, phân vị, quy tắc 3 sigma.
⋆ Hệ số tương quan giữa các bộ dữ liệu.

Nguyen Cong Nhut

Thống kê Kinh doanh

Ngày 13 tháng 10 năm 2022

8 / 71



4.1. Các đại lượng đo mức độ tập trung của dữ liệu
4.1.1. Số trung bình số học

Định nghĩa
Số trung bình số học hay là trung bình cộng được xác định bằng cách lấy tổng tất cả
các lượng biến và chia cho số lượng biến của đơn vị khảo sát.

Trung bình tổng thể (kỳ vọng)
Giả sử tổng thể có kích thước N với các giá trị x1 , · · · , xN , trung bình của tổng thể được ký
hiệu là µ và được tính theo cơng thức:
N

∑ xi

µ=
Nguyen Cong Nhut

i =1

N

Thống kê Kinh doanh

Ngày 13 tháng 10 năm 2022

9 / 71


4.1. Các đại lượng đo mức độ tập trung của dữ liệu
4.1.1. Số trung bình số học


Trung bình mẫu
Xét một mẫu có kích thước n với các giá trị là x1 , . . . , xn , thì trung bình cộng (trung bình
mẫu) được tính theo cơng thức
x¯ =

1
1
( x 1 + · · · + xn ) =
n
n

n

∑ xi

(1)

i =1

Ví dụ 1.
Điểm thi mơn Tốn của 16 sinh viên là: 2, 4, 5, 8, 9, 3, 6, ,6, 8, 10, 2, 3, 6, 4, 7, 8. Ta có
trung bình mẫu (điểm thi trung bình của 16 sinh viên này) là:
x¯ =
Nguyen Cong Nhut

1
(2 + 4 + · · · + 8) = 5, 6875
16
Thống kê Kinh doanh


Ngày 13 tháng 10 năm 2022

10 / 71


4.1. Các đại lượng đo mức độ tập trung của dữ liệu
4.1.1. Số trung bình số học

Trung bình số học có trọng số
Xét một mẫu có kích thước n với các giá trị là x1 , · · · , xk , trong đó x1 có n1 giá trị,...,xk có
nk giá trị và n = n1 + · · · + nk . Số liệu được lập thành bảng có tần số như sau:
Bảng phân phối tần số
X
ni

x1
n1

x2
n2

···
···

xk
nk

···
···


Khi đó, trung bình mẫu được tính theo cơng thức sau:
x¯ =

Nguyen Cong Nhut

1
1
(n1 x1 + · · · + nk xk ) =
n
n
Thống kê Kinh doanh

n

∑ ni xi

(2)

i =1

Ngày 13 tháng 10 năm 2022

11 / 71


4.1. Các đại lượng đo mức độ tập trung của dữ liệu ==> 4.1.1. Số trung bình số học

Trung bình số học có trọng số
Trường hợp dữ liệu có giá trị lượng biến liên tục, biểu diễn thông qua bảng dữ liệu dạng

khoảng
Bảng phân phối tần số
X
ni

[ x1 , x2 )
n1

···
···

[ x2 , x3 )
n2

[ xk , xk + 1 ]
nk

···
···

k

∑ mi ni

X¯ =

i =1
k

(3)


∑ ni

i =1

mi : trung bình khoảng i , mi =
Nguyen Cong Nhut

xi + xi + 1
2
Thống kê Kinh doanh

Ngày 13 tháng 10 năm 2022

12 / 71


4.1. Các đại lượng đo mức độ tập trung của dữ liệu ==> 4.1.1. Số trung bình số học

Ví dụ 2.
Có tài liệu về doanh thu của 79 cửa hàng trong tháng 10 năm 2009 như bảng dưới. Xác định
trung bình (Mean) của dữ liệu
Doanh thu (triệu đồng) Số cửa hàng
200 − 400
8
400 − 500
12
500 − 600
25
600 − 800

25
800 − 1000
9
Tổng
79

Nguyen Cong Nhut

Thống kê Kinh doanh

Ngày 13 tháng 10 năm 2022

13 / 71


4.1. Các đại lượng đo mức độ tập trung của dữ liệu
4.1.1. Số trung bình số học

Doanh thu (triệu đồng)
200 − 400
400 − 500
500 − 600
600 − 800
800 − 1000
Tổng

Trung bình khoảng mi
300
450
550

700
900

Số cửa hàng ni
8
12
25
25
9
79

300.8 + 450.12 + 550.25 + 700.25 + 900.9
X¯ =
=
79

Nguyen Cong Nhut

Thống kê Kinh doanh

Ngày 13 tháng 10 năm 2022

14 / 71


4.1. Các đại lượng đo mức độ tập trung của dữ liệu
4.1.2. Số trung bình điều hịa

Số trung bình điều hòa
Mi = Xi ni : Tổng tất cả các lượng biến cùng giá trị lượng biến thứ i

∑ k Mi
X¯ = ik=1 M
∑i =1 Xii

Ví dụ 3.
Tính trung bình lương của một người theo bảng số liệu sau
Tiền lương 1 người (nhóm)(ngàn đồng)
500
650
800
Tiền lương cả nhóm
4.500 5.200 16.000

Nguyen Cong Nhut

Thống kê Kinh doanh

950
9.500

1.000
7.000

Ngày 13 tháng 10 năm 2022

15 / 71


4.1. Các đại lượng đo mức độ tập trung của dữ liệu
4.1.3 Quy luật phân phối của trung bình mẫu


Định nghĩa
Giả sử tổng thể X có quy luật phân phối chuẩn với X ∼ N µ; σ 2 trên tổng thể này ta
thu thập một mẫu dữ liệu cỡ mẫu n gồm (X1 ; X2 ; . . . ; Xn ) thì ta có đại lượng trung bình
2
mẫu X¯ cũng tuân theo quy luật phân phối chuẩn với X¯ ∼ N µ; σn .
Lưu ý: Khi cỡ mẫu lớn (n > 30) trung bình mẫu của tổng thể bất kỳ có khuynh
hướng xấp xỉ bởi một phân phối chuẩn.

Nguyen Cong Nhut

Thống kê Kinh doanh

Ngày 13 tháng 10 năm 2022

16 / 71


4.1. Các đại lượng đo mức độ tập trung của dữ liệu
4.1.3 Quy luật phân phối của trung bình mẫu

Ví dụ 4.
Giám đốc nhân sự của công ty xây dựng hồ sơ của 2500 của nhân viên để báo cáo ban giám
đốc. Trong mục báo cáo về tiền lương hằng năm của nhân viên cho thơng tin Trung bình tổng
thể tiền lương hằng năm của nhân viên là 51800 USD. Độ lệch chuẩn tổng thể tiền lương
hằng năm của nhân viên là 4000 USD. Giả sử bây giờ cơ sở dữ liệu chi tiết của 2500 nhân viên
chưa được cập nhật, nên thay vào đó giám đốc nhân sự dùng dữ liệu của 30 nhân viên để báo
cáo thay tổng thể. Câu hỏi là nếu sai số trung bình mẫu tiền lương hằng năm nhân viên so với
tổng thể không quá 500USD có xác suất là bao nhiêu?


Nguyen Cong Nhut

Thống kê Kinh doanh

Ngày 13 tháng 10 năm 2022

17 / 71


4.1. Các đại lượng đo mức độ tập trung của dữ liệu
4.1.3 Quy luật phân phối của trung bình mẫu

Giải. Theo quy luật phân phối của trung bình mẫu, với n = 30 ta có
X¯ ∼ N

σ
µ; √
n

4000
≡ N 51800; √
30

Ta có P (|X¯ − µ| < 500) = P (µ − 500 < X¯ < µ + 500) =

=

500
4000


30

500
4000


à+500à


n



à500à


n

= 2(0, 68) = 2 ì 0, 2517 = 50, 34%

30

Như vậy với một mẫu n = 30, cho xác suất về mức chênh lệch giữa trung bình mẫu tiền lương
hằng năm so với tổng thể khơng quá 500 USD là 50, 34%. Nên nếu muốn xác suất này tăng
cao hơn, giám đốc nhân sự nên suy nghĩ về việc sử dụng một mẫu dữ liệu với cỡ mẫu lơn hơn.
Nguyen Cong Nhut

Thống kê Kinh doanh

Ngày 13 tháng 10 năm 2022


18 / 71


4.1. Các đại lượng đo mức độ tập trung của dữ liệu
4.1.4. Số trung bình nhân

Số trung bình nhân
Trường hợp lượng biến quan sát không cùng gốc so sánh, mà lượng biến sau thay đổi phụ
thuộc vào lượng biến trước, thì trung bình giữa các lượng biến được tính theo cơng thức trung
bình nhân.

X¯ = n X1 X2 · · · Xn
Trong đó X¯ : trung bình nhân.
xi : lượng biến thứ i

Ví dụ 5.
Một người đem 100$ đi đầu tư và nhận được mức lợi nhuận như sau:
Bảng phân phối tần số
X
P

Năm 1
3%
Nguyen Cong Nhut

Năm 2
5%

Năm 3

8%

Năm 4
-1%

Năm 5
10%

Thống kê Kinh doanh

Ngày 13 tháng 10 năm 2022

19 / 71


4.1. Các đại lượng đo mức độ tập trung của dữ liệu
4.1.4. Số trung bình nhân

Vậy số tiền tăng trưởng mỗi năm sẽ là:
Năm 1: $100 × 1.03 = $103.00
Năm 2: $103 × 1.05 = $108.15
Năm 3: $108.15 × 1.08 = $116.80
Năm 4: $116.80 × 0.99 = $115.63
Năm 5 $115.63 × 1.10 = $127.20
Giá trị trung bình nhân hay tỉ suất lợi nhuận là:

5
1.03 × 1.05 × 1.08 × .99 × 1.10 − 1 = 4.93%.
Tỉ suất lợi nhuận hàng năm là 4.93%, gần bằng là 5% là giá trị được tính bằng phương pháp
cộng. Trong ví dụ trên lợi nhuận không thay đổi đáng kể qua từng năm nên trung bình cộng và

trung bình nhân gần bằng nhau. Tuy nhiên, nếu danh mục đầu tư của bạn có mức lợi nhuận
thay đổi đáng kể qua các năm thì sự chênh lệch giữa hai phương pháp là khá lớn.
Nguyen Cong Nhut

Thống kê Kinh doanh

Ngày 13 tháng 10 năm 2022

20 / 71


4.1. Các đại lượng đo mức độ tập trung của dữ liệu
4.1.5. Yếu vị (Mode)

Mode
Yếu vị là biểu hiện của một lượng biến được gặp nhiều nhất trong tổng thể. Nếu xác định trên
đồ thị với trục tung là tần số, trục hồnh là lượng biến thì ta có thể nói yếu vị là hồnh độ của
điểm có tung độ cao nhất.
Trường hợp lượng biến rời rạc
X
ni

x1
n1

x2
n2

···
···


xk
nk

···
···

Mod (X ) = xi sao cho ni = Max {n1 , n2 , · · · , nk }
Trong trường hợp lượng biến rời rạc thì Mode là giá trị của lượng biến tương ứng với tần
số lớn nhất.
Nguyen Cong Nhut

Thống kê Kinh doanh

Ngày 13 tháng 10 năm 2022

21 / 71


4.1. Các đại lượng đo mức độ tập trung của dữ liệu
4.1.5. Yếu vị (Mode)

Trường hợp lượng biến liên tục
X
ni

[ x1 , x2 ]
n1

[ x2 , x 3 ]

n2

···
···

[ x k , xk + 1 ]
nk

···
···

Việc xác định giá trị Mod qua hai bước:

⋆ Bước 1: Xác định tổ chứa Mod
• Trường hợp số liệu phân tổ có khoảng cách bằng nhau. Tổ chứa Mod là tổ có tần số
lớn nhất.
• Trường hợp số liệu phân tổ có khoảng cách khơng bằng nhau. Tổ chứa Mod là tổ có
mật độ lớn nhất, với mật độ tổ cho bởi Mi = nhii , trong đó: ni là tần số của tổ thứ i và
hi là chiều dài của tổ thứ i .
Nguyen Cong Nhut

Thống kê Kinh doanh

Ngày 13 tháng 10 năm 2022

22 / 71


4.1. Các đại lượng đo mức độ tập trung của dữ liệu
4.1.5. Yếu vị (Mod)


Bước 2: Xác định giá trị Mod trong tổ:
ModX = XMo (Min ) + hM0

MM0 − MMo −1
( M M0 − M Mo − 1 ) + ( M M0 − M M0 + 1 )

Trong đó XMo ( Min : cận dưới của tổ chứa Mod.
hMo : chiều dài của tổ chứa Mod.
MMo : mật độ tổ chứa Mod.
MMo −1 : mật độ tổ trước tổ chứa Mod.
MMo +1 : mật độ tổ sau tổ chứa Mod.

Nguyen Cong Nhut

Thống kê Kinh doanh

Ngày 13 tháng 10 năm 2022

23 / 71


4.1. Các đại lượng đo mức độ tập trung của dữ liệu
4.1.5. Yếu vị (Mod)

Ví dụ 6.
233322233233223233233442343223
Mode = ?
X
ni


2
12

3
15

4
3

Suy ra Mod (X ) = 3

Nguyen Cong Nhut

Thống kê Kinh doanh

Ngày 13 tháng 10 năm 2022

24 / 71


4.1. Các đại lượng đo mức độ tập trung của dữ liệu
4.1.5. Yếu vị (Mod)

Ví dụ 7.
Có tài liệu về doanh thu của 79 cửa hàng trong tháng 10 năm 2009 như bảng dưới. Xác định
Mod của dữ liệu.
Doanh thu (triệu đồng) Số cửa hàng ni Khoảng cách tổ hi Mật độ ni /hi
200 − 400
8

200
0,04
400 − 500
12
100
0,12
500-600
25
100
0,25
600 − 800
25
200
0,125
800 − 1000
9
200
0,045
Tổng
79
0,25−0,12
ModX = 500 + 100 (0,25−0,12
= 550, 980
)+(0,25−0,125)
Nguyen Cong Nhut

Thống kê Kinh doanh

Ngày 13 tháng 10 năm 2022


25 / 71


×