TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN KINH TẾ VÀ QUẢN LÝ
EM3230 THỐNG KÊ ỨNG DỤNG TRONG KINH DOANH
CHƯƠNG 2
DỮ LIỆU THỐNG KÊ
TRONG KINH TẾ VÀ KINH DOANH
Nội dung chính
2.1 Khái niệm và phân loại dữ liệu (Bài giảng video online)
2.2 Các chỉ tiêu thống kê cơ bản trong kinh tế và quản trị doanh nghiệp
2.3 Các phương pháp thu thập dữ liệu
2.4 Các phương pháp lấy mẫu (Bài giảng video online)
2.5 Các phương pháp điều tra dữ liệu sơ cấp
2.6 Sai số trong điều tra thống kê
EM3230 Thống kê ứng dụng
2
2.1 Khái niệm và phân loại dữ liệu
§
Dữ liệu là tồn bộ thơng tin về một vấn đề nhất định mà các thơng tin này có thể
thu được thơng qua hình thức điều tra thống kê hoặc báo cáo thống kê.
Hay dữ liệu là các giá trị quan sát được của các tiêu thức nghiên cứu.
Ø Dữ liệu: con số, câu chữ, hình ảnh, âm thanh, … ở dạng thơ
Ø Thông tin: Dữ liệu đã được xử lý, gắn với một mục đích
Ø Tri thức: Tập hợp thơng tin về một lĩnh vực
§
Thu thập dữ liệu là tổ chức một cách khoa học và theo một kế hoạch thống
nhất để có được dữ liệu về các hiện tượng kinh tế - xã hội.
EM3230 Thống kê ứng dụng
6
2.1 Khái niệm và phân loại dữ liệu
Phân loại dữ liệu theo tính chất
§
Dữ liệu định tính: phản ánh tính chất hay sự hơn kém của các đối tượng
nghiên cứu, khơng được biểu diễn trực tiếp bằng con số.
§
Dữ liệu định lượng: phản ánh mức độ hay mức độ hơn kém của các đối tượng
nghiên cứu và được biểu diễn bằng con số
§
Dữ liệu rời rạc: là dữ liệu mà giá trị của nó là một tập hữu hạn hoặc vơ hạn
đếm được
§
Dữ liệu liên tục: là dữ liệu mà tập giá trị của nó có thể lấp kín một khoảng
trên trục số
Phân biệt Tiêu thức và Dữ liệu
EM3230 Thống kê ứng dụng
7
2.1 Khái niệm và phân loại dữ liệu
Phân loại dữ liệu theo nguồn dữ liệu
Nguồn dữ liệu
Sơ cấp
Thứ cấp
Quan sát
Thực nghiệm
Điều tra
EM3230 Thống kê ứng dụng
8
2.1 Khái niệm và phân loại dữ liệu
Phân loại dữ liệu theo nguồn dữ liệu
Dữ liệu sơ cấp (Primary data)
Dữ liệu thứ cấp
Khái niệm
Là dữ liệu thu thập trực tiếp, ban đầu từ
đối tượng nghiên cứu
Là dữ liệu được thu thập từ những
nguồn có sẵn, thường là dữ liệu đã
qua tổng hợp, xử lý.
Ưu điểm
Chi tiết, cụ thể
Tính cập nhật cao
Khơng gặp vấn đề về thuật ngữ khó hiểu
Thu thập nhanh, ít tốn kém
Nhược điểm
Tốn kém chi phí và thời gian
Thơng tin thu được chưa chắc đã chi
tiết, chính xác, cập nhật và không đáp
ứng đúng yêu cầu nghiên cứu
EM3230 Thống kê ứng dụng
9
2.1 Khái niệm và phân loại dữ liệu
Phân loại dữ liệu theo thang đo
Thang đo là công cụ dùng để đo lường hoặc mô tả các hiện tượng nghiên cứu. Có 4 loại thang đo.
Thang đo định danh (Nominal scale): thường dùng cho các dữ liệu định tính và đơn giản chỉ để
phân loại, đếm tần số xuất hiện của các biểu hiện, khơng cho biết sự hơn kém. Ví dụ giới tính, nghề
nghiệp…
Thang đo thứ bậc (Ordinal scale): Phân loại dữ liệu thành các nhóm riêng biệt trong đó có cho biết
thứ hạng, sự hơn kém. Tuy nhiên thang đo này vẫn không cho biết sự chênh lệch giữa các trị số,
khoảng cách chính xác giữa các thứ bậc của dữ liệu
Thang đo khoảng (Interval scale): Áp dụng cho các dữ liệu định lượng là thang đo mà có xác định
khoảng cách giữa các giá trị là con số có ý nghĩa nhưng khơng bao gồm số 0. Ví dụ nhiệt độ, độ
ẩm,….
Thang đo tỷ lệ (Ratio scale): là thang đo trong đó sự khác nhau của các giá trị có bao hàm số 0
trong tập số thực. Ví dụ thang đo chiều cao, thu nhập, thời gian, …
EM3230 Thống kê ứng dụng
10
Ví dụ về các loại thang đo
Thang đo khoảng
Thang đo thứ bậc
/>EM3230 Thống kê ứng dụng
11
Ví dụ về các loại thang đo
EM3230 Thống kê ứng dụng
12
2.1 Khái niệm và phân loại dữ liệu
Phân biệt dữ liệu chuỗi thời gian, dữ liệu chéo, dữ liệu bảng
§
Dữ liệu chuỗi thời gian (time-series data)
§
Dữ liệu theo khơng gian (cross-sectional data)
§
Dữ liệu bảng (pannel data): Hỗn hợp
EM3230 Thống kê ứng dụng
13
THAM KHẢO: Dữ liệu chuỗi thời gian
§
Chuỗi thời gian là chuỗi các giá trị của một chỉ tiêu nghiên cứu được sắp xếp theo
thứ tự thời gian
§
Các giá trị quan sát không độc lập mà tồn tại sự phụ thuộc (cơ sở để xây dựng các
phương pháp dự báo trên chuỗi thời gian)
§
Dạng tổng quát
ti
Yi
§
§
t1
Y1
t2
Y2
t3
Y3
…
…
tn
Yn
ti thời gian thứ i (giờ, ngày, tuần, tháng, quý, năm …)
Yi giá trị của chỉ tiêu tương ứng với thời gian thứ i
EM3230 Thống kê ứng dụng
14
THAM KHẢO: Dữ liệu chuỗi thời gian
§
Ví dụ
Số liệu về doanh số bán hàng của một cửa hàng
Tháng
1
2
3
4
5
6
Doanh thu ( tỷ)
34
38
35
37
42
49
§
Ý nghĩa: Nghiên cứu biến động của hiện tượng theo thời gian: đặc điểm mùa vụ, tính xu hướng
và tính quy luật
EM3230 Thống kê ứng dụng
15
THAM KHẢO: Dữ liệu chuỗi thời gian
Phân loại
Ø Dãy số thời điểm
Ngày
8/2
9/2
10/2
11/2
12/2
Giá vàng (tr.đ/L)
47
46
45
47
45
Năm
2015
2016
2017
2018
2019
Lợi nhuận (tỷ đ)
1875
1734
1800
1952
2200
Ø Dãy số thời kỳ
Phân biệt dựa vào khả năng cộng dồn, mở rộng khoảng cách thời gian
EM3230 Thống kê ứng dụng
16
THAM KHẢO: Dữ liệu chuỗi thời gian
Thành phần của chuỗi thời gian Yt
Y=TxSxCxI
T
Xu
hướng
I
Ngẫu
nhiên
Các thành
phần của
dãy số thời
gian
C
Chu kỳ
S
Mùa vụ
EM3230 Thống kê ứng dụng
17
THAM KHẢO: Dữ liệu chuỗi thời gian
Thành phần của chuỗi thời gian Yt
Tính xu hướng
§
§
Biến động theo chiều hướng tăng hoặc giảm khi dãy số được quan sát trong dài hạn
Dữ liệu ghi nhận qua nhiều năm
Doanh
số
ớ ng
Xu h ư
tăn g
Thời gian
EM3230 Thống kê ứng dụng
18
THAM KHẢO: Dữ liệu chuỗi thời gian
Thành phần của chuỗi thời gian Yt
Tính chu kỳ
VD: Đặc điểm của chu kỳ kinh doanh/ chu kỳ sống của một sản phẩm:
Giới thiệu, phát triển, bão hịa, suy thối
Doanh số
EM3230 Thống kê ứng dụng
ỳ
1 chu k
Thời
gian
19
THAM KHẢO: Dữ liệu chuỗi thời gian
Thành phần của chuỗi thời gian Yt
Mùa vụ:
§
§
Đặc điểm biến động tăng hoặc giảm ở các thời kỳ một cách rõ rệt
Tính hệ thốngà có thể dự đốn
Doanh số
Hè
Đơng
Xn
Thu
Thời gian
EM3230 Thống kê ứng dụng
20
THAM KHẢO: Dữ liệu chuỗi thời gian
Thành phần của chuỗi thời gian Yt
Tính ngẫu nhiên
q
q
Đặc điểm: Bất thường, khơng có hệ thống, ảnh hưởng của các yếu tố ngẫu nhiên
§
Thiên tai, thảm hoạ
§
Chiến tranh, khủng bố
Xảy ra trong thời gian ngắn và thường không lặp lại à không thể dự đoán
EM3230 Thống kê ứng dụng
21
2.2 Các chỉ tiêu thống kê cơ bản trong kinh tế
và quản trị kinh doanh
Thảo luận nhóm trên lớp
EM3230 Thống kê ứng dụng
22
2.3 Các phương pháp thu thập dữ liệu
2.3.1. Thu thập dữ liệu thơng qua báo cáo
§
Là hình thức tổ chức điều tra thống kê thường xuyên định kỳ theo nội dung, phương
pháp và chế độ báo cáo đã quy định thống nhất. Ví dụ: các bộ phận/ doanh nghiệp định
kỳ hàng tháng, quí, năm phải lập và gửi các báo cáo lên cấp trên.
2.3.2. Thu thập dữ liệu thông qua điều tra
§
Là hình thức tổ chức điều tra khơng thường xuyên được tiến hành theo một kế hoạch
và phương pháp quy định riêng cho mỗi lần điều tra. Điều tra tồn bộ và điều tra chọn
mẫu:
§
Điều tra tồn bộ là tiến hành thu thập dữ liệu trên tất cả các đơn vị của tổng thể, khơng
bỏ sót bất kỳ một đơn vị nào.
§
Điều tra chọn mẫu là tiến hành thu thập dữ liệu chỉ trên một số đơn vị được lấy ra của
tổng thể, sau đó kết luận rút ra được suy rộng cho toàn bộ tổng thể.
EM3230 Thống kê ứng dụng
23
2.3 Các phương pháp thu thập dữ liệu
2.3.1. Thu thập dữ liệu thông qua báo cáo
Xác định
nhu cầu
thông tin
2.3.2. Thu thập dữ liệu thơng qua điều tra
§
Điều tra tồn bộ
§
Điều tra chọn mẫu
Rút ra kết
luận về
tổng thể
Xác định
tổng thể
phù hợp
Tiến hành
phân tích
dữ liệu
Lấy mẫu
Lý do điều tra chọn mẫu
v Linh hoạt: nó có thể là đơn giản hay phức tạp tùy
theo ý muốn của nhà nghiên cứu, sự sẵn có về thời
gian và kinh phí.
v Hiệu quả: chúng có thể cung cấp các thông tin đáng
tin cậy về một tổng thể lớn từ một mẫu tương đối
Thu thập
dữ liệu từ
các đơn
vị mẫu
nhỏ, và nếu lập kế hoạch tốt có thể thực hiện một
cách nhanh chóng.
EM3230 Thống kê ứng dụng
24
2.4 Các phương pháp lấy mẫu
Các phương
pháp lấy mẫu
Phương pháp lấy
mẫu ngẫu nhiên
Lấy mẫu ngẫu
nhiên giản đơn
Lấy mẫu hạn ngạch
Lấy mẫu ngẫu
nhiên hệ thống
Lấy mẫu thuận tiện
Lấy mẫu ngẫu
nhiên phân tầng
Lấy mẫu ngẫu
nhiên theo cụm
EM3230 Thống kê ứng dụng
Phương pháp lấy
mẫu phi ngẫu nhiên
Chi
phí
Thời
gian
Sai số
2.4 Các phương pháp lấy mẫu thường dùng
2.4.1. Phương pháp lấy mẫu ngẫu nhiên
2.4.1.1 Phương pháp lấy mẫu ngẫu nhiên giản đơn
§
§
Bước 1. Xác định khung lấy mẫu- liệt kê các đơn vị tạo thành tổng thể.
Bước 2. Ký hiệu kích thước mẫu là n và kích thước khung lấy mẫu là N.
§
§
Bước 3. Đánh số các đơn vị trong khung lấy mẫu từ 1 đến N.
Bước 4. Lấy mẫu bằng cách rút thăm ngẫu nhiên hoặc bằng cách tạo ra n số ngẫu
nhiên bởi máy tính
EM3230 Thống kê ứng dụng
28
2.4 Các phương pháp lấy mẫu thường dùng
2.4.1. Phương pháp lấy mẫu ngẫu nhiên
2.4.1.2 Phương pháp lấy mẫu ngẫu nhiên hệ thống
§
Bước 1: Chia N đơn vị trong khung lấy mẫu ra thành n nhóm, mỗi nhóm gồm k đơn vị, trong
đó: k=N/n (Chúng ta làm trịn k đến số nguyên gần nhất)
§
Bước 2: Chọn đơn vị đầu tiên là đơn vị sẽ được lấy ngẫu nhiên từ k đơn vị đầu tiên (nhóm
1) trong khung lấy mẫu.
§
Bước 3: Lựa chọn n – 1 đơn vị còn lại bằng cách chọn ra các đơn vị tiếp theo với bước
nhảy k thống nhất.
§
N=50, n=10, chia thành 10 nhóm mỗi nhóm 5 đơn vị
x X
x X
EM3230 Thống kê ứng dụng
x X
x X
x X
x X
x X
x X
x X
x X
29
2.4 Các phương pháp lấy mẫu thường dùng
2.4.1. Phương pháp lấy mẫu ngẫu nhiên
2.4.1.3 Phương pháp lấy mẫu ngẫu nhiên phân tầng
§
Bước 1: Chia N đơn vị trong khung lấy mẫu thành
những nhóm đồng nhất,
§
Bước 2: Lấy các mẫu ngẫu nhiên đơn giản từ mỗi
nhóm, dựa trên kích thước và độ phân tán của
mỗi nhóm đó
EM3230 Thống kê ứng dụng
30