Tải bản đầy đủ (.pdf) (31 trang)

Bài giảng Thống kê ứng dụng trong kinh doanh: Chương 2 - Trường Đại học Bách khoa Hà Nội

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.73 MB, 31 trang )

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN KINH TẾ VÀ QUẢN LÝ
EM3230 THỐNG KÊ ỨNG DỤNG TRONG KINH DOANH

CHƯƠNG 2

DỮ LIỆU THỐNG KÊ
TRONG KINH TẾ VÀ KINH DOANH


Nội dung chính
2.1 Khái niệm và phân loại dữ liệu (Bài giảng video online)
2.2 Các chỉ tiêu thống kê cơ bản trong kinh tế và quản trị doanh nghiệp
2.3 Các phương pháp thu thập dữ liệu
2.4 Các phương pháp lấy mẫu (Bài giảng video online)
2.5 Các phương pháp điều tra dữ liệu sơ cấp
2.6 Sai số trong điều tra thống kê

EM3230 Thống kê ứng dụng

2


2.1 Khái niệm và phân loại dữ liệu
§

Dữ liệu là tồn bộ thơng tin về một vấn đề nhất định mà các thơng tin này có thể
thu được thơng qua hình thức điều tra thống kê hoặc báo cáo thống kê.
Hay dữ liệu là các giá trị quan sát được của các tiêu thức nghiên cứu.
Ø Dữ liệu: con số, câu chữ, hình ảnh, âm thanh, … ở dạng thơ
Ø Thông tin: Dữ liệu đã được xử lý, gắn với một mục đích


Ø Tri thức: Tập hợp thơng tin về một lĩnh vực

§

Thu thập dữ liệu là tổ chức một cách khoa học và theo một kế hoạch thống
nhất để có được dữ liệu về các hiện tượng kinh tế - xã hội.

EM3230 Thống kê ứng dụng

6


2.1 Khái niệm và phân loại dữ liệu
Phân loại dữ liệu theo tính chất
§

Dữ liệu định tính: phản ánh tính chất hay sự hơn kém của các đối tượng
nghiên cứu, khơng được biểu diễn trực tiếp bằng con số.

§

Dữ liệu định lượng: phản ánh mức độ hay mức độ hơn kém của các đối tượng
nghiên cứu và được biểu diễn bằng con số
§

Dữ liệu rời rạc: là dữ liệu mà giá trị của nó là một tập hữu hạn hoặc vơ hạn
đếm được

§


Dữ liệu liên tục: là dữ liệu mà tập giá trị của nó có thể lấp kín một khoảng
trên trục số
Phân biệt Tiêu thức và Dữ liệu

EM3230 Thống kê ứng dụng

7


2.1 Khái niệm và phân loại dữ liệu
Phân loại dữ liệu theo nguồn dữ liệu
Nguồn dữ liệu

Sơ cấp

Thứ cấp

Quan sát

Thực nghiệm

Điều tra

EM3230 Thống kê ứng dụng

8


2.1 Khái niệm và phân loại dữ liệu
Phân loại dữ liệu theo nguồn dữ liệu

Dữ liệu sơ cấp (Primary data)

Dữ liệu thứ cấp

Khái niệm

Là dữ liệu thu thập trực tiếp, ban đầu từ
đối tượng nghiên cứu

Là dữ liệu được thu thập từ những
nguồn có sẵn, thường là dữ liệu đã
qua tổng hợp, xử lý.

Ưu điểm

Chi tiết, cụ thể
Tính cập nhật cao
Khơng gặp vấn đề về thuật ngữ khó hiểu

Thu thập nhanh, ít tốn kém

Nhược điểm

Tốn kém chi phí và thời gian

Thơng tin thu được chưa chắc đã chi
tiết, chính xác, cập nhật và không đáp
ứng đúng yêu cầu nghiên cứu

EM3230 Thống kê ứng dụng


9


2.1 Khái niệm và phân loại dữ liệu
Phân loại dữ liệu theo thang đo
Thang đo là công cụ dùng để đo lường hoặc mô tả các hiện tượng nghiên cứu. Có 4 loại thang đo.
Thang đo định danh (Nominal scale): thường dùng cho các dữ liệu định tính và đơn giản chỉ để
phân loại, đếm tần số xuất hiện của các biểu hiện, khơng cho biết sự hơn kém. Ví dụ giới tính, nghề
nghiệp…
Thang đo thứ bậc (Ordinal scale): Phân loại dữ liệu thành các nhóm riêng biệt trong đó có cho biết
thứ hạng, sự hơn kém. Tuy nhiên thang đo này vẫn không cho biết sự chênh lệch giữa các trị số,
khoảng cách chính xác giữa các thứ bậc của dữ liệu
Thang đo khoảng (Interval scale): Áp dụng cho các dữ liệu định lượng là thang đo mà có xác định
khoảng cách giữa các giá trị là con số có ý nghĩa nhưng khơng bao gồm số 0. Ví dụ nhiệt độ, độ
ẩm,….
Thang đo tỷ lệ (Ratio scale): là thang đo trong đó sự khác nhau của các giá trị có bao hàm số 0
trong tập số thực. Ví dụ thang đo chiều cao, thu nhập, thời gian, …
EM3230 Thống kê ứng dụng

10


Ví dụ về các loại thang đo

Thang đo khoảng

Thang đo thứ bậc

/>EM3230 Thống kê ứng dụng


11


Ví dụ về các loại thang đo

EM3230 Thống kê ứng dụng

12


2.1 Khái niệm và phân loại dữ liệu
Phân biệt dữ liệu chuỗi thời gian, dữ liệu chéo, dữ liệu bảng

§

Dữ liệu chuỗi thời gian (time-series data)

§

Dữ liệu theo khơng gian (cross-sectional data)

§

Dữ liệu bảng (pannel data): Hỗn hợp

EM3230 Thống kê ứng dụng

13



THAM KHẢO: Dữ liệu chuỗi thời gian
§

Chuỗi thời gian là chuỗi các giá trị của một chỉ tiêu nghiên cứu được sắp xếp theo
thứ tự thời gian

§

Các giá trị quan sát không độc lập mà tồn tại sự phụ thuộc (cơ sở để xây dựng các
phương pháp dự báo trên chuỗi thời gian)

§

Dạng tổng quát

ti
Yi
§
§

t1
Y1

t2
Y2

t3
Y3





tn
Yn

ti thời gian thứ i (giờ, ngày, tuần, tháng, quý, năm …)
Yi giá trị của chỉ tiêu tương ứng với thời gian thứ i

EM3230 Thống kê ứng dụng

14


THAM KHẢO: Dữ liệu chuỗi thời gian
§

Ví dụ

Số liệu về doanh số bán hàng của một cửa hàng
Tháng

1

2

3

4


5

6

Doanh thu ( tỷ)

34

38

35

37

42

49

§

Ý nghĩa: Nghiên cứu biến động của hiện tượng theo thời gian: đặc điểm mùa vụ, tính xu hướng
và tính quy luật

EM3230 Thống kê ứng dụng

15


THAM KHẢO: Dữ liệu chuỗi thời gian
Phân loại

Ø Dãy số thời điểm
Ngày

8/2

9/2

10/2

11/2

12/2

Giá vàng (tr.đ/L)

47

46

45

47

45

Năm

2015

2016


2017

2018

2019

Lợi nhuận (tỷ đ)

1875

1734

1800

1952

2200

Ø Dãy số thời kỳ

Phân biệt dựa vào khả năng cộng dồn, mở rộng khoảng cách thời gian

EM3230 Thống kê ứng dụng

16


THAM KHẢO: Dữ liệu chuỗi thời gian
Thành phần của chuỗi thời gian Yt


Y=TxSxCxI

T
Xu
hướng

I
Ngẫu
nhiên

Các thành
phần của
dãy số thời
gian

C
Chu kỳ

S
Mùa vụ

EM3230 Thống kê ứng dụng

17


THAM KHẢO: Dữ liệu chuỗi thời gian
Thành phần của chuỗi thời gian Yt
Tính xu hướng

§
§

Biến động theo chiều hướng tăng hoặc giảm khi dãy số được quan sát trong dài hạn
Dữ liệu ghi nhận qua nhiều năm

Doanh
số

ớ ng
Xu h ư

tăn g

Thời gian
EM3230 Thống kê ứng dụng

18


THAM KHẢO: Dữ liệu chuỗi thời gian
Thành phần của chuỗi thời gian Yt
Tính chu kỳ
VD: Đặc điểm của chu kỳ kinh doanh/ chu kỳ sống của một sản phẩm:
Giới thiệu, phát triển, bão hịa, suy thối

Doanh số

EM3230 Thống kê ứng dụng



1 chu k

Thời
gian

19


THAM KHẢO: Dữ liệu chuỗi thời gian
Thành phần của chuỗi thời gian Yt
Mùa vụ:
§
§

Đặc điểm biến động tăng hoặc giảm ở các thời kỳ một cách rõ rệt
Tính hệ thốngà có thể dự đốn
Doanh số


Đơng

Xn

Thu
Thời gian

EM3230 Thống kê ứng dụng

20



THAM KHẢO: Dữ liệu chuỗi thời gian
Thành phần của chuỗi thời gian Yt
Tính ngẫu nhiên
q

q

Đặc điểm: Bất thường, khơng có hệ thống, ảnh hưởng của các yếu tố ngẫu nhiên
§

Thiên tai, thảm hoạ

§

Chiến tranh, khủng bố

Xảy ra trong thời gian ngắn và thường không lặp lại à không thể dự đoán

EM3230 Thống kê ứng dụng

21


2.2 Các chỉ tiêu thống kê cơ bản trong kinh tế
và quản trị kinh doanh

Thảo luận nhóm trên lớp


EM3230 Thống kê ứng dụng

22


2.3 Các phương pháp thu thập dữ liệu
2.3.1. Thu thập dữ liệu thơng qua báo cáo
§

Là hình thức tổ chức điều tra thống kê thường xuyên định kỳ theo nội dung, phương
pháp và chế độ báo cáo đã quy định thống nhất. Ví dụ: các bộ phận/ doanh nghiệp định
kỳ hàng tháng, quí, năm phải lập và gửi các báo cáo lên cấp trên.

2.3.2. Thu thập dữ liệu thông qua điều tra
§

Là hình thức tổ chức điều tra khơng thường xuyên được tiến hành theo một kế hoạch
và phương pháp quy định riêng cho mỗi lần điều tra. Điều tra tồn bộ và điều tra chọn
mẫu:

§

Điều tra tồn bộ là tiến hành thu thập dữ liệu trên tất cả các đơn vị của tổng thể, khơng
bỏ sót bất kỳ một đơn vị nào.

§

Điều tra chọn mẫu là tiến hành thu thập dữ liệu chỉ trên một số đơn vị được lấy ra của
tổng thể, sau đó kết luận rút ra được suy rộng cho toàn bộ tổng thể.


EM3230 Thống kê ứng dụng

23


2.3 Các phương pháp thu thập dữ liệu
2.3.1. Thu thập dữ liệu thông qua báo cáo

Xác định
nhu cầu
thông tin

2.3.2. Thu thập dữ liệu thơng qua điều tra
§

Điều tra tồn bộ

§

Điều tra chọn mẫu

Rút ra kết
luận về
tổng thể

Xác định
tổng thể
phù hợp

Tiến hành

phân tích
dữ liệu

Lấy mẫu

Lý do điều tra chọn mẫu
v Linh hoạt: nó có thể là đơn giản hay phức tạp tùy
theo ý muốn của nhà nghiên cứu, sự sẵn có về thời
gian và kinh phí.
v Hiệu quả: chúng có thể cung cấp các thông tin đáng
tin cậy về một tổng thể lớn từ một mẫu tương đối

Thu thập
dữ liệu từ
các đơn
vị mẫu

nhỏ, và nếu lập kế hoạch tốt có thể thực hiện một
cách nhanh chóng.
EM3230 Thống kê ứng dụng

24


2.4 Các phương pháp lấy mẫu
Các phương
pháp lấy mẫu
Phương pháp lấy
mẫu ngẫu nhiên
Lấy mẫu ngẫu

nhiên giản đơn

Lấy mẫu hạn ngạch

Lấy mẫu ngẫu
nhiên hệ thống

Lấy mẫu thuận tiện

Lấy mẫu ngẫu
nhiên phân tầng
Lấy mẫu ngẫu
nhiên theo cụm
EM3230 Thống kê ứng dụng

Phương pháp lấy
mẫu phi ngẫu nhiên

Chi
phí

Thời
gian
Sai số


2.4 Các phương pháp lấy mẫu thường dùng
2.4.1. Phương pháp lấy mẫu ngẫu nhiên
2.4.1.1 Phương pháp lấy mẫu ngẫu nhiên giản đơn
§

§

Bước 1. Xác định khung lấy mẫu- liệt kê các đơn vị tạo thành tổng thể.
Bước 2. Ký hiệu kích thước mẫu là n và kích thước khung lấy mẫu là N.

§
§

Bước 3. Đánh số các đơn vị trong khung lấy mẫu từ 1 đến N.
Bước 4. Lấy mẫu bằng cách rút thăm ngẫu nhiên hoặc bằng cách tạo ra n số ngẫu
nhiên bởi máy tính

EM3230 Thống kê ứng dụng

28


2.4 Các phương pháp lấy mẫu thường dùng
2.4.1. Phương pháp lấy mẫu ngẫu nhiên
2.4.1.2 Phương pháp lấy mẫu ngẫu nhiên hệ thống
§

Bước 1: Chia N đơn vị trong khung lấy mẫu ra thành n nhóm, mỗi nhóm gồm k đơn vị, trong
đó: k=N/n (Chúng ta làm trịn k đến số nguyên gần nhất)

§

Bước 2: Chọn đơn vị đầu tiên là đơn vị sẽ được lấy ngẫu nhiên từ k đơn vị đầu tiên (nhóm
1) trong khung lấy mẫu.


§

Bước 3: Lựa chọn n – 1 đơn vị còn lại bằng cách chọn ra các đơn vị tiếp theo với bước
nhảy k thống nhất.

§

N=50, n=10, chia thành 10 nhóm mỗi nhóm 5 đơn vị
x X

x X

EM3230 Thống kê ứng dụng

x X

x X

x X

x X

x X

x X

x X

x X


29


2.4 Các phương pháp lấy mẫu thường dùng
2.4.1. Phương pháp lấy mẫu ngẫu nhiên
2.4.1.3 Phương pháp lấy mẫu ngẫu nhiên phân tầng
§

Bước 1: Chia N đơn vị trong khung lấy mẫu thành
những nhóm đồng nhất,

§

Bước 2: Lấy các mẫu ngẫu nhiên đơn giản từ mỗi
nhóm, dựa trên kích thước và độ phân tán của
mỗi nhóm đó

EM3230 Thống kê ứng dụng

30


×