Chương 3
Chương 3
PHÂN TÍCH DỮ LIỆU
PHÂN TÍCH DỮ LIỆU
VÀ
VÀ
LỰA CHỌN MÔ HÌNH
LỰA CHỌN MÔ HÌNH
I. MỤC TIÊU HỌC TẬP
I. MỤC TIÊU HỌC TẬP
Xác định nguồn dữ liệu đáng tin cậy
Hiểu các thành phần cơ bản trong chuỗi thời gian
Khảo sát dữ liệu bằng phân tích tự tương quan
Hiểu rõ bản chất một chuỗi dữ liệu có tính dừng
Biết được các tiêu chí lựa chọn mô hình dự báo
thích hợp
II. CHẤT LƯỢNG DỮ LIỆU
II. CHẤT LƯỢNG DỮ LIỆU
Dữ liệu phải tin cậy và chính xác
Dữ liệu phải phù hợp
Dữ liệu phải nhất quán
Dữ liệu phải kịp thời
III. CÁC THÀNH PHẦN CỦA MỘT
III. CÁC THÀNH PHẦN CỦA MỘT
CHUỖI THỜI GIAN
CHUỖI THỜI GIAN
Dữ liệu dừng
Dữ liệu có tính xu thế
Dữ liệu có yếu tố mùa vụ
Dữ liệu có tính chu kỳ
IV. TỰ TƯƠNG QUAN VÀ
IV. TỰ TƯƠNG QUAN VÀ
GIẢN ĐỒ TỰ TƯƠNG QUAN
GIẢN ĐỒ TỰ TƯƠNG QUAN
Hệ số tự tương quan
Hệ số tự tương quan mẫu
)(
),(
)(
))((
1
2
1
t
ktt
n
t
t
n
kt
ktt
k
YVar
YYCov
YY
YYYY
p
−
=
+=
−
=
−
−−
=
∑
∑
∑
∑
=
+=
−
−
−−
=
n
t
t
n
kt
ktt
k
YY
YYYY
r
1
2
1
)(
))((
IV. TỰ TƯƠNG QUAN VÀ
IV. TỰ TƯƠNG QUAN VÀ
GIẢN ĐỒ TỰ TƯƠNG QUAN
GIẢN ĐỒ TỰ TƯƠNG QUAN
GIẢN ĐỒ TỰ TƯƠNG QUAN
IV. TỰ TƯƠNG QUAN VÀ
IV. TỰ TƯƠNG QUAN VÀ
GIẢN ĐỒ TỰ TƯƠNG QUAN
GIẢN ĐỒ TỰ TƯƠNG QUAN
KIỂM ĐỊNH HỆ SỐ TỰ TƯƠNG QUAN
Thống kê t
Thống kê t
Kiểm định dựa vào khoảng tin cậy
Kiểm định dựa vào khoảng tin cậy
Kiểm định mức ý nghĩa
Kiểm định mức ý nghĩa
Thống kê Q
Thống kê Q
Thống kê t
Thống kê t
Kiểm định dựa vào khoảng tin cậy
Kiểm định dựa vào khoảng tin cậy
B1: Giả thuyết
B2: Tính
B3: Xây dựng khoảng tin cậy 95% (α=5%)
B4: Bác bỏ nếu:
0:
0:
11
10
≠
=
pH
pH
)()(
1
1
1
11
rse
r
rse
pr
t =
−
=
)(
1
rse
]*)(*)([Pr
2/1112/11
αα
trserptrserob +<<−
0
H
Kiểm định mức ý nghĩa
Kiểm định mức ý nghĩa
B1: Giả thuyết
B2: Tính sai số chuẩn
B3: Tính giá trị t
B4: So sánh t tính toán với t phê phán
0:
0:
11
10
≠
=
pH
pH
)(
1
rse
)()(
1
1
1
11
rse
r
rse
pr
t =
−
=
Thống kê Q
Thống kê Q
Giả thuyết
Tính giá trị thống kê Q
Tính tính toán ở mức ý nghĩa α=5%
với
phê phán
∑
=
=
m
k
k
p
nQ
1
2
:
0:
1
210
H
ppH ==
Ít nhất một hệ số khác không
2
χ
2
χ
V. HỆ SỐ TƯƠNG QUAN VÀ
V. HỆ SỐ TƯƠNG QUAN VÀ
NHẬN DẠNG DỮ LIỆU
NHẬN DẠNG DỮ LIỆU
CHUỖI DỮ LIỆU NGẪU NHIÊN
V. HỆ SỐ TƯƠNG QUAN VÀ
V. HỆ SỐ TƯƠNG QUAN VÀ
NHẬN DẠNG DỮ LIỆU
NHẬN DẠNG DỮ LIỆU
CHUỖI DỮ LIỆU DỪNG
Thể hiện xu hướng trở lại trạng thái trung bình
Phương sai xác định, không đổi theo thời gian
Giản đồ tự tương quan với các hệ số tự tương quan sẽ giảm
dần khi độ trễ tăng
µ
=)(
t
YE
22
)()(
σµ
=−=
tt
YEYVar
[ ]
))((),(
µµγ
−−==
++ kttkktt
YYEYYCov
V. HỆ SỐ TƯƠNG QUAN VÀ
V. HỆ SỐ TƯƠNG QUAN VÀ
NHẬN DẠNG DỮ LIỆU
NHẬN DẠNG DỮ LIỆU
CHUỖI DỮ LIỆU CÓ XU THẾ
CHUỖI DỮ LIỆU CÓ XU THẾ
Các giá trị liên tiếp có mối quan hệ ý nghĩa
Hệ số tương quan của các độ trễ đần tiên rất lớn và giảm
dần về không khi độ trễ tăng lên
Chuỗi không dừng
V. HỆ SỐ TƯƠNG QUAN VÀ
V. HỆ SỐ TƯƠNG QUAN VÀ
NHẬN DẠNG DỮ LIỆU
NHẬN DẠNG DỮ LIỆU
CHUỖI DỮ LIỆU CÓ YẾU TỐ MÙA
Dữ liệu lặp đi lặp lại trong khoảng thời gian nhất định
Các quan sát trong các “ mùa” giống nhau, có xu hướng
tương quan với nhau
VI. LỰA CHỌN MÔ HÌNH DỰ BÁO
VI. LỰA CHỌN MÔ HÌNH DỰ BÁO
Cần trả lời các câu hỏi:
Tại sao cần thực hiện dự báo này?
Ai sẽ là người sử dụng kết quả dự báo?
Các đặc điểm sẵn có là gì?
Thời đoạn dự báo là gì?
Dữ liệu tối thiểu đòi hỏi phải có là bao nhiêu?
Mức độ chính xác mong muốn là bao nhiêu?
Chi phí thực hiện là bao nhiêu?
VI. LỰA CHỌN MÔ HÌNH DỰ BÁO
VI. LỰA CHỌN MÔ HÌNH DỰ BÁO
Cần đáp ứng các yêu cầu sau:
Xác định bản chất vấn đề
Giải thích bản chất dữ liệu
Mô tả khả năng & hạn chế của các kỹ thuật dự báo
Xây dựng các tiêu chí đánh giá độ chính xác các mô hình
dự báo
VI. LỰA CHỌN MÔ HÌNH DỰ BÁO
VI. LỰA CHỌN MÔ HÌNH DỰ BÁO
4 yếu tố quan trọng nhất quyết định trong việc
lựa chọn kĩ thuật dự báo thích hợp:
Dạng dữ liệu quá khứ
Thời đoạn dự báo
Loại mô hình dự báo
Dữ liệu tối thiểu cần thiết
VI. LỰA CHỌN MÔ HÌNH DỰ BÁO
VI. LỰA CHỌN MÔ HÌNH DỰ BÁO
CÁC KỸ THUẬT DỰ BÁO VỚI DỮ LIỆU
DỪNG
Các nhân tố tạo nên chuỗi dữ liệu có tính ổn định và môi
trường trong đó chuỗi dữ liệu tồn tại tương đối không đổi
Một mô hình dự báo đơn giản nhất được sử dụng bởi vì
thiếu dữ liệu hoặc nhằm giải thích kết quả dự báo hoặc dễ
thực hiện việc dự báo
Có thể đạt được sự ổn định bằng các điều chỉnh giản đơn
các yếu tố
Chuỗi dữ liệu có thể chuyển hóa sang một chuỗi có tính ổn
định hơn
Dữ liệu là tập hợp các sai số dự báo từ kĩ thuật dự báo nào
đó cũng được xem như có tính ổn định
VI. LỰA CHỌN MÔ HÌNH DỰ BÁO
VI. LỰA CHỌN MÔ HÌNH DỰ BÁO
CÁC KỸ THUẬT DỰ BÁO VỚI DỮ LIỆU XU
THẾ
Tăng năng suất hay thay đổi công nghệ dẫn đến thay đổi lối
sống
Gia tăng dân số tăng nhu cầu hàng hóa, dịch vụ
Sức mua của một đồng tiền ảnh hưởng đến nhiều chỉ báo
kinh tế do yếu tố lạm phát
Sự chấp nhận của thị trường gia tăng
VI. LỰA CHỌN MÔ HÌNH DỰ BÁO
VI. LỰA CHỌN MÔ HÌNH DỰ BÁO
CÁC KỸ THUẬT DỰ BÁO VỚI DỮ LIỆU MÙA
Thời tiết, văn hóa, lễ hội ảnh hưởng đến biến số cần dự báo
Niên lịch ảnh hưởng đến biến số cần dự báo
VI. LỰA CHỌN MÔ HÌNH DỰ BÁO
VI. LỰA CHỌN MÔ HÌNH DỰ BÁO
CÁC KỸ THUẬT DỰ BÁO VỚI DỮ LIỆU CHU
KỲ
Chu kỳ kinh doanh ảnh hưởng đến biến cần dự báo
Xảy ra các xu hướng dịch chuyển trong sở thích người tiêu
dùng
Xảy ra các chuyển dịch trong dân số
Xảy ra các dịch chuyển trong vòng đời sản phẩm
VI. LỰA CHỌN MÔ HÌNH DỰ BÁO
VI. LỰA CHỌN MÔ HÌNH DỰ BÁO
CÁC YẾU TỐ KHÁC ẢNH HƯỞNG VIỆC
CHỌN KỸ THUẬT DỰ BÁO
VII. XÁC ĐỊNH ĐỘ CHÍNH XÁC CỦA
VII. XÁC ĐỊNH ĐỘ CHÍNH XÁC CỦA
KĨ THUẬT DỰ BÁO
KĨ THUẬT DỰ BÁO