Tải bản đầy đủ (.docx) (25 trang)

BÁO CÁO MÔN DỰ BÁO KINH TẾ Các mô hình dự báo giản đơn và Dự báo bằng phương pháp phân tích

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (367.69 KB, 25 trang )

MÔN DỰ BÁO KINH TẾ
Các mô hình dự báo giản đơn và Dự báo bằng phương pháp phân tích
Giảng viên:Nguyễn Duy Tâm
Lớp K10401 – Nhóm 6
1. Huỳnh Thế Duy – K104010014
2. Đỗ Thu Hà – K104010019
3. Đỗ Hiếu – K104010024
MỤC LỤC:
CHƯƠNG 1: Tổng quan
1.1 Giới thiệu
Dự báo đã trở thành một phần thiết yếu không thể thiếu trong cuộc sống. Nhờ
có dự báo các công ty mới có thể xác lập các kế hoạch, Chính phủ mớiđưa ra được
chính sáchđiều chỉnh kinh tế xã hội, thậm chí cả những người bình thường cũng có
thể sử dụng dự báođể quyết ra những quyết định liên quan mật thiếtđến nguồn thu
nhập của mình. Sau đây ta sẽđi tìm hiểu một số mô hình dự báo giản đơn mà
chúng ta có thể dễ dàng sử dụng khi không có quá nhiều dữ liệu trong quá khứ
được thu thập, và có thể được thực hiện dù người làm dự báo không phải là
chuyên gia phân tích dữ liệu chuyên nghiệp sử dụng các mô hình dự báo phức tạp.
Cụ thể hơn, ta sẽ đi vào 3 nhóm phương pháp dự báo chuỗi this gian giảnđơn gồm:
các phương pháp dự báo thô, các phương pháp trung bình, và các phương pháp
san mũ. Sau khi tìm hiểu các mô hình dự báo giảnđơn, ta sẽđi sâu hơn một chút về
mô hình dự báotheo phương pháp phân tích để có được một mô hình dự báo chính
xác hơn khi xét thêm nhiều yếu tố trong các giả định khác.
1.2 Mục tiêu nghiên cứu
- Hiểu và thực hiện được các kỹ thuật dự báo sau:
• Mô hình dự báo thô giảnđơn
• Mô hình dự báo thô điều chỉnh
• Mô hình dự báo trung bình giản đơn
• Mô hình dụ báo trung bình di động
• Mô hình dự báo san mũ giảnđơn
• Mô hình dự báo Holt


• Mô hình dự báo Winters
- Phân biệt được các thành phần của chuỗi this gian
- Phân biệt và trình bàyđược mô hình cộng tính và mô hình nhân tính trong dự
báođặc biệt có yếu tố mùa nổi trội
- Sử dụng được kiểm định Kruskal-Wallis để kiểm định yếu tố mùa
- Xác định được dạng mô hình nên sử dụng trong từng trường hợp cụ thể
1.3 Phương pháp và phạm vi nghiên cứu
Phương phápchung nhất được sử dụng trong bài cho các mô hình dự báo gồm
các bước sau:
(1) Chia bộ dữ liệu quá khứ làm hai giai đoạn: giai đoạn dữ liệu mẫu và giai
đoạn dự báo hậu nghiệm (ước lượng trong giai đoạn quá khứ và hiện tại)
(2) Thực hiện các mô hình dự báo trong gia đoạn dự báo mẫu
(3) Đánh giá kết quả dự báo hậu nghiệm bằng việc phân tíchđồ thị và các tiêu
chí thống kê
(4) Dự báo tiền nghiệm (dự báo cho các giai đoạn tương lai) đối với mô hình
tốt nhất trong giai đoạn dự báo hậu nghiệm
Các phương pháp phân tích(Decomposition methods) hay các mô hình phân
tích chuỗi this gian (Time-series decomposition models) được sử dụng trong cả dự
báo ngắn hạn và dài hạn. Tuy nhiên chúng ta sẽ tập trung hơn vào các dự báo ngắn
hạn.
Ta sẽ sử dụng phương pháp phân tích chuỗi this gian cổ điển(Classical times-
series decomposition), đây là cách thức thực hiện chủ yếu dựa trên nền tảng của
các phương pháp trung bình di động và dự báotheo hàm xu thế. Tuy nhiên các
phương pháp có tínhđến sự kết hợp cộng tính hay kết hợp nhân tính với yếu tố
mùa vụ mà chúng ta đã đề cập trong mô hình san bằng mũWinters.
1.4 Ý nghĩa thực tiễn
Phương pháp dự báo giản đơn vừa có thể được tiếp thu và thực hiện một cách
nhanh chóng trên cơ sở một bộ dữ liệu vừa phải. Và mặc dùđơn giản theo tính học
thuật, nhưng các phương pháp dự báo giảnđơn này vẫn có khả năngđiều chỉnh một
cách hiệu quả các yếu tố căn bản của việc phân tích dữ liệu là tính xu thế, tính

mùa, và các dao động ngẫu nhiên. Thậm chí dự báo bằng các phương pháp thô
nàyđã vàđangđượcáp dụng phổ biến hơn là các phương pháp dự báo phức tạp
khácở bản chất tính thích nghi vàđơn giản của chúng
CHƯƠNG 2: Cơ sở lý thuyết và mô hình nghiên cứu
2.1 Mô hình dự báo giản đơn
2.1.1 Các giả định cho mô hình giản đơn:
- Các phương pháp dự báo thôđược sử dụng để phát triển các mô hình dự báo
giản đơn với giả định rằng các dữ liệu gần nhất là các dự đoán tốt nhất cho
tương lai.
- Các phương pháp trung bìnhđưa ra các dự báo dựa trên giá trị trung bình của
các quan sát quá khứ với trọng số như nhau.
- Các phương pháp san mũđưa ra các dự báo dựa trên giá trị trung bình có trọng
số của các quan sát quá khứ vớiđiều kiện là các trọng số có xu hướng giảm dần.
2.1.2 Các mô hình dự báo
(1) Mô hình dự báo thô
• Mô hình dự báo thô giản đơn: các mô hình dự báo thô giả định rằng các giai
đoạn gần nhất là các ước lượng tốt nhất cho tương lại, được biểu diễn như sau:
là giá trị dự báo giai đoạn t+1 trên cơ sở giá trị thực tếở giai đoạnt.
Giá trị dự báo thô giản đơn của mỗi giai đoạnđơn giản chỉ là giá trị của quan
sát của giai đoạn ngay trước đó. 100% trọng số được gán cho giá trị hiện tại của
dữ liệu () khi dự báo cho giai đoạn t+1
• Mô hình dự báo thô điều chỉnh
Mô hình dự báo thô giản đơn có thể bịảnh hưởng của yếu tố xu thế và yếu tố
mùa (sẽđược trình bày kĩ hơnở phần mô hình dự báo bằng phương pháp phân
tích) vì tính dựa vào this gian của nó
o Điều chỉnh xu thế: công thức của mô hình dự báo thô giản đơn có thể
được điều chỉnh yếu tố xu thế như sau:
Hoặc
o Điều chỉnh mùa vụ: đối với dữ liệu theo quý, thì mô hình dự báo thô có
thể được điều chỉnh như sau:

Điều này có nghĩa là: khi dự báo có yếu tố mùa thì giá trị dự báo cho
một quý nào đó (mùa nào đó) của năm sau chính là giá trị thực tế của
chính quý đó năm trước.
• Đối với dữ liệu vừa có yếu tố xu thế, vừa có yếu tố quý (mùa), chúng ta
có thể điều chỉnh như sau:
(2) Phương pháp dự báo trung bình: các phương pháp nàyđều sử dụng hình thức bình
quân hoặc bình quân gia quyền của các quan sát quá khứ để “san” (Smooth) các dao
động ngắn hạn của dữ liệu.
Giả định cơ bản của phương pháp này là cho rằng các dao động trong các dữ liệu
quá khứ chỉ thể hiện tính ngẫu nhiên xoay quanh một cấu trúcổnđịnh.Một khi cấu
trúc dữ liệu quá khứ được nhận diện, thì việc dự báo tương lai trở nên dễ dàng.
• Trung bình giản đơn: mô hình dự báo trung bình giảnđơn được biểu hiện qua
công thức:
t có thể là quan sát cuối cùng trong mẫu hoặc toàn bộ mẫu dữ liệu quá khứ sẵn
có.
Khi một quan sát mớiđượcđưa thêm vào, thì giá trị dự báo cho giai đoạn tiếp
theo chỉ đơn giản là trung bình của và quan sát mới thêm vào. Cho nên khi cập
nhật thông tin, công thức trên sẽ được điều chỉnh như sau:
Phương pháp này chỉ phù hợp với các chuỗi dữ liệu không có biến động lớn
(chuỗi this gian có tính “dừng”).Điều này có nghĩa rằng, các yếu tố và môi
trường kinh doanh ảnh hưởng lên đối tượng dự báo có tính ổn định.
• Trung bình di động: chỉ sử dụng một số quan sát gần nhất làm giá trị dự báo.
Phương pháp này cũng thích hợp với các chuỗi dừng.
Với hệ số số trượtk, trung bình di động bậc k, ký hiệu là MA(k) được thể hiện
theo công thức:
Trung bình di động trong giai đoạn t là giá trị trung bình số học củak quan sát
gần nhất, trọng số của mỗi quan sát đều bằng nhau và bằng 1/k
• Trung bình di động kép: phương pháp này nhằm sử dụngđể dự báo dữ liệu chuỗi
this gian có yếu tố xu thế, gồm 2 bước cơ bản:
Bước 1: Tính giá trị bình quân di động cho chuỗi dữ liệu gốc (MA)

Bước 2: Tính giá trị bình quân di động cho chuỗi bình quân di động thứ nhất
(MA’)
Các bước thực hiện cụ thể bao gồm:
- Bước 1: Tính chuỗi trung bình di động bậc 1, MA(k) theo công thức:
- Bước 2: Tính chuỗi trung bình di động bậc 2, MA(k)’ theo công thức:
- Bước 3: Tính chênh lệch giữa và để xác định ‘vị trí’ trung bình của chuỗi
dữ liệu khi có yếu tố xu thế ()
- Bước 4: Ước lượng hệ sốđiều chỉnh yếu tố xu thế của dữ liệu, hệ số
nàyđược xem nhưđộ dốc (). Lưuý là hệ số độ dốc này có thể thay đổitheo
this gian.
]
- Bước 5: Dự báo cho giai đoạn tiếp theo:
Trong đó, k là hệ số trượt và P là số giai đoạn dự báo
(3) Các phương pháp san mũ
• San mũ giản đơn: đưa ra một giá trị trung bình di động với trọng số giảm dần
cho tất cả các quan sát trong quá khứ. Mô hình san mũ giảnđơn thường phù hợp
với loại dữ liệu không thể dự đoán được có xu hướng tăng hay giảm.
Phương pháp san mũ vẫn dựa trên cơ sở lấy trung bình tất cả các giá trị quá
khứ của chuỗi dữ liệu dưới dạng trọng số giảm dầntheo hàm mũ. Quan sát gần
nhất (với giá trị dự báo) nhận trọng số (với 0<<1) lớn nhất, quan sát tiếp theo
nữa nhận trọng số nhỏ hơn nữa, , và cứ tiếp diễn như thế cho đến quan sát cuối
cùng trong dữ liệu quá khứ.
Các thể hiệnđơn giản nhất của phương pháp này được biểu hiện theo công
thức sau:
Trong đó:
= giá trị dự báo (mới) ở giai đoạn t+1
= Hệ số san mũ
= Giá trị quan sát hoặc giá trị thực ở giai đoạn t
= Giá trị dự báo (cũ) ở giai đoạn t
Ta có thể viết lại công thức trên như sau:

Với , theo đó giá trị dự báo mới bằng giá trị dự báo cũ đượcđiều chỉnh theo
sai số dự báo cũ ()
Nếu công thứcđơn giản nhất đúng với giai đoạnt+1, thì cũng đúng với giai
đoạnt, và nếu đúng với giai đoạnt, thì cũng sẽ đúng với giai đoạnt-1… Ta có
công thức tổng quát như sau:
Trong đó: n là số quan sát có sẵn trong mẫu dữ liệu quá khứ
Như vậy, với bất kỳ giá trị bằng bao nhiêu, thì quan sát càng lùi sâu về quá
khứ thì trọng số của nó trong giá trị dự báo càng nhỏ, và tổng trọng số của tất cả
các quan sát quá khứ phải bằng 1. Hơn nữa, nếu giá trị càng lớn thì giá trị dự báo
thực sự chỉ phụ thuộc vào một số quan sát gần nhất, và ngược lại.
Yếu tố quan trọng nhất trong phương pháp san mũ giảnđơn là việc xác định
giá trị của hệt số san mũ. Kinh nghiệm cho thấy rằng, nếu dữ liệu tươngđốiổn
định với mức biến thiên thấp, thì chúng ta có thể chọn giá trị nhỏ, và ngược lại.
Để xác định được hệ số tốiưu là phương pháp lặpđi lặp lại sao cho sai số dự
báo tính toán được là bé nhất.
Một yếu tố khác, ngoài hệsố, cóảnh hưởng đáng kểđến kết quả dự báo theo
mô hình san mũ giản đơn là việc chọn giá trị dự báo đầu tiên . Nếu dữ liệu đủ
lớn thì đây không phải là vấnđề quan trọng vìảnh hưởng của giá trị dự báo đầu
tiên sẽ giảm đáng kể khi t tăng lên. Một cách khác có thể sử dụng là lấy giá trị
trung bình củak quan sátđầu tiên.
• San mũ Holt: được sử dụngđối với dữ liệu có yếu tố xu thế.
Khi chuỗi thời gian có yếu tố xu thế (cục bộ), thì chúng ta cần phải dự báo cả
giá trị trung bình (giá trị san mũ) và độ dốc (xu thế) hiện tại là, cơ sở cho dự báo
tương lai. Mô hình san mũ Holt được thể hiện qua ba phương trình sau đây:
1. Ước lượng giá trị trung bình hiện tại :
==+ (1-)( + ) (4.19)
2. Ước lượng xu thế ( độ dốc)
=(-) + (1-) (4.20)
3. Dự báo p giai đoạn trong tương lai
= + (4.21)

Trong đó
= Giá trị san mũ mới ( hoặc giá trị ước lượng trung bình hiện tại)
= hệ số mũ của giá trị trung bình ( 0<<1)
= Giá trị quan sát hoặc giá trị thực tại thời điểm t
= Hệ số san mũ của giá trị xu thế (0<<1)
= Giá trị ước lượng của xu thế
P = thời đoạn dự báo trong tương lai
= giá trị dự báo cho p giai đoạn trong tương lai
Nhận xét :
• Giá trị san mũ (trung bình) dự báo tại thời điểm t được tính bằng
bình quân gia quyền giữa hai giá trị ước lượng của trung bình: một
ước lượng chính là giá trị quan sát và một ước lượng khác được
tính bằng cách cộng thêm yếu tố xu thế vào giá trị san mũ trước
đó: , nghĩa là dự báo cho giá trị ước lượng của trung bình tại thời
điểm t.
• Hệ số san mũ thứ 2 được sử dụng để tạo ra các ước lượng xu thế.
Phương trình (4.20) cho thấy giá trị ước lượng của xu thế mới là
bình quân gia quyền của 2 giá trị ước lượng của xu thế: một giá trị
ước lượng được tính bằng thay đổi trong giá trị của trung bình từ
thời điểm t-1 sang t( - ) .Về mặt ý tưởng thì phương trình (4.20)
cũng giống như phương trình (4.19) nhưng khác biệt ở đây chỉ là
san mũ đối với “xu thế” chứ không phải là san mũ đối với dữ liệu
quan sát thực.
• Phương trìn (4.21) hàm ý rằng nếu ta dự báo cho một giai đoạn
tiếp theo () thì p sẽ bằng 1, hai giai đoạn tiếp theo () thì p sẽ bằng
2… Như vậy kết quả dự báo chính là giá trị san mũ mới (trung
bình) có điều chỉnh yếu tố xu thế cục bộ.
• Tương tự như san mũ giản đơn, và trong san mũ Holt có thể được
chọn một cách chủ quan hoặc bằng cách tối thiểu hóa sai số dự báo
(RMSE). Ở đây chúng ta có thể sử dụng kỹ thuật phân tích độ nhạy

hai chiều để xác định và tối ưu.
• San mũ Winters:là một phương pháp mở rộng của san mũ Holt đối với các dữ
liệu có chứa yếu tố mùa.
Yếu tố mùa trong chuỗi thời gian có thể thuộc dạng phép cộng hoặc phép
nhân.Dạng phép cộng có nghĩa là yếu tố mùa ở các năm khác nhau chưa được
lặp đi lặp lại một cách đều đặn.Ngược lại, dạng phép nhân có nghĩa là yếu tố
mùa ở năm sau được lặp đi lặp lại nhưng với một cường độ cao hơn hoặc thấp
hơn so với từng mùa trong năm trước. Mô hình san mũ Winters tổng quát nhất là
mô hình dạng nhân tính. Mô hình này được ước lượng thong qua hệ bốn phương
trình sau đây:
1. Ước lượng giá trị trung bình hiện tại
=. + (1-)( + ) (4.25)
2. Ước lượng giá trị xu thế ( độ dốc)
=(-) + (1-) (4.26)
3. Ước lượng giá trị chỉ số mùa
= + (1-) (4.27)
4. Dự báo p giai đoạn trong tương lai
= (+p) (4.28)
Trong đó :
= Giá trị san mũ mới ( hoặc giá trị ước lượng trung bình hiện tại)
= hệ số mũ của giá trị trung bình ( 0<<1)
= Giá trị quan sát hoặc giá trị thực tại thời điểm t
= Hệ số san mũ của giá trị xu thế (0<<1)
= Giá trị ước lượng của xu thế
= Hệ số san mũ của chỉ số mùa
= giá trị ước lượng của chỉ số mùa
P = thời đoạn dự báo trong tương lai
S = độ dài của yếu tố mùa
= giá trị dự báo cho p giai đoạn trong tương lai
Nhận xét :

• Phương trình 4.27 là san mũ giản đơn giữa / và /
• Phương trình 4.25 có điều chỉnh loại ảnh hưởng mùa vụ để ước
lượng giá trị trung bình .
• Do đây là mô hình nhân tính nên để bụ báo cho các giai đoạn tương
lai , chúng ta nhân giá trị ước lượng của trung bình có điều chỉnh xu
thế với chỉ số mùa vụ của từng mùa vụ riêng biệt
• Mô hình cộng tính có 3 điểm khác biệt so với mô hình nhân tính là :
 Giá trị san mũ tại thời điểm t là (-) chứ không phải là (/)
 Chỉ số mùa vụ tại thời điểm t là (-) chứ không phải (/
 Giá trị dự báo mới sẽ là tổng của ba thành phần ( + p+)
2.2 Mô hình dự báo bằng phương pháp phân tích
2.2.1 Giới thiệu
Mô hình xu thế là một trong số những mô hình dự báo đơn giản với giả định là yếu
tố xu thế (thời gian) là nổi trội. Tuy nhiên không phải lúc nào dự báo bằng các mô hình
xu thế cũng được áp dụng một cách dễ dàng với giả định trên. Thực tế, khi ta biểu diễn
một số loại dữ liệu được thu thập trong quá khứ (thường theo tháng hoặc theo quý)
trên đồ thị, ta có thể nhận ra dữ liệu không chỉ tăng giảm theo yếu tố thời gian (yếu tố
xu thế) mà nó còn có quy luật vận động lặp đi lặp lại sau mỗi năm (yếu tố mùa). Ví dụ
như doanh số của những hãng du lịch thường tăng cao vào những tháng/quý thuộc mùa
hè, v…v…. Trong trường hợp như vậy, người ta nói rằng dữ liệu của chúng ta bao
gồm trong đó yếu tố mùa. Ngoài ra trong một chuỗi dữ liệu còn có hai thành phần khác
là yếu tố ngẫu nhiên (bất thường), và yếu tốchu kỳ (khi chúng ta cần xét một chuỗi dữ
liệu dài khoảng vài chục năm). Trong trường hợp dữ liệu của chúng ta có các yếu tố
này, ta cần phân tích các thành phần trong một chuỗi thời gian để có thể thực hiện các
kỹ thuật dự báo được chính xác hơn.Đây chính là nguyên nhân của sự ra đời các mô
hình dự báo bằng phương pháp phân tích mà chúng ta sẽđi tìm hiểu.
(Một chuỗi thời gian thường bao gồm 4 thành phần khác biệt về bản chất.Đó là
thành phần xu thế (Trend component), thành phần chu kỳ (Cyclical component), thành
phần mùa (Seasonal component) và thành phần bất thường/ngẫu nhiên
(Irregular/Random component). Ta sẽđi vào phân tích làm rõ từng thành phần và sử

dụng 2 mô hình dự báo với giả định yếu tố mùa và yếu tố xu thế là yếu tố nổi trội).
2.2.2 Cơ sở lý thuyết
a) Bốn thành phần của chuỗi thời gian
Một chuỗi thời gian thường bao gồm 4 thành phần sau đây:
- Xu thế (Trend): là thành phần thể hiện sự tăng (hoặc giảm) ẩn bên trong một chuỗi
thời gian, thườngđược ký hiệu làTr, hay T.
- Chu kỳ (Cyclical) là một chuỗi những sự dao động giống nhau như hình sóng và sự
dao động này sẽ lặp lại sau một thời kỳ thường dài hơn một năm, thường được ký
hiệu là Cl, hay C.
Trong thực tế, chu kỳ thường khó xác định và thường được xem như một
thành phần của yếu tố xu thế. Khi đó, một chuỗi thời gian sẽ bao gồm 3 thành
phần là Tr, Sn, Ir.
- Mùa (Seasonal) đây là những dao động thường được tìm thấy với dữ liệu theo quý,
theo tháng, thậm chí là theo tuần. Sự dao động mùa vụ liên quan đến kiểu thay đổi
kháổn định xuất hiện hằng năm và kiểu thay đổi đó lăp lạiở năm sau, các năm sau
nữa, ký hiệu là Sn hay S.
- Ngẫu nhiên/bất thường (Irregular) là thành phần bao gồm những thay đổi ngẫu
nhiên, không dựđoán được. Những sự thay đổi này là kết quả của vô số những sự
kiện mà nếu xét riêng lẻ thì không quan trọng gì, nhưng nếu kết hợp lại thì có thể
tạo ra mộtảnh hưởng lớn. Thành phần ngẫu nhiên thường được ký hiệu là Ir hay I.
b) Các mô hình dự báo:
Các mô hình dự báo chỉ có thể tập trung tìm ra các thành phần xu thế, mùa vụ. Còn
thành phầnchu kỳ cần có một chuỗi dữ liệu lưu trữít nhất là trên 30 năm. Ta sẽ sử dụng
2 mô hình dự báo với giả định yếu tố mùa và yếu tố xu thế là 2 yếu tố nổi trội, cố gắng
tìm ra những cách thức kết hợp của hai thành phần này nhằm phục vụ cho nhu cầu dự
báo chuỗi thời gian.
• Mô hình
- Mô hình nhân tính:
Có dạng:
Mô hình nhân tính sẽ phù hợp khi sự biến thiên của chuỗi thời gian tằng dần

theo thứ tự của thời gian. Điều này có nghĩa là các giá trị của chuỗi trải rộng ra
khi xu thế tăng dần, và tập hợp các quan sát có dạng hình cái loa (megaphone),
hay hình cái phễu (funnel).
- Mô hình cộng tính:
Mô hình cộng tính có hiệu quả khi chuỗi dữ liệuđang được phân tích có sự biến
thiên xấp xỉđều nhau suốt độ dài dài của chuỗi thời gian.điều này có nghĩa là
các giá trị của chuỗi thời gian về cơ bản nằm trong một dải giá trị có độ rộng là
một hằng số và trung tâm của dải này làđường xu thế.
• Hiệu chỉnh yếu tố mùa cho dữ liệu:
Khi dữ liệu có yếu tố mùa, ta cần tách yếu tố mùa ra khỏi chuỗi dữ liệu, sau đó
mới sử dụng chuỗi dữ liệu được hiệu chỉnh yếu tố mùa để thực hiện dự báo xu thế.
Đểđơn giản, với mô hình nhân tính chúng ta sử dụng Tỷ lệ trung bình di động(Ratio
to Moving Average), với mô hình cộng tính ta sử dụng chênh lệch so với trung bình di
động(Difference from moving average).
- Tỷ lệ trung bình di động – Mô hình nhân tính
Các bước thực hiện:
(1) Tính trung bình trung tâm (CMA_Centered Moving Average) của:
• nếu số liệu theo tháng.
• nếu số liệu theo quý.
Về mặtý nghĩa, bao gồm yếu tố xu thế vàchu kỳ kết hợp lại. Và như
vậy trong mô hình dự báo nhân tính thì
(2) Tính tỷ lệ
Ta biết rằng, trong mô hình nhân tính nên
(3) Tính toán các chỉ số mùa vụ (The Seasonal Indices)
• Ở chuỗi dữliệu theo tháng, chỉ số mùacho thángm bằng trung bình
củavới các quan sát chỉ cho thángm (mỗi năm có một thángm).
• Ở chuỗi dữ liệu theo quý, chỉ số mùacho quýq bằng trung bình
củavới các quan sát chỉ cho quýq (mỗi năm có một quýq).
(4) Điều chỉnh các chỉ số mùa để tích của chúng bằng một. Điều này được
thực hiện bằng cách tính các nhân tố mùa(The Seasonal Factor). Nhân

tố mùa Sn là tỷ số cả chỉ số mùa và trung bình nhân của các chỉ số:
• nếu dữ liệu theo tháng
• nếu dữ liệu theo quý
Sn ở thời điểmt nào đó sẽ cho ta biết: Ở giai đoạn t, chuỗi cao hơn
Sn % so với chuỗi dữ liệu đã hiệu chỉnh yếu tố mùa.
(5) chuỗi dữ liệu đã hiệu chỉnh yếu tố mùa (The Seasonally Ajusted Series)
có được bằng cách chia cho nhân tố mùa
Giả định: không có yếu tố chu kỳ, và yếu tố ngẫu nhiên bị triệt tiêu khi
chúng ta tính trung bình nhằm tìm ra chỉ sốmùa . Khi đó, và, chuỗi dự
liệu đã hiệu chỉnh yếu tố mùa chỉ còn lại yếu tố xu thế. Ta sẽ sử dụng
chuỗi để dựđoán thành phần xu thế trong tương lai.
- Chênh lệch so với trung bình di động – mô hình cộng tính
Trong mô hình cộng tính, các bước tính toán để có được chuỗi dữ liệuđiều
chỉnh yếu tố mùa cũng tương tự như với mô hình nhân tính.
(1) Tính trung bình trung tâm (CMA_Centered Moving Average) của:
• nếu số liệu theo tháng.
• nếu số liệu theo quý.
(2) Tính sự khác biệt
(3) Tính các chỉ số mùa(The Reasonal Indices)
• Chuỗi dữ liệu theo tháng: chỉ số mùa cho thángm bằng trung bình
của với các quan sát chỉ cho những thángm (mỗi năm có một
thángm)
• Chuỗi dự liệu theo quý: chỉ số mùa cho quýq bằng trung bình của
bình của với các quan sát chỉ cho những thángq (mỗi năm có một
thángq)
(4) Điều chỉnh các chỉ số mùađể tổng của chúng bằng không.
với i là trung bình của tất cả các chỉ số mùa
cho biếtở thời đoạnt, Y cao hơn (hay thấp hơn) một lượng so với
chuỗi dữ liệu đãđiều chỉnh yếu tố mùa
(5) Chuỗi dữ liệuđãđiều chỉnh yếu tố mùa có được bằng cách lấy

Khi đó, chuỗi dữ liệu được tính bởi công thức:
Trong dự báo ngắn hạn, giả định rằng không có yếu tốchu kỳ, và yếu tố
ngẫu nhiên đã bị triệt tiêu khi tính toán trung bình nhằm tìm ra chỉ số
mùa vụ. Khi đó, và, và chuỗi chỉ còn lại yếu tố xu thế.
• Các bước thực hiện dự báo:
- Bước 1. Nhận dạng: việc đầu tiên là ta sẽ vẽ đồ thị của Y theo thời gian để
xem chuỗi dữ liệu này có yếu tố xu thế, có yếu tố mùa… hay không.
- Bước 2. Tách yếu tố mùa.
- Bước 3. Ước lượng hàm xu thế và dự báo
- Bước 4. Kết hợp yếu tố xu thế, yếu tố mùa vụđểđưa ra kết quả dự báo cuối
cùng.
Trênđây là các bước cơ bản khi thực hiện dự báotheo phương pháp
phân tích. Tuỳ thuộc vào việc nhận dạng mô hình mà ta sử dụng Mô hình
nhân tính hay Mô hình cộng tính. Ta có thể sử dụng thêm đồ thị trong việc
đánh giá kết quả dự báo.
• Kiểm định yếu tố mùa cho bộ dữ liệu bằng phương pháp Kruskal-Wallis
Đây là phương pháp kiểm định yếu tố mùa vụ có xuất hiện trong bộ dữ liệu
hay không một cách rất đơn giản nhưng khá hữuích.
- Kruskal-Wallis là một trong những kiểm định phi tham số, không đòi hỏi về phân
phối chuẩn của dữ liệu trong từng nhóm, cũng không yêu cầu về số lượng quan sát
trong mỗi nhóm phải lớn. Nó dựa trên sự xếp hạngcủa, và xem xét hạng trung bình
của có sự khác biệt giữa các mùa (các quý/tháng) hay không, hay phân phối của
có khác biệt giữa các mùa (các quý/tháng) hay không. Nếu có sự khác biệt thì
chuỗi dữ liệu gốc ban đầu có tồn tại yếu tố mùa.
- Các bước thực hiện:
Bước 1. Tính CMA và chuỗi Sn.Ir: vì chúng ta chưa biết được là mô hình
cộng tính hay nhân tính nên ta sẽ tính cho cả 2 mô hình nhân tính và cộng tính.
Bước 2. Thực hiện kiểm định Kruskal-Wallis: đặt giả thuyết với và và tính P-
value. Nếu P-value của thống kê Kruskal-Wallis < thìở mứcýnghĩa, chuỗi dữ liệu
(biến Y) có yếu tố mùa. Ngược lại, chuỗi dữ liệu không có yếu tố mùa. Việc chọn

mô hình cộng tính hay mô hình cũng có thể căn cứ trên độ chính xác của từng mô
hình mà ta chọn để dự báo, dựa trên những phân tích của mình về mô trường dự
báo trong tương lai.
• Kiểm định Kruskal-Wallis cho chuỗi Sn.Ir với công thức tính CMA của
Gaynor & Kirkpatrick
Bước 1. Tính
với khoảng trượt L chẵn (L=4 nếu dữ liệu theo quý, L=12 nếu
dữ liệu theo tháng)
Bước 2. Tính
Bước 3. Tính
Mô hình nhân tính:
Mô hình cộng tính:
Bước 4. Sắp xếp theo từng quý hoặc tháng
Bước 5. Tính trung bìnhtheo từng quý hoặc tháng
Bước 6.Điều chỉnh trung bìnhđể tính toán nhân tố mùa Sn.
Bước 7.Tính chuỗi dữ liệu đã hiệu chỉnh yếu tố mùa.
Tính toán dữ liệu đã hiệu chỉnh yếu tố mùa bằng cách:
• nếu là mô hình nhân tính, kết quả như cột
• nếu là mô hình cộng tính
CHƯƠNG3: Kết quả nghiên cứu
Sau đây là bảng số liệu Book1.xlsx thể hiện lượng khách quôc tế đến Việt Nam từ quý I 2007
đến quý 2 2012
Năm 2007 2008 2009 2010 2011 2012
Quý 1 1055961 1285954 1016402 1351224 1511472 1773726
Quý 2 994726 1003333 877419 1159296 1454346 1489701
Quý 3 1057000 955389 890756 1221396 1502232
Quý 4 1057000 934693 986130 1317936 1723779
Biễu diễn trên đồ thị:
800,000
1,000,000

1,200,000
1,400,000
1,600,000
1,800,000
I II III IV I II III IV I II III IV I II III IV I II III IV I II
2007 2008 2009 2010 2011 2012
Y
Đồ thị trên cho thấy số lượng khách quốc tế đến Việt Nam có xu hướng tăng dần , có thể là xu
thế tuyến tính , có yếu tố mùa , trong mỗi năm lượng khách đông nhất thường vào quý 1 và yếu
tố mùa ảnh hưởng càng mạnh theo thời gian
DỰ BÁO PHƯƠNG PHÁP SAN MŨ GIẢN ĐƠN
Dùng công thức := + (1-) : để tính các giá trị tiếp theo
Tính các giá trị dự báo với = 0.1 và = 0.6 ta được bảng sau :
Năm Quý Yt-
Y^t(α=0.
1)- e
Y^t(α=0.
6)
2007 Q1
10559
61 1055961 0 1055961
Q2
99472
6 1055961
-
6123
5 1055961
Q3 10570 1049838 7162 1019220
00
Q4

10267
62 1050554
-
2379
2 1041888
2008 Q1
12859
54 1048175
2377
79 1032812
Q2
10033
33 1071953
-
6862
0 1184697
Q3
95538
9 1065091
-
1097
02 1075879
Q4
93469
3 1054121
-
1194
28 1003585
2009 Q1
10164

02 1050349
-
3394
7 962250
Q2
87741
9 1033055
-
1556
36 994741
Q3
89075
6 1018826
-
1280
70 924348
Q4
98613
0 1015556
-
2942
6 904193
2010 Q1
13512
24 1049123
3021
01 953355
Q2
11592
96 1060140

9915
6 1172408
Q3
12213
96 1076266
1451
30 1164541
Q4
13179
36 1100433
2175
03 1198654
2011 Q1
15114
72 1141537
3699
35 1270223
Q2
14543
46 1178531
2758
15 1414972
Q3
15022
32 1206113
2961
19 1438596
Q4 17237 1235724 4880 1476778
49 25
2012 Q1

18737
26 1284527
5891
99 1624961
Q2
14897
01 1343447
1462
54 1543805
Q3
Q4
Như vậy hệ số alpha tối ưu sẽ là 0.658
Kết quả dự báovà đồ thị với Yt và YTSM
Năm Quý Yt e Y^t(α=0.658)
2007 Q1 1055961 0 1055961
Q2 994726 -61235 1055961
Q3 1057000 37780 1015668
Q4 1026762 -15126 1042865
2008 Q1 1285954 253142 1032269
Q2 1003333 -181364 1199194
Q3 955389 -120490 1070317
Q4 934693 -68892 994695
2009 Q1 1016402 54152 955214
Q2 877419 -117322 995476
Q3 890756 -33592 917794
Q4 986130 81937 900003
2010 Q1 1351224 397869 956675
Q2 1159296 -13112 1089999
Q3 1221396 56855 1135597
Q4 1317936 119282 1192053

2011 Q1 1511472 241249 1274884
Q2 1454346 39374 1430559
Q3 1502232 63636 1446211
Q4 1723749 246971 1483072
2012 Q1 1873726 248765 1641438
Q2 1489701 -54104 1541595
Q3 1507449
DỰ BÁO VỚI MÔ HÌNH NHÂN TÍNH
Kiểm định Kruskal-Wallis
Prob của thống kê Kruskal – Wallis là 0.0109 <0.05 , tức là ở độ tin cậy 95% ( hay mức ý nghĩa
5%) có yếu tố mùa tồn tại trong chuỗi dữ liệu
Kết quả ước lượng bằng mô hình nhân tính:
Phương trình hồi quy : Residsa= 2342746 -124225,8.T + 2857039.T
2
Kết quả dự báo khoảng
Kiểm định ý nghĩa thống kê của các hệ số hồi quy :
Ta có Prob( )=0.0022<0.05
Prob( )=0.0003<0.05
Đánh giá mức độ phù hợp của mô hình hồi quy :
=0.84
Thống kê F = 51,87209 với Prob = 0.000 ( < 0.05) => mô hình phù hợp với dữ liệu
Kết quả dự báo và đánh giá bằng đồ thị :
DỰ BÁO VỚI MÔ HÌNH CỘNG TÍNH
Kiểm định Kruskal-Wallis
Test for Equality of Medians of SNIR_ADD
Categorized by values of QUARTER
Date: 10/05/12 Time: 03:01
Sample (adjusted): 2007Q2 2011Q4
Included observations: 19 after adjustments
Method df Value Probability

Med. Chi-square 3 9.373333 0.0247
Adj. Med. Chi-square 3 5.412361 0.1440
Kruskal-Wallis 3 9.612632 0.0222
Kruskal-Wallis (tie-adj.) 3 9.612632 0.0222
van der Waerden 3 9.798045 0.0204
Category Statistics
> Overall
QUARTER Count Median Median
Mean
Rank Mean Score
1 4 144566.6 4 17.00000 1.110629
2 5 -69041.75 0 5.400000 -0.738147
3 5 -37107.00 2 9.400000 -0.091260
4 5 -29232.75 3 9.600000 -0.059096
All 19 -37107.00 9 10.00000 -3.51E-17
Prob của thống kê Kruskal – Wallis là 0.022 <0.05 , tức là ở độ tin cậy 95% ( hay mức ý nghĩa
5%) có yếu tố mùa tồn tại trong chuỗi dữ liệu
Kết quả ước lượng bằng mô hình cộng tính:
Phương trình hồi quy: YSA=1150384 – 63252.4T + 6166.5T
2
– 96.9T
3
Kết quả dự báo khoảng
Kiểm định ý nghĩa thống kê của các hệ số hồi quy :
Ta có Prob( )=0.047<0.05
Prob( )=0.00003<0.05
Đánh giá mức độ phù hợp của mô hình hồi quy :
=0.848
Thống kê F = 52,8856 với Prob = 0.000 ( < 0.05) => mô hình phù hợp với dữ liệu
Kết quả dự báo và đánh giá bằng đồ thị :

800,000
1,000,000
1,200,000
1,400,000
1,600,000
1,800,000
2,000,000
I II III IV I II III IV I II III IV I II III IV I II III IV I II III IV
2007 2008 2009 2010 2011 2012
Y YF
SO SÁNH KẾT QUẢ DỰ BÁO GIỮA MÔ HÌNH NHÂN TÍNH, CỘNG TÍNH VÀ SAN
MŨ GIẢN ĐƠN
MAE MAPE RMSE
San mũ giản đơn 116015 0.092359 152576
Mô hình nhân tính 85907 7.301661 99549
Mô hình cộng tính
83250 7.264637 98883
Dựa vào bảng so sánh trên ta thấy ta chọn kết quả dự báo của phương pháp dùng mô hình
công tính vì cho kết quả có độ chính xác cao nhất trong 3 phương pháp
CHƯƠNG 4: Tổng hợp
Tính hiệu quả của các phương pháp dự báo giản đơn là nhưng cá nân làm nhiệm vụ
phân tích dữ liệu và dự báo ở các lĩnh vực như các doanh nghiệp thông thường, cũng như
các nhà phân tích kinh tế tài chính trong các thị trường có khả năng vừa tiếp thu và tác
nghiệp chúng một cách dễ dàng, và đồng thời có khả năng đưa ra kết quả dự báo nhanh
chóng trên cơ sở một bộ dữ liệu vừa phải. mặc dù đơn giản theo tính học thuật nhưng các
phương pháp dự báo giản đơn này vẫn có khả năng điều chỉnh một cách hiệu quả các yếu
tố căn bản của việc phân tích dữ liệu là tính xu thế, tính mùa, và các dao động ngẫu
nhiên.
Theo đánh giá của các nhà phân tích dữ liệu thì các phương pháp dự báo thô này đã
và đang được áp dụng phổ biến hơn là các phương pháp dự báo hàn lâm phức tạp khác ở

bản chất tính thích nghi và đơn giản của chúng.
Phương pháp phân tích đã giúp cho những nhà chuyên môn thậm chí là những người
ít am hiểu dự báo biết rằng một chuỗi thời gian chúng ta có thể quan sát chúng qua bốn
thành phần cơ bản là: mùa vụ, xu thế, chu kỳ, và các dao động ngẫu nhiên.
Hiện nay, phương pháp này vẫn còn phổ biến và không ngừng được các tác giả khác
phát triển Wilson &Keating (2007) đề cập đến ba lý do khiến phương pháp này mặc dù
đã ra đời từ rất lâu nhưng nó vẫn được sử dụng phổ biến đến hiện nay:
Thứ nhất, trong nhiều trường hợp các mô hình phân tích chuỗi thời gian cung cấp
những kết quả dự báo tuyệt vời vì tính phân tích cụ thể của nó.
Thứ hai, các mô hìn ày tạo sự dễ dàng trong việc hiểu và giải thích kết quả dự báo;
nó làm tăng sự hợp lý trong việc giải thích kết quả dự báo cũng như sử dụng kết quả dự
báo.
Thứ ba, thông tin được cung cấp bởi phân tích chuỗi thời gian phù hợp với cách
thức mà nhà quản lý xem xét dữ liệu, và giúp họ có được những hiểu biết sâu hơn về sự
vận động của dữ liệu bởi nó cung cấp những đo lường cụ thể cho các thành phần mà
không định lượng được bởi các phương pháp khác.

×