ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Đỗ Văn Bình
MỘT SỐ MÔ HÌNH DỰ BÁO
VÀ ÁP DỤNG VÀO NGÀNH ĐIỆN
LUẬN VĂN THẠC SĨ
Hà Nội - 2007
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Đỗ Văn Bình
MỘT SỐ MÔ HÌNH DỰ BÁO
VÀ ÁP DỤNG VÀO NGÀNH ĐIỆN
Ngành: Công Nghệ Thông Tin
Chuyên ngành: Công Nghệ Thông Tin
Mã số: 1.01.10
LUẬN VĂN THẠC SĨ
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS Đỗ Trung Tuấn
Hà Nội - 2007
2
MỤC LỤC
LỜI CẢM ƠN 1
MỤC LỤC 2
MỞ ĐẦU 6
Chƣơng 1 7
CÁC PHƢƠNG PHÁP DỰ BÁO NHU CẦU 7
1.1. Giới thiệu 7
1.2. Các phương pháp dự báo 7
1.2.1. Các phương pháp dự báo dựa vào sự phán đoán (Methods Based on
Judgment) 8
1.2.2. Các phương pháp yêu cầu thông tin định lượng 14
1.3. Lựa chọn phương pháp (Selecting methods) 17
1.3.1. Chọn một phương pháp dựa vào dấu hiệu (Choosing a method based on
evidence) 18
1.3.2. Kết hợp các dự báo (Combining forecasts) 19
1.4. Sự không chắc chắn (uncertainty) 20
1.4.1. Sự không chắc chắn trong dự báo bằng phán đoán 20
1.4.2. Sự không chắc chắn trong các dự báo bằng phương pháp định lượng 21
1.5. Đạt được sự chấp nhận của dự báo 21
Chƣơng 2 22
CHUỖI THỜI GIAN VÀ ỨNG DỤNG 22
2.1. Chuỗi thời gian, các đại lượng đặc trưng 22
2.1.1. Định nghĩa chuỗi thời gian 22
2.1.2. Dự báo chuỗi thời gian 22
2.1.3.Các đại lượng đặc trưng của chuỗi thời gian 22
2.2. Một số mô hình dự báo giản đơn 26
2.2.1. Mô hình nhân 28
2.2.2. Mô hình cộng 32
2.3. Mô hình ARIMA thường 39
2.3.1. Toán tử trễ 39
2.3.2. Chuỗi thời gian dừng 40
2.3.3. Quá trình tuyến tính 42
2.3.4. Quá trình tự hồi qui - AR(p) 42
2.3.5. Quá trình trung bình trượt – MA(q) 47
2.3.6. Quá trình trung bình trượt tự hồi qui ARMA(p,q) 50
2.3.7. Mô hình tích hợp trung bình trượt tự hồi qui ARIMA(p,d,q) 51
2.3.8. Qui trình xây dựng mô hình ARIMA (p, d, q) 53
2.3.9. Nguyên tắc tằn tiện 61
2.4. Mô hình ARIMA theo mùa vụ 62
2.4.1.Chuỗi mùa vụ 62
2.4.2. Biến đổi chuỗi mùa vụ thành chuỗi dừng 63
2.4.3.Mô hình tích hợp trung bình trượt tự hồi qui theo mùa vụ
ARIMA(p,d,q)x(P,D,Q)
s
64
2.5. Ứng dụng mô hình ARIMA theo mùa vụ 68
Chƣơng 3 82
NHU CẦU SỬ DỤNG ĐIỆN NĂNG VÀ HƢỚNG ÁP DỤNG MÔ HÌNH NHIỀU BIẾN
82
3.1. Giới thiệu về nhu cầu sử dụng điện 82
3
3.2. Các yếu tố ảnh hưởng nhu cầu điện năng và các nguồn dữ liệu 83
3.2.1. Các yếu tố ảnh hưởng đến nhu cầu điện năng 84
3.2.2. Mô hình dự báo và dữ liệu 85
3.3. Các sự kiện gây ảnh hưởng nhu cầu điện năng trong thời gian ngắn và trung
bình…………………… 85
3.3.1. Sự khuyến khích tài chính 85
3.3.2. Giảm thuế quan 86
3.3.3. Nhu cầu nhà ở và điện khí hóa 86
3.3.4. Cơ cấu lại ngành điện và thị trường điện cạnh tranh 86
KẾT LUẬN 87
TÀI LIỆU THAM KHẢO 89
4
DANH SÁCH CÁC HÌNH VẼ
Hình 1: Cây phân loại các phương pháp dự báo 8
Hình 2: Cây lựa chọn các phương pháp dự báo…………………………………… 18
Hình 3: Mô tả đồ thị dự báo theo mô hình nhân và mô hình cộng…………….…… 27
Hình 4: Đồ thị chuỗi số liệu điện thương phẩm Việt Nam (theo quý)……………… 28
Hình 5: So sánh giữa đồ thị điện thương phẩm dự báo theo mô hình cộng với số liệu
thực tế…………………………………………………………………………………36
Hình 6: So sánh giữa đồ thị điện thương phẩm dự báo theo mô hình nhân với số liệu
thực tế…………………………………………………………………………………37
Hình 7: Đồ thị chuỗi số liệu điện thương phẩm Việt Nam (theo quý) sau khi sử dụng
hàm biến đổi log ………………… ……………………………………………… 69
Hình 8: ACF và PACF của chuỗi DTP_Log sử dụng phần mềm Eviews………… 70
Hình 9: Kiểm định DF của chuỗi DTP_Log sử dụng phần mềm Eviews………… 71
Hình 10: ACF và PACF của chuỗi DTP1 sử dụng phần mềm Eviews…………… 72
Hình 11: ACF và PACF của chuỗi DTP2 sử dụng phần mềm Eviews………… 73
Hình 12: Kiểm định DF của chuỗi DTP2 sử dụng phần mềm Eviews……… 74
Hình 13: Đồ thị chuỗi số liệu DTP2…………………………………… ………… 74
Hình 14: Ước lượng mô hình sử dụng phương pháp bình phương nhỏ nhất bằng phần
mềm Eviews……………………………………………………………… 75
Hình 15: ACF và PACF của chuỗi phần dư - sử dụng phần mềm Eviews……… …77
Hình 16: Đồ thị chuỗi dự báo DTP2…………………………………………… 78
Hình 17: Đồ thị chuỗi dự báo so với đồ thị của chuỗi số liệu thực…………….… …80
5
DANH SÁCH CÁC TỪ VIẾT TẮT
STT
Từ viết tắt
Từ tiếng anh
Diễn giải
1
ACF
Auto Correllation Function
Hàm tự tương quan mẫu
2
ADF
Argumented Dickey-Fuller
Kiểm định DF
3
AIC/SIC
Akaike Information Criteria, Schwarz
Information Criteria
Tiêu chuẩn thông tin AIC/SIC
4
APE
Absolute Percent Error
Sai số phần trăm tuyệt đối
5
AR
AutoRegression
Tự hồi quy
6
ARIMA
AutoRegressive Integrated Moving
Average
Tích hợp trung bình trượt tự hồi
quy
7
ARMA
AutoRegressive Moving Average
Trung bình trượt tự hồi quy
8
MA
Moving Average
Trung bình trượt
9
MSE
mean square error
Sai số bình phương trung bình
10
OLS
Optimize Least Squares
Phương pháp bình phương nhỏ
nhất
11
PACF
Partial Auto Correllation Function
Hàm tự tương quan từng phần
12
RBF
Rule-based forecasting
Dự báo dựa trên quy luật
13
SAR
Seasonal AutoRegressive
Tự hồi quy theo mùa vụ
14
SARIMA
Seasonal AutoRegressive Integrated
Moving Average
Tích hợp trung bình trượt tự hồi
quy theo mùa vụ
15
SMA
Seasonal Moving Average
Trung bình trượt theo mùa vụ
6
MỞ ĐẦU
Các bài toán về dự báo thường xuất hiện nhiều trong các lĩnh vực: Kinh tế, lập kế
hoạch sản xuất, tài chính, điều tra xã hội…Hầu hết các bài toán dạng này khi được mô
hình hoá thường là những bài có kích thước lớn, phức tạp, có thể áp dụng nhiều mô
hình lý thuyết. Do vậy việc giải các bài toán này đòi hỏi phải lựa chọn mô hình phù
hợp và hiệu quả.
Việc dự báo một đại lượng biến thiên nói chung và dự báo nhu cầu nói riêng đóng
một vai trò rất quan trọng trong kinh tế và kỹ thuật. Chúng giúp cho những người ra
quyết định, các nhà doanh nghiệp tiên đoán một cách khoa học xu hướng phát triển
trong tương lai của các nhu cầu, của thị trường, và từ đó người ta có thể hoạch định
các chính sách, phương hướng đầu tư một cách đúng đắn.
Ta lấy ví dụ ở ngành Điện lực. Đó là một ngành công nghiệp dịch vụ có quy mô
lớn, sử dụng các thiết bị đắt tiền, đòi hỏi việc đầu tư cơ sở hạ tầng lớn và liên tục. Vì
vậy, để đảm bảo cho việc sử dụng có hiệu quả các thiết bị và cơ sở vật chất sẽ được
đầu tư, cần phải tiến hành việc dự báo nhu cầu với mức độ càng chính xác càng tốt.
Bài toán dự báo cũng đặc biệt quan trọng trong lĩnh vực Khí tượng - Thủy văn.
Việc dự báo trước được thời tiết như nhiệt độ, nắng mưa, lũ lụt sẽ giúp ích nhiều cho
nền kinh tế quốc dân cũng như phòng tránh được thiệt hại to lớn do thiên nhiên gây ra.
Trong lĩnh vực tài chính, nếu ai biết trước được xu hướng tăng giảm của một loại
tiền tệ hay giá cổ phiếu thì chắc chắn mang lại nhiều lợi ích cho người đó v.v
Những lĩnh vực có nhu cầu dự báo rất rộng lớn. Có những dự báo mang tính chất
định tính như màu sắc, bản chất con người và có những dự báo mang tính chất định
lượng như lượng mưa, sức gió, mực nước về ở sông hồ, tốc độ phát triển dân số. Song
với sự phát triển của kỹ thuật số, tất cả các tính chất định tính đều có thể lượng hóa.
Thí dụ một màu sắc có thể đồng nhất với chỉ thị màu của nó.
“Dự báo” và “đoán mò” là hai khái niệm khác hẳn nhau. Trong khi “đoán mò”
mang tính chất của công việc của một thầy bói thì dự báo phải căn cứ trên những thông
tin có được, thiết lập các mô hình, các thuật toán để chỉ ra giá trị cần “dự đoán”. Nói
cách khác đi, dự báo là các “dự đoán” mang tính chất khoa học, tiếp cận với các
phương pháp khoa học để dự báo một cách có cơ sở.
Trong khuôn khổ một khoá luận tốt nghiệp học viên không có tham vọng nghiên
cứu toàn diện tất cả các mô hình dự báo, mà chỉ tìm hiểu, so sánh một số mô hình.
Đồng thời tập trung giải bài toán dự báo bằng việc áp dụng mô hình chuỗi thời gian.
Hy vọng trong thời gian tới, lĩnh vực này tiếp tục được nghiên cứu và phát triển để có
thể thực sự trở thành một công cụ ứng dụng có hiệu quả.
Bố cục của luận văn chia làm 3 chương
Chương 1: Các phương pháp dự báo nhu cầu
Chương 2: Chuỗi thời gian và ứng dụng
Chương 3: Nhu cầu sử dụng điện năng và mô hình nhiều biến
7
Chƣơng 1
CÁC PHƢƠNG PHÁP DỰ BÁO NHU CẦU
1.1. Giới thiệu
Chúng ta phải nhìn vào thực tế để xác định các phương pháp, xem phương pháp
nào có ích cho việc dự báo nhu cầu trong những tình huống khác nhau và để cảnh báo
không nên sử dụng phương pháp nào. Nhìn chung, nên sử dụng các phương pháp đã
thiết kế, tránh tư tưởng trực quan, các hội nghị không trọng tâm và sự khai thác thông
tin. Trong nhiều tình huống mà ở đó có đủ thông tin, sử dụng các phương pháp định
lượng bao gồm phép ngoại suy, dự báo dựa trên quy luật và phương pháp quan hệ
nhân quả. Kiến thức quản lí của một nhà quản lí cần phải được tổng hợp trong việc dự
báo thống kê. Các phương pháp dự báo kết hợp, trong đó có phương pháp Delphi và
thị trường dự báo, cải thiện được tính chính xác.
Các nhà nghiên cứu thị trường coi việc dự báo là một yếu tố quan trọng trong công
việc của mình. Ví dụ: Dalrymple đã khảo sát 134 công ty của Mỹ và thấy rằng có 99%
các dự báo đã được chuẩn bị trong quá trình phát triển chiến lược Marketing của các
công ty đó. Có 93% các công ty được khảo sát chỉ ra rằng việc dự báo doanh số bán
hàng là một trong những vấn đề quan trọng nhất hoặc là một yếu tố rất quan trọng đối
với sự thành công của một công ty. Trong một cuộc khảo sát 353 giám đốc Marketing
từ các nhà máy xí nghiệp của Anh, Jobber, Hooley và Sanderson thấy rằng dự báo
doanh số bán hàng là một trong 9 hoạt động phổ biến nhất mà họ đã thông báo [12].
Chúng ta sẽ thảo luận các phương pháp dự báo nhu cầu. Mọi người thường sử dụng
các thuật ngữ “nhu cầu” và “doanh số bán hàng” là hai thuật ngữ có thể thay đổi cho
nhau. Điều đó cũng hợp lí vì chúng tương đương nhau khi doanh số bán hàng không bị
hạn chế bởi cung.
Đôi khi dự báo nhu cầu một cách trực tiếp lại thích hợp hơn. Ví dụ: Một người làm
bánh có thể ngoại suy các dữ liệu về doanh số bán bánh mì trước đây để dự báo nhu
cầu trước một tuần. Khi mà việc dự báo trực tiếp không khả quan hoặc không chắc
chắn thì các nhà quản lí thị trường cần phải dự báo quy mô của một thị trường hoặc
một sản phẩm. Họ cũng cần phải dự báo phản ứng và hành động của những người đưa
ra những quyết định quan trọng như các nhà cạnh tranh, nhà cung cấp, nhà phân phối,
chính phủ và bản thân họ - đặc biệt là khi đưa ra các vấn đề có tính chiến lược. Thực
hiện như vậy họ có thể dự báo được tỉ trọng thị trường. Kết quả dự báo cho phép họ
tính toán được nhu cầu.
1.2. Các phƣơng pháp dự báo
Trong phần này sẽ trình bày những giới thiệu ngắn gọn về các phương pháp dự báo
và những ứng dụng của chúng. Mô tả chi tiết được viết trong các cuốn sách dự báo
như Wheelwright và Hyndman (1998).
8
Các phương pháp dự báo và mối quan hệ giữa chúng được trình bày ở hình 1, bắt
đầu bằng sự phân biệt quan trọng nhất giữa các phương pháp dựa vào sự phán đoán và
các phương pháp đòi hỏi dữ liệu định lượng.
Hình 1: Cây phân loại các phương pháp dự báo
Cây phân loại này có thể phân loại tất cả các loại phương pháp dự báo có thể thành
nhiều loại và chỉ ra chúng quan hệ với nhau như thế nào. Đường gạch đứt thể hiện sự
liên hệ có thể .
1.2.1. Các phƣơng pháp dự báo dựa vào sự phán đoán (Methods Based on
Judgment)
1.2.1.1. Sự phán đoán không có cơ sở (Unaided judgment)
Thường thì các chuyên gia sẽ trả lời điều gì sẽ xảy ra, đây là một cách tốt để sử
dụng khi mà:
- Các chuyên gia không có sự thiên vị
- Những biến đổi lớn không chắc chắn xảy ra
- Mối quan hệ được hiểu rõ bởi các chuyên gia
- Các chuyên gia có trong tay những thông tin mật
- Các chuyên gia nhận được những phản hồi chính xác và cô đọng về dự
báo của họ.
9
Đáng tiếc là sự phán đoán không có cơ sở thường được sử dụng trong khi các điều
kiện nêu trên không có. Ví dụ, Green và Amstrong thấy rằng việc dự báo của các
chuyên gia lại không tốt bằng dự báo của người dân trong các tình huống xung đột.
Nếu điều này làm bạn ngạc nhiên thì bạn nên nghĩ rằng các chương trình tin tức sự
kiện mà các nhà sản xuất tạo ra lại có thể tập hợp được những chuyên gia có khả năng,
họ đưa ra dự báo một cách tin cậy về một tình huống sẽ xảy ra như thế nào.
1.2.1.2. Thị trường dự báo (Prediction markets)
Các thị trường dự báo cũng được xem là các công ty dự báo, thị trường thông tin và
các thị trường dự báo tương lai có lịch sử lâu đời. Giữa thời kì chấm dứt cuộc nội
chiến của nước Mỹ và Chiến tranh thế giới II, thì các các công ty dự báo có tổ chức tốt
về bầu cử tổng thống đã được chọn lọc một cách kỹ lưỡng trong mọi trường hợp trừ
năm 1916, và họ cũng thành công trong việc dự báo các cuộc bầu cử này. Gần đây,
trong bốn cuộc bầu cử tổng thống trước năm 2004 thì Iowa Electronic Market đã thành
công trong việc dự báo được người thắng cử chức tổng thống. Trong tuần diễn ra cuộc
bầu cử, các thị trường này đã dự báo số phiếu của các ứng cử viên hai Đảng Dân chủ
và Cộng hoà với mức sai số là 1,5 %.
Mặc dù đã có nhiều nỗ lực kể từ năm 1930 nhưng vẫn chưa có phương pháp nào
được đưa ra để kiểm soát các thị trường khi dự báo giá cả. Tuy nhiên thì có rất ít nguời
tin vào điều này khi họ phải trả tiền để được tư vấn đầu tư.
Một vài tổ chức thương mại đã cung cấp thị trường Internet và phần mềm đã cho
phép người tham gia cá cược thông qua các hợp đồng thương maị. Các nhà tư vấn
cũng có thể lập các thị trường cá cược trong các nhà máy để dự đoán các vấn đề như:
Doanh số bán hàng của một sản phẩm mới. Một vài nghiên cứu chưa được công bố gợi
ý là họ có thể đưa ra được những dự báo về doanh số bán hàng một cách chính xác
trong các công ty.
1.2.1.3. Kỹ thuật Delphi (Delphi)
Kỹ thuật Delphi được phát triển tại tập đoàn Rand vào những năm 1950 nhằm thu
hút được các chuyên gia giỏi đồng thời không phải tổ chức các hội nghị nhóm như
trước đó (nếu tổ chức hội nghị thì sẽ tốn thời gian và tiền của).
Để dự báo bằng kỹ thuật Delphi thì nhà quản lí cần tuyển khoảng từ 5 đến 20
chuyên gia phù hợp và tập hợp những dự báo và lập luận từ họ. Sau đó nhà quản lí sẽ
cung cấp các số liệu dự báo tóm tắt nặc danh và lập luận dự báo của các chuyên gia.
Quá trình này được lặp đi lặp lại cho đến khi có sự thay đổi nhỏ về dự báo giữa các
lần- thường thì hai hoặc ba lần là đủ. Dự báo Delphi là mô hình dự báo cuối cùng của
các chuyên gia (có thể truy cập trang Web: forcastingpriciples.com. để biết thêm Phần
mềm hướng dẫn mô hình này).
10
1.2.1.4. Các phương pháp loại suy có cấu trúc (Structured analogies)
Các kết quả của các tình huống giống nhau từ phương pháp loại suy trước đây có
thể giúp các chuyên gia dự báo kết quả của một tình huống (mục tiêu) mới, ví dụ như
sự ra đời của các sản phẩm mới ở thị trường Mỹ có thể cung cấp những kết quả phân
tích về sự ra đời tiếp theo của các sản phầm đó ở các thị trường khác.
Mọi người thường sử dụng các phương pháp loại suy để dự báo, tuy nhiên thì họ lại
không làm như vậy trong một phương pháp có cấu trúc. Ví dụ họ có thể nghiên cứu
một phương pháp phân tích phù hợp với lập luận của mình hoặc họ có thể dừng việc
nghiên cứu khi đã xác định được phương pháp phân tích dự báo phù hợp. Phương
pháp phân tích có cấu trúc sử dụng quá trình cân đối để khắc phục việc sử dụng thông
tin từ các tình huống tương tự một cách không hiệu quả và thiên vị (sai lệch).
Để sử dụng phương pháp phân tích có cấu trúc thì nhà quản lí cần chuẩn bị một sự
mô tả về tình huống mục tiêu và lựa chọn các chuyên gia có kiến thức về các tình
huống tương tự, ưu tiên những người có kinh nghiệm trực tiếp. Các chuyên gia xác
định và mô tả các tình huống đó, đánh giá sự tương đồng của chúng với tình huống
mục tiêu và phù hợp các kết quả phân tích của họ với các kết quả tiềm năng trong tình
huống, mục tiêu. Sau đó nhà quản lí sẽ đưa ra dự báo dựa trên thông tin mà các chuyên
gia cung cấp.
Có rất ít nghiên cứu về dự báo có sử dụng phương pháp loại suy, tuy nhiên thì các
kết quả đạt được lại rất khả quan. Green và Arstrong phát hiện ra rằng các phương
pháp loại suy thì có kết quả chính xác hơn sự phán đoán không có cơ sở trong việc đưa
ra 8 kết quả dự báo trái ngược nhau. (Có thể truy cấp trang web conflictforcasting.com
để biết thêm thông tin chi tiết về các phương pháp loại suy).
1.2.1.5. Lý thuyết trò chơi (Game theory)
Lý thuyết trò chơi đã được giới thiệu trong nhiều cuốn sách và tài liệu nghiên cứu.
Nó là một biện pháp để đạt được kết quả dự báo chuẩn hơn trong các tình huống có
liên quan đến các cuộc đàm phán hoặc các cuộc xung đột khác. Có khoảng 147.300 địa
chỉ tìm kiếm “game theory” và “forcasting” hoặc “prediction” trên Google. Mặc dù đã
có nhiều nỗ lực nghiên cứu nhưng vẫn không có nghiên cứu nào kiểm tra được khả
năng dự báo của lý thuyết trò chơi một cách trực tiếp. Tuy nhiên thì Green (2002 và
2005) đã kiểm tra khả năng của các học giả viết thuyết trò chơi, những học giả này đã
sử dụng lý thuyết trò chơi để dự báo 8 tình huống thực tế. Trong nghiên cứu đó thì họ
đã không chính xác hơn các sinh viên đại học.
1.2.1.6. Sự phân tích mang tính phán đoán (Judgmental Decomposition)
11
Ý tưởng chính đằng sau phương pháp phân tích mang tính phán đoán này là nhằm
phân chia vấn đề dự báo thành nhiều phần nhỏ để việc dự báo được dễ dàng hơn. Sau
đó sẽ sử dụng các phương pháp phù hợp cho mỗi phần và cuối cùng thì các phần nhỏ
đó sẽ được kết hợp lại để đưa ra dự báo tổng hợp.
Phương pháp này nhằm phân chia vấn đề thành nhiều vấn đề nhỏ để dự báo. Ví dụ
để dự báo doanh số bán hàng cho một thương hiệu, chúng ta có thể dự báo lưu lượng
bán hàng công nghiệp, tỉ phần thị trường, và giá bán trên một đơn vị sản phẩm. Sau đó
tổng hợp lại vấn đề bằng cách nhân các phần nhỏ lại với nhau. Các nghiên cứu thực
tiễn chỉ ra rằng, nhìn chung thì các dự báo bằng phương pháp phân tích thì chính xác
hơn so với phương pháp dự báo tổng thể.
1.2.1.7. Phương pháp “bootstrapping”
Biến đổi sự phán đoán chủ quan thành các quy định có cấu trúc. Các chuyên gia
được hỏi về việc họ sử dụng thông tin nào để đưa ra dự báo về một loạt các tình
huống, sau đó yêu cầu họ dự báo cho nhiều trường hợp có thể đó là các trường hợp
thực tế hoặc mang tính giả thuyết. Ví dụ, các chuyên gia có thể dự báo doanh số bán
hàng của một sản phẩm mới. Thông tin có được sẽ được chuyển vào một mô hình
bằng cách tính một phương trình hồi quy liên quan đến dự báo thông tin dựa trên sự
phán đoán được sử dụng bởi các nhà dự báo.
Phương pháp dự báo này được sử dụng chủ yếu cho việc sự báo những vấn đề
phức tạp lặp lại nhiều lần, trong đó thông tin về biến số của vấn đề đó lại không có sẵn
(ví dụ nhu cầu sử dụng một thiết bị viễn thông mới) hoặc không đủ thông tin cho việc
dự báo một mô hình toán kinh tế.
Một khi phương pháp “bootstrapping” sẽ cung cấp cho thị trường một thiết bị dự
báo với chi phí thấp. Amstrong (2001) cho biết phương pháp “bootstrapping” thì dự
báo chính xác hơn phương pháp phán đoán không có cơ sở (so sánh 8 tình huống trong
11 tình huống) với hai bài kiểm tra không cho thấy sự khác nhau, sự giảm sai số là
khoảng 6%.
Phương pháp “bootstrapping” cho phép các chuyên gia thấy được họ phải xử lí các
yếu tố khác nhau như thế nào. Điều này có thể nâng cao được phương pháp dự báo
bằng phán đoán. Ví dụ như việc tuyển nhân sự, “bootstrapping” có thể cho biết một
vài yếu tố như chiều cao, cân nặng hoặc diện mạo thậm chí là người đó không thích
hợp cho công việc đó. “Bootstrapping” còn cho phép dự báo những ảnh hưởng của sự
thay đổi trong một vài biến số quan trọng khi mà các thông tin trước đó không đủ để
dự báo.
1.2.1.8. Hệ chuyên gia (Expert systems)
12
Cũng giống như tên của nó ám chỉ, hệ thống chuyên gia là sự miêu tả các quy luật
mà các chuyên gia sử dụng để dự báo hay chuẩn đoán. Ví dụ, “nếu thu nhập của hộ
gia đình ở nông thôn thấp, thì sẽ không thể cung cấp những nhãn hiệu hiếm có”. Dự
đoán nằm tiềm ẩn trong mệnh đề điều kiện trên: Các nhãn hiệu hiếm ở đây có thể
không được chấp nhận ở địa điểm đó. Các nguyên tắc thường được tạo ra từ các hiệp
ước do đó các nhà dự báo sẽ nói về những gì họ đang làm trong khi dự đoán. Ở đó các
dự đoán mang tính thử nghiệm về các mối quan hệ xuất phát từ sự phân tích có tổ chức
như các nghiên cứu toán kinh tế thì lại có giá trị, hệ chuyên gia nên sử dụng các thông
tin đó. Quan điểm chuyên môn, sự phân tích liên kết, và “Bootstrapping” cũng có thể
giúp ích trong việc phát triển các hệ thống chuyên gia này.
Các hệ thống chuyên gia tham gia vào việc xác định các quy luật dự báo được sử
dụng bởi các chuyên gia và các quy luật rút ra từ việc nghiên cứu thử nghiệm. Hệ
thống này nên tập trung vào sự đơn giản và tính trọn vẹn trong hệ thống kết quả và hệ
thống này nên giải thích dự báo cho người sử dụng.
Việc phát triển một hệ chuyên gia thì rất tốn kém vì vậy mà phương pháp này chỉ
thích hợp ở những nơi có nhiều sự dự báo tương tự. Hệ chuyên gia có thể được phát
triển tốt ở những nơi có đủ điều kiện cơ sở vật chất.
Collopy, Amstrong và Adya (2001) cho rằng việc dự báo bằng hệ chuyên gia thì
chính xác hơn các phương phán đoán không có cơ sở. Tuy nhiên, kết luận này chỉ dựa
trên một số lượng nhỏ các nghiên cứu.
1.2.1.9. Sự tác động qua lại mang tính mô phỏng (Simulated interaction)
Sự tác động qua lại giữ một vai trò quan trọng trong việc dự báo các quyết định
bởi người mà đang tác động đến người khác. Đặc biệt nó rất có ích khi tình huống là
sự xung đột. Ví dụ, một người có thể muốn dự báo là làm thế nào để đảm bảo việc
phân phối độc quyền với một nhà cung cấp lớn.
Để sử dụng được phương pháp này thì một nhà quản lí cần phải chuẩn bị một sự
mô tả về một tình huống mục tiêu, mô tả vai trò của người giữ vai chính và cung cấp
một danh sách quyết định có thể. Những người đó sẽ đọc tình huống này, sau đó họ có
thể sáng tác các mối quan hệ thực tế với người khác cho đến khi họ đi đến một quyết
định: Ví dụ để kí một hợp đồng phân phối độc quyền thử một năm thì các quyết định
của người giữ vai trò sẽ được sử dụng để dự báo.
Sử dụng 8 tình huống xung đột, Green (2005) thấy rằng các dự báo bằng phương
pháp này thì chính xác hơn kết quả từ phương pháp phán đoán không có sơ sở. Phương
pháp này có thể giúp duy trì tính bí mật (thông tin chi tiết trên trang web
conflictforcasting.com).
1.2.1.10. Khảo sát mục đích và mong muốn (Intentions and expectations surveys)
13
Trong các cuộc khảo sát mục đích, người dân sẽ được hỏi về làm thế nào để họ có
thể ứng xử được trong các tình huống cụ thể, theo một cách tương tự, khảo sát mong
muốn hỏi họ muốn cư xử như thế nào trong các tình huống đó. Mong muốn thì khác
với mục đích do con người thấy rằng xảy ra những thứ không có mục đích. Ví dụ, nếu
bạn được hỏi là liệu bạn có ý định đi khám nha sĩ hay không trong sáu tháng tới, bạn
có thể trả lời là không. Tuy nhiên thì bạn nhận thấy rằng một vấn đề có thể phát sinh
khi mà bạn đi khám, vì thế mà mong muốn của bạn sẽ có xác suất lớn hơn không. Sự
phân biệt này do Juster (1996) thí nghiệm và công bố. Bằng chứng và tầm quan trọng
của nó do Morwit (2001) tóm tắt.
Mong muốn và mục đích có thể đạt được bằng cách sử dụng thước đo xác suất.
Thước đo nên có sự mô tả như 0 = “không có cơ hội hoặc hầu như không có cơ hội (1
trong 100)” đến 10 = “chắc chắn hay gần như chắc chắn (99 trong 100)”.
Để dự báo nhu cầu, thực hiện một cuộc khảo sát các khách hàng tiềm năng, nhà
quản lí nên chuẩn bị một sự mô tả toàn diện và chính xác về một sản phẩm và các điều
kiện bán hàng. Nhà quản lý nên chọn ra một mẫu đại diện cho khách hàng tiềm năng
và đưa ra các câu hỏi để biết được sự mong muốn của họ. Nên đánh giá xu hướng trả
lời nếu có thể và điều chỉnh thông tin hợp lí theo xu hướng đó. Phản ứng của khách
hàng được dự báo bằng việc tập hợp các thông tin nhận được từ khảo sát.
Các phương pháp hữu ích đã được phát triển trong việc lựa chọn ví dụ tiêu biểu,
để đạt được tỉ lệ phản hồi cao, bồi thường cho những thông tin không được phản hồi,
và giảm lỗi phản hồi. Dilliam (2000) đã tư vấn để thiết kế các cuộc khảo sát. Lỗi phản
hồi (nơi mà thông tin phản hồi không được thông báo một cách chính xác) có thể là
yếu tố lớn nhất trong tổng số lỗi về các vấn đề thị trường.
Sự mong đợi có tác dụng trong nhiều vụ kiện mà ở đó người bị đơn trước đó đã tự
thoả mãn hành vi của mình, ví dụ, như thăm một công viên. Các điều kiện khác phù
hợp với cuộc khảo sát mong muốn là: Đạt được sự phản hồi, hành vi quan trọng đối
với bị đơn, hành vi đã được vạch kế hoạch, kế hoạch được thông báo một cách chính
xác, bị đơn có thể hoàn thành kế hoạch, kế hoạch không thay đổi.
Các cuộc khảo sát mục đích và mong muốn đặc biệt hữu ích khi mà thông tin về
nhu cầu không có nhiều ví dụ như việc dự báo một sản phẩm mới.
Một loại khảo sát phổ biến là tập trung vào nhóm người, phương pháp này đã vi
phạm năm nguyên tắc quan trọng và vì vậy những nguyên tắc này không nên được sử
dụng trong việc dự báo. Đầu tiên là nhóm người không phải là đại diện quyền lợi của
một cộng đồng. Thứ hai là phản hồi của mỗi người tham gia bị ảnh hưởng bởi quan
điểm của cả nhóm. Thứ ba là nhóm chỉ là một ví dụ nhỏ; các ví dụ, mẫu cho việc khảo
sát mục đích và mong muốn thường được thực hiện với số lượng hàng trăm người, trái
lại nhóm người chỉ bao gồm từ sáu đến mười người. Thứ tư là câu hỏi cho người tham
gia thường không được chuẩn bị kỹ. Thứ năm là việc tổng hợp sự phản hồi của nhóm
thì mang tính thành kiến vì vậy mà không có bằng chứng chỉ ra là nhóm người có thể
mang lại dự báo có ích.
14
1.2.1.11. Sự phân tích kết hợp (Conjoint analysis)
Bằng việc khảo sát ý kiến của khách hàng về một mẫu sản phẩm mới theo một
cách có tổ chức thì chúng ta có thể suy ra được những yếu tố nào sẽ làm ảnh hưởng
đến nhu cầu. Khách hàng tiềm năng có thể được tặng một tập hợp khoảng 20 món quà,
ví dụ, các yếu tố của một thiết bị kĩ thuật số cá nhân như giá cả, trọng lượng, pin, sự
trong của màn hình và bộ nhớ có thể thay đổi một cách đáng kể và như vậy thì chúng
không tương quan với nhau. Vì vậy khách hàng tiềm năng phải đánh đổi giữa các yếu
tố đó bằng cách chọn một yếu tố trong mỗi cặp mà họ sẽ mua nó trên thị trường.
Thông tin kết quả có thể được phân tích bằng việc hồi quy sự lựa chọn của khách hàng
đối với các yếu tố của sản phẩm. Phương pháp này giống với phương pháp
“bootstrapping”, được gọi là phân tích kết hợp bởi vì khách hàng xem xét, đánh giá
các yếu tố của một sản phẩm cùng nhau.
Nhìn chung tính chính xác của phương pháp phân tích kết hợp có thể làm tăng tính
hiện thực của sự lựa chọn mà khách hàng đưa ra. Phương pháp này dựa trên các
nguyên tắc hợp lý như sử dụng mẫu thiết kế thực nghiệm và đạt được mục đích từ
khách hàng tiềm năng. Tuy nhiên vẫn chưa có sự so sánh giữa dự báo bằng phương
pháp phân tích kết hợp với các phương pháp dự báo logic khác.
1.2.2. Các phƣơng pháp yêu cầu thông tin định lƣợng
1.2.2.1. Phép ngoại suy (Extrapolation)
Phương pháp phép ngoại suy sử dụng thông tin dữ liệu trước đó về những gì mà
một người muốn dự báo, phương pháp cân bằng số mũ là một trong những phương
pháp hiệu quả và phổ biến nhất trong phương pháp ngoại suy thống kê. Để sử dụng
phương pháp này cho việc ngoại suy thì nhà quản lí cần phải làm sạch dữ liệu và chọn
ra các yếu tố đã được làm trơn (smoothing) hợp lý. Sau đó Nhà quản lí sẽ tính toán
mức độ trung bình và xu hướng từ dữ liệu và sử dụng chúng cho việc dự báo.
Ngoại suy thống kê là phương pháp hiệu quả nhất trong kiểm kê. Nó cho phép các
doanh nghiệp có thể sử dụng dữ liệu thông tin theo quý, hàng tháng, hay theo ngày.
1.2.2.2. Phân tích định lượng (Quantitative analogies)
Các chuyên gia có thể xác định được các tình huống giống với một tình huống đã
cho. Các tình huống này có thể được sử dụng để ngoại suy ra kết quả của một tình
huống mục tiêu. Ví dụ, để đánh giá thua lỗ trong bán hàng khi mà việc bảo vệ bản
quyền cho một sản phẩm thuốc đã bị xoá bỏ, vì vậy một người có thể kiểm tra mẫu sản
phẩm thuốc tương tự.
15
Để dự báo bằng phương pháp này đòi hỏi các chuyên gia xác định được tình
huống giống với tình huống mục tiêu và nếu dữ liệu cung cấp thông tin về tương lai
của tình huống mục tiêu. Ví dụ như doanh số vé trên đầu người cho một vở kịch lưu
diễn ở nhiều thành phố được dự báo bằng tính trung bình. Nếu không thì xây dựng một
mô hình sử dụng thông tin tình huống mục tiêu và một mô hình khác sử dụng thông tin
tương tự. Kết hợp véctơ của hai mô hình lại và dự báo bằng một mô hình kết hợp.
Trong khi Duncan chứng minh là sự chính xác có thể được cải thiện bằng cách sử
dụng dữ liệu từ một loạt các thời điểm giống nhau thì chúng ta lại không thấy có bằng
chứng nào về tính chính xác tương đối của phương pháp phân tích định lượng.
1.2.2.3. Dự báo dựa trên quy luật (Rule-based forecasting-RBF)
RBF là một loại hệ chuyên gia cho phép tập hợp kiến thức của các nhà quản lí về
một lĩnh vực nào đó theo một phương pháp có logic và không tốn kém.
Để ứng dụng RBF, đầu tiên chúng ta phải xác định được những nét đặc trưng của
các giai đoạn sử dụng phân tích thống kê, kiểm tra và yếu tố nhân quả. Sau đó chúng
sẽ được sử dụng để điều chỉnh thông tin dữ liệu. Dự báo bằng RBF là sự tổng hợp của
các mô hình dự báo ngắn và dài.
Phương pháp dự báo RBF sẽ đạt hiệu quả nhất khi mà đáp ứng đủ các điều kiện sau
đây: Có đủ kiến thức trong lĩnh vực này, các mô hình, phương hướng, không gian
rộng. Dưới các điều kiện như vậy thì kết quả dự báo của phương pháp này sẽ chính
xác hơn các phương pháp dự báo tổng hợp. Trong trường hợp mà không đáp ứng được
các điều kiện trên thì tính chính xác của nó vẫn không bị ảnh hưởng. (Thông tin về dự
báo dựa trên quy luật có tại trang web: forcastingprinciples.com)
1.2.2.4. Mạng Nơron (Neural nets)
Mạng Nơron là phương pháp dựa trên máy tính mà sử dụng các quá trình đưa ra
quyết định giống như bộ não của con người. Giống như bộ não của con người, chúng
có khả năng học và cập nhật các thông số của mình. Tuy nhiên thì phương pháp này
cần có nhiều thông tin dữ liệu để dự báo và giảm nguy cơ chứa quá nhiều thông tin dữ
liệu.
Một vài bằng chứng cho thấy mô hình mạng nơron có thể dự báo chính xác hơn bất
kì mô hình dự báo nào. Tuy nhiên thì chúng ta không nên sử dụng phương pháp này
do nó bỏ qua kiến thức có sẵn và do đó kết quả mang lại thì khó hiểu. (Thông tin về
mạng nơron có trên trang Web: forcastingprinciples.com).
1.2.2.5. Sự khai phá thông tin dữ liệu (Data mining)
16
Data mining sử dụng quá trình phân tích thống kê phức tạp để xác định được các
mối quan hệ. Đây là một phương pháp phổ biến. Ví dụ, một nghiên cứu Google vào
tháng 8 năm 2005 sử dụng thuật ngữ “data mining” và tìm được trên 7 triệu trang,
trong khi đó nếu chúng ta sử dụng hai thuật ngữ: ”prediction hoặc forcasting” thì chỉ
tìm dược trên 560.000 trang.
Data mining bỏ qua lí thuyết và kiến thức có sẵn trong việc nghiên cứu các mô
hình. Mặc dù có nhiều tuyên bố tham vọng và những nỗ lực nghiên cứu nhưng chúng
ta vẫn không chứng minh được là các phương pháp khai thác thông tin mang lại lợi ích
cho viêc dự báo. Trong quá trình phân tích và nghiên cứu lại dữ liệu từ các nghiên cứu
trước đây, thì Keogh và Kasetty phát hiện thấy rằng data mining có ích cho việc dự
báo. Điều này là do một vài nghiên cứu trước đã sử dụng một mô hình thích hợp để
đánh giá data mining. (Để biết thêm thông tin về data mining, hãy truy cập trang web:
the-data-mine.com).
1.2.2.6. Mô hình nhân quả (Causal models)
Mô hình nhân quả được xây dựng dựa trên lí thuyết và kiến thức có sẵn. Chuỗi thời
gian và hồi quy mặt cắt ngang (cross-sectional regression) thường được sử dụng để
đánh giá các hệ số hoặc các biến số mô hình. Mô hình này cho phép kiểm tra những
ảnh hưởng hoạt động thị trường như: sự thay đổi giá cả, cũng như các vấn đề quan
trọng của thị trường. Vì vậy mà có thể cung cấp thông tin cho việc hoạch định kế
hoạch đối phó với những bất ngờ.
Để phát triển các mô hình này (causal models) chúng ta cần phải lựa chọn các biến
số nhân quả bằng cách sử dụng lí thuyết và kiến thức có sẵn. Vấn đề quan trọng ở đây
là xác định được các biến số quan trọng, chiều hướng của ảnh hưởng và bất kì sự ràng
buộc nào. Chúng ta nên chọn một mô hình tương đối đơn giản và sử dụng tất cả dữ
liệu có sẵn để dự báo. Thật ngạc nhiên là quá trình phân tích thống kê phức tạp đã
không tạo ra dự báo chính xác hơn. Trên thực tế thì việc dự báo thô kết hợp với sử
dụng dữ liệu mặt cắt ngang thì thường đủ để làm dự báo chính xác (Dawes and
Corrigan 1974; Dana and Dawes 2005)[12].
Các nhà thống kê đã phát triển các bước phân tích phức tạp về việc các mô hình
này phù hợp với dữ liệu lịch sử như thế nào. Tuy nhiên thì các bước phân tích như vậy
thì có ít giá trị cho các nhà dự báo. Các biện pháp phù hợp (như sai số tiêu chuẩn dự
báo của mô hình) có ít mối quan hệ với tính chính xác trong dự báo và vì vậy chúng ta
nên tránh dùng phương pháp này. Thay vì nên sử dụng toàn bộ thông tin để đánh giá
giá trị dự báo của một mô hình. Kết luận này là dựa vào sự tìm kiếm của nhiều những
học viên về dữ liệu chuỗi thời gian (Armstrong, 2001)[12].
Mô hình nhân quả (causal models) sẽ phát huy tác dụng nhất là khi: (1) có các mối
quan hệ nhân quả, (2) biết được phương hướng của mối quan hệ,(3) biết được các mối
quan hệ nhân quả hoặc có thể dự báo được các mối quan hệ đó, (4) những thay đổi lớn
17
có thể xảy ra trong các biến số nhân quả đối với tầm nhìn dự báo, và (5) những thay
đổi trong các biến số nhân quả có thể được dự báo hoặc kiểm soát một cách chính xác,
đặc biệt là sự mong đợi chiều hướng (chi tiết xem trong forcastingprinciples.com).
1.2.2.7. Sự phân đoạn (Segmentation)
Sự phân đoạn là phương pháp phân chia một vấn đề thành nhiều phần nhỏ, sử dụng
dữ liệu cho mỗi phần để dự báo và sau đó kết hợp các phần đó lại. Ví dụ, một công ty
có thể dự báo doanh số bán hàng của sản phẩm đệm len theo từng khu vực khí hậu và
sau đó sẽ dự báo.
Để sử dụng phương pháp phân đoạn, đầu tiên chúng ta phải xác định các biến số
nhân quả quan trọng mà có thể được sử dụng để xác định các phân đoạn và ưu thế của
chúng.Ví dụ, tuổi tác và vị trí đứng gần bãi biển (proximity to a beach) có thể làm ảnh
hưởng đến nhu cầu sử dụng ván lướt, tuy nhiên thì biến số sau nên được ưu tiên hơn;
vì vậy phân đoạn trạng thái gần (proximity) được ưu tiên trước và sau đó là tuổi tác. Ví
dụ, mỗi biến số, điểm cắt được quyết định khi mà mối quan hệ với biến số độc lập
càng mạnh thì mối quan hệ không tuyến tính càng lớn, và dữ liệu càng nhiều thì nên sử
dụng nhiều điểm cắt. Dự báo dân số của mỗi phân đoạn và hành vi của dân số trong
phân đoạn có sử dụng phương pháp tốt nhất mà có sẵn thông tin. Dự báo mật độ dân
số và hành vi được kết hợp cho mỗi phân đoạn và tổng kết dự báo.
Những vị trí là sự tương tác giữa các biến số, ảnh hưởng các biến số đối với nhu
cầu là không tuyến tính và những ảnh hưởng của một vài biến số có thể ảnh hưởng lớn
đối với các biến số khác. Phương pháp phân đoạn có thuận lợi hơn phân tích quy hồi.
Phương pháp phân đoạn có ích nhất khi có một vài thuận tiện từ việc bồi thường sai
số. Điều này có thể xảy ra ở những nơi có phân đoạn độc lập và tương đối quan trọng
và khi có thông tin về mỗi phân đoạn. Phương pháp phân đoạn dựa trên sự lựa chọn
các biến số có sẵn có thể mang lại khả năng cải thiện tính chính xác ở mức rủi ro thấp
nhất.
Trong một vài tình huống thì những thay đổi phân đoạn phụ thuộc vào những thay
đổi của phân đoạn khác. Ví dụ, việc tự do hoá luật cá độ ở một thành phố A có thể làm
giảm doanh số cá độ ở những thành phố B, C và D đã tự do về cá độ. Những cố gắng
trong phân đoạn độc lập được thực hiện dưới sự mô phỏng vi mô, động lực thế giới,
động lực hệ thống. Trong khi đó phương pháp mô phỏng thì hợp lí và các phương
pháp thì phức tạp và do đó có nhiều cơ hội cho xu hướng thiên vị và sai số. Amstrong
cho rằng không có bằng chứng nào cho thấy các phương pháp mô phỏng đem lại dự
báo có giá trị và chúng ta cũng không có lí lẽ nào để thay đổi đánh giá này.
1.3. Lựa chọn phƣơng pháp (Selecting methods)
18
Để sử dụng một phương pháp dự báo mới, ít nhất một người phải biết và am hiểu
về nó, các phương pháp tiếp cận thông tin truyền thống như tham gia một khoá học,
đọc sách và sử dụng các nhà tư vấn thì đang được phổ biến nhiều trên Internet. Các
phương pháp mới nhất có thể được đăng trên các trang web và chúng có thể được tập
hợp trong một phần mềm. Ví dụ, một loạt quy tắc dự báo theo quy luật thì có trên
trang web: forcastingprinciple.com.
1.3.1. Chọn một phƣơng pháp dựa vào dấu hiệu (Choosing a method based on
evidence)
Chọn phương pháp dự báo tốt nhất cho bất kì tình huống nào không phải là một
công việc đơn giản vì đôi khi có một vài phương pháp đều phù hợp. Chúng ta sử dụng
những nghiên cứu thực tiễn và các quan điểm của chuyên gia để phát triển sơ đồ chọn
lựa như trong hình 2.
Hình 2: Cây lựa chọn các phương pháp dự báo
Vấn đề đầu tiên mà nhà phân tích cần giải quyết là thông tin dữ liệu có đủ cho việc
phân tích định lượng hay không, nếu không đủ, thì các bước phán đoán cần được sử
dụng. Một vài trường hợp cần cả hai phương pháp.
Đối với những thủ tục phán đoán thì vấn đề đầu tiên là xem tình huống đó liên
quan đến những thay đổi nhỏ hay lớn. Nếu nhỏ thì không cần phân tích và chúng ta
cần nhận được những phản hồi tốt và chính xác- như số lượng người ăn tối sẽ đến nhà
19
hàng theo thời gian đã định- sự phán đoán không có cơ sở có thể thích hợp. Tuy nhiên
thì nếu sự phản hồi không tốt thì chúng ta cần sử dụng nhiều chuyên gia như là Delphi
và thị trường dự báo. Những nơi nhà phân tích muốn dự báo những ảnh hưởng của các
chính sách khác nhau, anh ta phải quyết định xem việc dự báo từ các chuyên gia hay từ
những người tham gia như khách hàng tiềm năng sẽ là thích hợp nhất. Nếu như không
thích hợp để hỏi khách hàng tiềm năng cho việc dự báo thì phương pháp
“bootstrapping” hoặc phương pháp phân tích sẽ giúp cho việc sử dụng kiến thức của
các chuyên gia một cách hiệu quả. Những nơi không đủ điều kiện cho việc phân tích
tổng hợp thì chúng ta có thể dự báo bằng cách thực hiện các cuộc khảo sát khách hàng
tiềm năng. Đối với các trường hợp mà ở đó có những thay đổi lớn nhưng việc phân
tích chính sách không được yêu cầu thì chúng ta nên xem xét sự mong đợi và các cuộc
khảo sát mục đích.
Nơi nào có thể có những thay đổi lớn và chỉ có một vài quyết định được đưa ra bởi
các nhà cạnh tranh hay nhà cung cấp hay các nhà dự báo thì sự tương tác mô phỏng là
phương pháp tốt nhất. Nếu các chuyên gia có thể nghĩ về một vài tình huống tương tự
thì phương pháp phân tích có cấu trúc có thể cũng đưa ra dự báo có ích.
Nếu chúng ta có nhiều thông tin dữ liệu trong những khoảng thời gian khác nhau
thì nhà phân tích nên quyết định xem có mối quan hệ thực nghiệm nào tồn tại và tầm
quan trọng của nó hay không. Ví dụ, trong hầu hết các tình huống, thì việc có kiến
thức sẵn về sự giao động của giá cả, nếu kiến thức thực nghiệm của các mối quan hệ
có sẵn thì nên sử dụng mô hình nhân quả. Thêm vào đó, chúng ta nên xem xét việc sử
dụng kiến thức cơ bản như kiến thức của nhà quản lí về tình huống đó. Phép ngoại suy
hay mạng nơron có thể có ích trong các tình huống không có những thay đổi lớn.
Đối với các tình huống lặp đi lặp lại nhiều lần mà chúng ta thiếu kiến thức về nhân
quả thì phương pháp ngoại suy là thích hợp. Nếu không có sẵn kiến thức về các mối
quan hệ nhưng có kiến thức cơ bản (ví dụ như nếu một nhà quản lí biết được doanh số
bán hàng sẽ tăng do quảng cáo giảm giá) thì nên sử dụng phương pháp dự báo dựa trên
quy luật.
Trong tình huống mà chúng ta thiếu dữ liệu và kiến thức về các mối quan hệ thì
phương pháp phân tích định lượng là thích hợp. Nếu có kiến thức cơ bản và việc phân
tích cách giải quyết thì nên sử dụng hệ chuyên gia.
Các điều kiện này có thể không rõ ràng. Trong trường hợp đó nên sử dụng hai hoặc
nhiều phương pháp phù hợp sau đó kết hợp kết quả từ các phương pháp đó.
1.3.2. Kết hợp các dự báo (Combining forecasts)
Phương pháp dự báo kết hợp cải thiện tính chính xác và giảm nhiều sai số. Trong
một phân tích khoảng 30 so sánh, Amstrong cho biết sử dụng phương pháp này sẽ
giảm được khoảng 12%. Chúng đặc biệt có ích khi mà các phương pháp khác nhau về
thực tế. Ví dụ Blattberg và Hoch đã cải thiện được dự báo doanh số bán hàng bằng
20
cách lấy trung bình kết quả dự báo phán đoán của các nhà quản lí và dự báo từ phương
pháp định lượng.
Phương pháp thống kê và phán đoán nên được kết hợp. Sự kết hợp sẽ đạt hiệu quả
khi các phán đoán được tập hợp lại theo một cách có hệ thống và sau đó sẽ được sử
dụng làm các yếu tố đầu vào cho mô hình định lượng.
1.4. Sự không chắc chắn (uncertainty)
Về vấn đề cải thiện tính chính xác, thì dự báo còn tập trung vào đánh giá sự không
chắc chắn. Điều này giúp chúng ta quản lí được rủi ro của các kế hoạch thay thế.
Các phương pháp điều chỉnh sai số truyền thống như: The mean square error
(MSE) thì không có được cơ sở tin cậy cho việc so sánh các phương pháp dự báo.
Phương pháp “The median absolute percentage error” (MDAPE) thì thích hợp hơn bởi
vì nó không thay đổi về lượng và không bị ảnh hưởng bởi các yếu tố bên ngoài. Khi so
sánh các phương pháp với nhau, đặc biệt là khi kiểm tra nhiều yếu tố. kiểm soát mức
độ khó trong dự báo, chúng ta sử dụng phương pháp (MDAPE) .
Các nhà thống kê rất tin tưởng vào các bài kiểm tra để đánh giá sự không chắc
chắn. Tuy nhiên thì việc sử dụng ý nghĩa con số trong việc dự báo sự không chắc chắn
là không phù phợp. Phương pháp thống kê thì không có đóng góp quan trọng trong dự
báo thị trường.
Thay vì sử dụng ý nghĩa của các con số thì chúng ta nên tập trung vào khoảng thời
gian tạm ngưng dự báo. Tuy nhiên thì nó không được sử dụng rộng rãi trong thực tế.
Tull cho biết khoảng 25% các công ty được hỏi tin tưởng vào phương pháp này. Còn
Darymple thấy rằng khoảng 48% không sử dụng phương pháp này và chỉ khoảng 10%
là thường sử dụng.
1.4.1. Sự không chắc chắn trong dự báo bằng phán đoán
Trong cuộc thí nghiệm về dự báo kinh tế do 22 chuyên gia kinh tế thực hiện trong
11 năm thì giá trị thực tế mang lại có tính thiếu chắc chắn đến 43%. Điều này xảy ra
khi mà chủ thể được cảnh báo trước. Tuy nhiên thì có một vài quy trình để cải thiện
mức độ phán đoán. Nếu có thể thì sự phán đoán nên được đưa ra đúng lúc và thông tin
không mơ hồ giải thích lí do tại sao đúng và tại sao sai. Khi phản hồi tốt thì sự tin
tưởng trong phán đoán sẽ được đánh giá tốt. Ví dụ, 60% số lần mà các nhà dự báo thời
tiết cho biết là có khoảng 60% trời có thể mưa, và trời đã mưa. Điều đó chứng tỏ các
nhà dự báo thị trường sẽ nghiên cứu để tìm ra tiêu chuẩn phản hồi mà các nhà dự báo
nhận được.
Trong trường hợp ở những khu vực không thể có được sự phản hồi tốt thì yêu cầu
các chuyên gia viết ra tất cả lí do tại sao dự báo của họ có thể sai.
21
Có một cách khác để đánh giá sự không chắc chắn là kiểm tra sự thống nhất giữa
các dự báo phán đoán. Ví dụ, trong một nghiên cứu về dự báo doanh thu quảng cáo
hàng năm của tạp chí Time, Ashton thấy rằng sự thống nhất giữa các dự báo bằng
phán đoán là một sự thay thế tốt cho sự không chắc chắn.
1.4.2. Sự không chắc chắn trong các dự báo bằng phƣơng pháp định lƣợng
Khoảng thời gian tạm ngưng dự báo (tính gián đoạn) trong dự báo bằng phương
pháp định lượng có thể quá ngắn. Một vài nghiên cứu thực nghiệm cho thấy giá trị
phần trăm thực nằm ngoài 95%, khoảng thời gian tạm ngưng dự báo thưc tế chỉ lớn
hơn 5% và đôi lúc lớn hơn 50%. Lí do điều này xảy ra là bởi vì các dự báo bỏ qua các
nguồn không chắc chắn. Ví dụ, tính gián đoạn có thể xảy ra trong quá trình dự báo.
Thêm vào đó, lỗi dự báo ở nhiều thời điểm thì thường không đối xứng, vì thế mà khó
tính toán được tính gián đoạn dự báo. Sự không đối xứng của các lỗi có thể xảy ra khi
phương pháp dự báo sử dụng thêm một xu hướng. Quy trình nhạy cảm nhất là chuyển
dự báo và các giá trị thực để logarit, sau đó tính toán tính gián đoạn dự báo bằng cách
sử dụng sự khác nhau đã được logarit.
Hàm số chi phí cũng có thể không đối xứng. Ví dụ, chi phí cho một dự báo mà quá
thấp bằng 50 đơn vị có thể khác với chi phí quá cao bằng 50 đơn vị. Nhưng đây là vấn
đề của các nhà hoạch định chứ không phải của những nhà dự báo.
1.5. Đạt đƣợc sự chấp nhận của dự báo
Các dự báo mà có nhiều giá trị tiềm năng thì cũng có thể bị từ chối. Một cách để
tránh vấn đề này là đạt được sự đồng ý về quy trình dự báo trước khi đưa ra dự báo.
Có nghĩa là phải điều chỉnh phương pháp dự báo để phát triển dự báo sẽ được sử dụng.
Cách khác là yêu cầu những người đưa ra quyết định quyết định trước xem họ sẽ
đưa ra những quyết định gì cho từng dự báo.
Sự chấp nhận có thể làm tăng giá trị dự báo, nhưng điều này thì khó đạt được trong
nhiều tổ chức.
22
Chƣơng 2
CHUỖI THỜI GIAN VÀ ỨNG DỤNG
2.1. Chuỗi thời gian, các đại lƣợng đặc trƣng
2.1.1. Định nghĩa chuỗi thời gian
Chuỗi dữ liệu phụ thuộc thời gian được chia làm hai loại:
- Chuỗi dữ liệu phụ thuộc thời gian được quan sát, đo đạc trong khoảng thời
gian rời rạc: Các quan sát được thực hiện tại các thời điểm tách biệt, chúng
thường là các quan sát được đo tại các mốc thời gian cách đều nhau, ví dụ
chuỗi thời gian được đo theo tuần, quý, tháng, năm, ….
- Chuỗi dữ liệu liên tục theo thời gian: Các quan sát được đo trong khoảng
thời gian liên tục, ví dụ chuỗi dữ liệu đo nhiệt độ trong ngày (nhiệt kế).
Giới hạn khoá luận này chỉ đề cập đến chuỗi dữ liệu phụ thuộc thời gian được đo
trong khoảng thời gian rời rạc và cách đều nhau, gọi là chuỗi thời gian (series time
data)
Như vậy: Chuỗi thời gian là một tập giá trị các quan sát của biến ngẫu nhiên, ký
hiệu là {z
t
}, t = 1, ,n là số các quan sát, đo được trong các khoảng thời gian t như
nhau (hàng năm, quý, tháng, tuần, ngày…) và được xếp theo thứ tự thời gian.
2.1.2. Dự báo chuỗi thời gian
Là ước lượng các giá trị của biến ngẫu nhiên chuỗi thời gian
)1( z
ht
h
, ký hiệu là
)(
ˆ
hz
t
, dựa trên sự tương quan với các giá trị của biến ngẫu nhiên {z
t
} đã được quan sát
trong quá khứ.
Chất lượng của dự báo phụ thuộc vào nhiều yếu tố, chẳng hạn sự phức tạp của
chuỗi thời gian khi thực hiện phân tích, tác động của nhiều yếu tố bất thường không
thể lường trước được khi tiến hành dự báo, ngoài ra độ chính xác cũng còn phụ thuộc
phần lớn vào khoảng cách xa gần của dự báo (dự báo gần thì cho độ chính xác của dự
báo tốt hơn so với dự báo xa).
2.1.3.Các đại lƣợng đặc trƣng của chuỗi thời gian
Giả sử có chuỗi thời gian {z
t
} gồm n các quan sát, t = 1,2…n.
a. Các đại lượng thống kê đặc trưng cho chuỗi thời gian:
Kỳ vọng: Đại diện cho giá trị trung tâm trong chuỗi.
)z(E
t
23
Vì không thể nghiên cứu được toàn bộ tổng thể mà chỉ nghiên cứu được tập con
các phần tử của tổng thể gọi là mẫu. Lý do là, thu thập thông tin về toàn bộ tổng thể sẽ
quá đắt về thời gian và tiền bạc. Hơn nữa, trong nhiều trường hợp để nghiên cứu toàn
bộ tổng thể ta chỉ nghiên cứu một số phần tử nào đó của tổng thể tức là chỉ nghiên cứu
mẫu thôi, từ đó suy đoán về tổng thể. Các phần tử chọn để nghiên cứu tổng thể được
gọi là mẫu ngẫu nhiên. Nên kỳ vọng của tổng thể được tính dựa trên mẫu các quan sát
gọi là kỳ vọng mẫu, như sau:
n
t
t
z
n
z
1
1
Phƣơng sai: Đại diện cho mức độ phân tán các giá trị trong chuỗi xung quanh kỳ
vọng của nó:
Tương tự, phương sai mẫu được tính:
Độ lệch chuẩn: Là căn bậc hai của phương sai mẫu:
2
zz
ˆˆ
b. Các đại lượng mô tả mối quan hệ giữa các phần tử trong chuỗi
Tự hiệp phƣơng sai: Sử dụng để đo mức độ tương quan tuyến tính của hai biến
ngẫu nhiên trong cùng một chuỗi thời gian. Nó phản ánh sự phụ thuộc hay độc lập
tuyến tính của các biến ngẫu nhiên trong chuỗi.
Tự hiệp phương sai giữa hai biến ngẫu nhiên trong cùng một chuỗi thời gian tại
thời điểm t ký hiệu là z
t
và tại thời điểm t + k ký hiệu là z
t + k
, giữa chúng có k - 1 quan
sát gọi là k độ trễ, được xác định như sau:
)z)(z(Ez,zcov)k(
k ttk ttz
Trong đó,
là kỳ vọng chung của z
t
và z
t + k
.
Tự hiệp phương sai khi độ trễ k = 0 chính là phương sai của z
t
:
2
zttz
z,zcov)0(
.
Tương tự, tự hiệp phương sai mẫu được tính:
)zz)(zz(
n
1
)k(
ˆ
k t
kn
1t
tz
k = 1, 2 n-1
])[()var(
22
tzt
zEz
2
n
1t
t
2
z
)zz(
n
1
ˆ
24
)0(
ˆ
)k(
ˆ
ˆ
z
z
k
Trong đó,
z
là kỳ vọng mẫu của z
t
và z
t + k
.
Hàm tự tƣơng quan (ACF-Auto Correllation Function): Đại lượng mô tả tương
quan tại trễ k giữa các giá trị trong chuỗi thời gian, được xác định:
2
kt
2
t
ktt
zz
z
zz
ktt
k
)z(E)z(E
)z)(z(E
)k(
)z,zcov(
kttktt
Trong đó,
)(k
z
là tự hiệp phương sai,
ktt
zz
,
lần lượt là độ lệch chuẩn của z
t
và
z
t + k
. Thông thường, z
t
và z
t+k
đều có cùng phương sai là
)0(
2
zz
, nên tự tương quan
tại trễ k được tính:
)0(
)k(
z
z
k
Khảo sát tự tương quan như một hàm với tham số biến thiên theo trễ k (k = 1,2…)
gọi là hàm tự tương quan.
Tự tương quan mẫu được tính theo công thức:
Một vài tính chất của tự tương quan mẫu:
- Tính chất 1:
1
ˆ
1
k
- Tính chất 2:
1
ˆ
0
0
k
- Tính chất 3:
kk
ˆˆ
Nếu như z
t
và z
t + k
không tương quan với nhau thì tự tương quan
0
ˆ
k
, do khi đó
cov(z
t
, z
t + k
) = 0. Nhưng điều ngược lại chưa hẳn đã đúng.
Dựa trên mối quan hệ tự tương quan giữa các phần tử trong chuỗi mà có thể xây
dựng được các mô hình dự báo chuỗi thời gian.
Hàm tự tƣơng quan từng phần (PACF-Partial Auto Correllation Function):
Tự tương quan mẫu
k
ˆ
phản ánh mức độ tương quan giữa hai biến ngẫu nhiên z
t
và z
t + k
trong chuỗi thời gian. Tuy nhiên, sự tương quan giữa chúng có thể chịu sự tác
động của các biến khác, trong trường hợp này là k - 1 biến trung gian z
t + 1
, z
t + 2
… ,
z
t + k - 1
ảnh hưởng đến sự tương quan giữa biến z
t
và z
t+k
. Do đó hàm tự tương quan
từng phần được đưa vào nhằm mục đích mô tả mức độ tương quan trực tiếp giữa hai
biến z
t
và z
t + k
(không bị ảnh hưởng ràng buộc bởi mối quan hệ với các biến trung
gian). Công thức tính: