Tải bản đầy đủ (.pdf) (72 trang)

Nghiên cứu một số kỹ thuật ngoại suy và ứng dụng (LV thạc sĩ)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.25 MB, 72 trang )

I

ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

---------------------------------------

NGUYỄN THỊ NGỌC TÚ

NGHIÊN CỨU MỘT SỐ KỸ THUẬT NGOẠI SUY VÀ
ỨNG DỤNG

Chuyên ngành: Khoa học máy tính

Thái Nguyên - 2015

Số hóa bởi Trung tâm Học liệu – ĐHTN




II

LỜI CAM ĐOAN
Tôi xin cam đoan Luận văn " Nghiên cứu một số kỹ thuật ngoại suy và
ứng dụng " đã đƣợc thực hiện theo đúng mục tiêu đề ra dƣới sự hƣớng dẫn
của TS. Nguyễn Văn Huân. Kết quả đạt đƣợc trong luận văn là sản phẩm của
cá nhân tôi. Trong toàn bộ luận văn, những điều đƣợc trình bày là của cá nhân
và đƣợc tổng hợp từ nhiều nguồn tài liệu. Tất cả các tài liệu tham khảo đều có
xuất xứ rõ ràng và đƣợc trích dẫn hợp pháp.
Tôi xin chịu hoàn toàn trách nhiệm và chịu mọi hình thức kỷ luật theo


quy định cho lời cam đoan của mình.
Thái Nguyên, ngày tháng năm 2015
Người cam đoan

Nguyễn Thị Ngọc Tú

Số hóa bởi Trung tâm Học liệu – ĐHTN




III

LỜI CẢM ƠN
Tôi xin bày tỏ lời cảm ơn chân thành tới tập thể các thầy cô giáo Viện
Công nghệ thông tin - Viện Hàn lâm Khoa học và Công nghệ Việt Nam, các
thầy cô giáo trƣờng Đại học Công nghệ thông tin và Truyền thông - Đại học
Thái Nguyên đã tận tình giảng dạy cũng nhƣ tạo mọi điều kiện để tôi học tập
và nghiên cứu trong 2 năm học cao học.
Tôi xin chân thành cảm ơn sâu sắc tới thầy giáo TS. Nguyễn Văn Huân
đã cho tôi nhiều sự chỉ bảo quý báu, đã tận tình hƣớng dẫn và tạo điều kiện
cho tôi hoàn thành tốt luận văn tốt nghiệp này.
Quá trình thực hiện đề tài không tránh khỏi các thiếu sót, tôi rất mong
tiếp tục nhận đƣợc sự đóng góp ý kiến của các thầy giáo, cô giáo, các bạn
đồng nghiệp đối với đề tài nghiên cứu của tôi để đề tài đƣợc hoàn thiện hơn.
Tôi xin chân thành cảm ơn!
Thái Nguyên, ngày tháng năm 201
Người cam đoan

Nguyễn Thị Ngọc Tú


Số hóa bởi Trung tâm Học liệu – ĐHTN




IV

MỤC LỤC

LỜI CAM ĐOAN ..........................................................................................................I
LỜI CẢM ƠN ............................................................................................................. III
DANH MỤC HÌNH VẼ ............................................................................................IV
DANH MỤC BẢNG BIỂU ...................................................................................VIII
MỤC LỤC ...................................................................................................................IV
MỞ ĐẦU........................................................................................................................ 1
Chƣơng 1 GIỚI THIỆU CHUNG VỀ DỮ LIỆU CHUỖI THỜI GIAN ............ 5
1.1. Khái niệm Dữ liệu ............................................................................................ 5
1.1.1. Dữ liệu định tính và dữ liệu định lƣợng .............................................. 5
1.1.2. Dữ liệu sơ cấp và dữ liệu thứ cấp........................................................ 5
1.2. Chuỗi thời gian và Dữ liệu chuỗi thời gian ................................................... 7
1.2.1. Chuỗi thời gian .................................................................................... 7
1.2.2. Dữ liệu chuỗi thời gian...................................................................... 12
1.3. Tổng quan về dự báo ...................................................................................... 16
1.3.1. Đặc điểm của dự báo ......................................................................... 16
1.3.2. Các loại dự báo.................................................................................. 17
1.3.3. Các phƣơng pháp dự báo .................................................................. 21
Chƣơng 2 MỘT SỐ KỸ THUẬT NGOẠI SUY ..................................................22
2.1. Khái niệm ngoại suy ...................................................................................... 22
2.1.1. Khái niệm ngoại suy.......................................................................... 22

2.1.2. Khi nào nên sử dụng phƣơng pháp ngoại suy để dự báo. ................. 22
2.1.3. Ƣu nhƣợc điểm của phƣơng pháp ngoại suy .................................... 23
2.1.4. Tính chính xác của dự báo ................................................................ 23
2.1.5. Ứng dụng của kỹ thuật ngoại suy vào bài toán dự báo ..................... 25
2.2. Ngoại suy dựa dựa vào mô hình hồi quy tuyến tính .................................. 26
2.2.1. Bài toán hồi quy ................................................................................ 26
2.2.2. Các phƣơng pháp đƣa về dạng tuyến tính ......................................... 29
Số hóa bởi Trung tâm Học liệu – ĐHTN




V

2.2.3. Hồi quy nhiều chiều (Hồi quy bội) ................................................... 30
2.3. Ngoại suy bằng phƣơng pháp trung bình động giản đơn (moving average
forecast) ................................................................................................................... 31
2.4. Ngoại suy bằng phƣơng pháp san bằng mũ (Exponential Smoothing
Methods) .................................................................................................................. 33
2.5. Ngoại suy dựa vào mô hình san mũ Holt- Winters. ................................... 36
2.5.1. San mũ Holt....................................................................................... 36
2.5.2. San mũ Holt- Winters ....................................................................... 37
2.6. Ngoại suy dựa vào mô hình ARIMA (AutoRegressive Integrated Moving
Average) .................................................................................................................. 39
2.6.1. Các công cụ áp dụng trong mô hình ................................................. 40
2.6.2. Mô hình AR(p) (Auto Regression) ................................................... 44
2.6.3. Mô hình MA(q) (Moving Average) .................................................. 45
2.6.4. Sai phân I(d) ...................................................................................... 46
2.6.5. Mô hình ARIMA ............................................................................... 47
2.6.6. Các bƣớc phát triển mô hình ARIMA. ............................................. 48

2.7. Các bƣớc tiến hành ngoại suy ....................................................................... 49
Chƣơng 3 ÁP DỤNG KỸ THUẬT NGOẠI SUY VÀO BÀI TOÁN DỰ BÁO .52
3.1. Mô hình ARIMA cho dự báo tài chính, chứng khoán ............................... 52
3.1.1. Dữ liệu tài chính ................................................................................ 52
3.1.2. Mô hình ARIMA cho bài toán dự báo tài chính ............................... 52
3.1.3. Thiết kế mô hình ARIMA cho dữ liệu .............................................. 53
3.2. Áp dụng ........................................................................................................... 55
3.2.1. Môi trƣờng thực nghiệm ................................................................... 55
3.2.2. Dữ liệu ............................................................................................... 55
3.2.3. Kiểm tra tính dừng của chuỗi chứng khoán VNM ........................... 57
3.2.4. Nhận dạng mô hình ........................................................................... 57
3.2.5. Ƣớc lƣợng và kiểm định với mô hình ARIMA ................................ 60
Số hóa bởi Trung tâm Học liệu – ĐHTN




VI

3.2.6 Thực hiện dự báo................................................................................ 62
KẾT LUẬN .................................................................................................................64
TÀI LIỆU THAM KHẢO ........................................................................................65

Số hóa bởi Trung tâm Học liệu – ĐHTN




VII


DANH MỤC HÌNH VẼ
Hình 1.1. Xu hƣớng giảm theo thời gian ........................................................ 13
Hình 1.2. Thành phần mùa .............................................................................. 14
Hình 1.3. Thành phần chu kỳ .......................................................................... 15
Hình 3.1: chọn giadongcua làm mục tiêu dự báo ........................................... 56
Hình 3.2: Xác định d = 0,1,2 ? ........................................................................ 57
Hình 3.3: Biểu đồ của SAC và SPAC của chuỗi giadongcua ........................ 58
Hình 3.4: Biểu đồ của SPAC và SAC ứng với d=1 ........................................ 59
Hình 3.5: Ƣớc lƣợng mô hình ARIMA(2,1,1) ................................................ 60
Hình 3.6: Kết quả mô hình ARIMA(2,1,1) ..................................................... 60
Hình 3.7: Kiểm tra phần dƣ có nhiễu trắng..................................................... 61
Hình 3.8: Dự báo ............................................................................................. 62

Số hóa bởi Trung tâm Học liệu – ĐHTN




VIII

DANH MỤC BẢNG BIỂU
Bảng 3.1: Dữ liệu đầu vào............................................................................... 56
Bảng 3.2: Tiêu chuẩn đánh giá các mô hình ARIMA..................................... 62
Bảng 3.3: Đánh giá dự báo .............................................................................. 63

Số hóa bởi Trung tâm Học liệu – ĐHTN





1
MỞ ĐẦU
Sự phát triển mạnh mẽ của Công nghệ thông tin và Truyền thông đã
kéo theo nhiều lĩnh vực khác phát triển nhƣ khoa học máy tính, đồ họa máy
tính, khí tƣợng thủy văn, tự động hóa, thiết kế - xây dựng, kinh tế, tài chính,
giáo dục và đào tạo, y tế,… Điều này đã góp phần vào sự nghiệp công nghiệp
hóa – hiện đại hóa đất nƣớc. Trong thực tế, đối với mỗi quốc gia, trong đó có
Việt Nam muốn phát triển và trở thành các nƣớc công nghiệp thì một trong
những vấn đề không thể thiếu là phải nghiên cứu, khảo sát, phân tích tình hình
phát triển của đất nƣớc trong lịch sử và hiện tại để làm cơ sở cho việc ngoại
suy hay suy luận, xây dựng các kế hoạch phát triển trong tƣơng lai với tất cả
các lĩnh vực, ngành nghề,…
Vì ngoại suy hay suy luận là một khoa học và nghệ thuật tiên đoán
những sự việc sẽ xảy ra trong tƣơng lai, trên cơ sở phân tích khoa học về các
dữ liệu đã thu thập đƣợc. Khi tiến hành ngoại suy cần căn cứ vào việc thu thập,
xử lý số liệu trong quá khứ và hiện tại để xác định xu hƣớng vận động của các
hiện tƣợng trong tƣơng lai nhờ vào một số mô hình toán học (Định lƣợng). Tuy
nhiên, ngoại suy cũng có thể là một ngoại suy chủ quan hoặc trực giác về tƣơng
lai (Định tính) và để ngoại suy định tính đƣợc chính xác hơn, ngƣời ta cố loại
trừ những tính chủ quan của đối tƣợng ngoại suy.
Ngoại suy trƣớc hết là một thuộc tính không thể thiếu của tƣ duy của con
ngƣời, con ngƣời luôn luôn nghĩ đến ngày mai, hƣớng về tƣơng lai. Trong thời
đại công nghệ thông tin và toàn cầu hóa, ngoại suy lại đóng vai trò quan trọng
hơn khi nhu cầu về thông tin thị trƣờng, tình hình phát triển tại thời điểm nào
đó trong tƣơng lai càng cao. Ngoại suy đƣợc sử dụng trong nhiều lĩnh vực khác
nhau, mỗi lĩnh vực có một yêu cầu về ngoại suy riêng nên phƣơng pháp ngoại
suy đƣợc sử dụng cũng khác nhau.
Trong ngoại suy, các đại lƣợng khảo sát thƣờng không đƣợc cho dƣới
dạng hàm liên tục. Trong khi đó, các phƣơng pháp giải tích toán học thƣờng
Số hóa bởi Trung tâm Học liệu – ĐHTN





2
tính toán với các hàm cho bởi các công thức, do đó chúng ta không thể áp dụng
trực tiếp các hàm cho dƣới dạng rời rạc nhƣ thế này. Cũng có khi ta biết rằng
đại lƣợng y là một hàm của đại lƣợng x , tức là y = f (x ), nhƣng ta không biết
biểu thức hàm f (x )mà chỉ biết một số giá trị y i ứng với các giá trị của x tại các
điểm x i .
Thông thƣờng x 0 < x 1 < x 2 < ... < x n và các điểm này có thể phân bố
cách đều hoặc không cách đều nhau. Mặc dù ta chỉ biết giá trị của y tại các
điểm mốc x i nhƣng trong nhiều trƣờng hợp ta cần tính toán với các giá trị y
tại các vị trí khác của x . Một vấn đề đƣợc đặt ra là cho một điểm x không
thuộc các điểm x i thì làm thế nào ta có thể tính đƣợc giá trị y tƣơng ứng với
nó, sao cho chúng ta tận dụng tối đa các thông tin đã có. Nếu giả định giá trị
cần tìm gần đúng của y tại các điểm x nằm trong khoảng

éx , x ù thì chúng ta
êë 0 n ú
û

áp dụng các bài toán nội suy.
Nhƣng trong thực tế, các bài toán không phải lúc nào các điểm x cũng
nằm trong khoảng éêëx 0, x n ù
ú
û, chẳng hạn nhƣ một số các bài toán về ngoại suy:
(1). Trong tƣơng lai các tình huống sẽ tiếp tục diễn ra nhƣ đã xảy ra trong quá
khứ; (2). Đối tƣợng ngoại suy quá bi quan hoặc ngƣợc lại quá lạc quan về tình
huống cần ngoại suy khi đó kết quả ngoại suy có thể bị ảnh hƣởng sai lệch;

(3). Đối tƣợng ngoại suy không biết nhiều lắm về tình huống ngoại suy. Khi
đó chúng ta cần giả định rằng diễn biến trong tƣơng lai cũng sẽ tƣơng tự nhƣ
trong quá khứ. Với các bài toán trên thì x chắc chắn sẽ nằm ngoài khoảng
éx , x ù, và nhƣ vậy thì để tìm giá trị gần đúng của y , chúng ta không thể áp
êë 0 n ú
û

dụng đƣợc phƣơng pháp nội suy [1].
Nhằm tìm ra giá trị gần đúng của y , một trong những phƣơng pháp
đƣợc sử dụng phổ biến hiện này là áp dụng phƣơng pháp ngoại suy.
Số hóa bởi Trung tâm Học liệu – ĐHTN




3
Ngoại suy (Extrapolation) là dựa trên những số liệu đã có về một đối
tƣợng đƣợc quan tâm để đƣa ra suy đoán về hành vi của đối tƣợng đó trong
tƣơng lai. Ngoại suy có 2 dạng chính là ngoại suy theo số liệu lát cắt và ngoại
suy theo chuỗi số liệu lịch sử. [12]
Ngoại suy theo số liệu lát cắt (Extrapolation for cross-sectional data) là
dựa trên hành vi của một số thành phần tại một thời điểm nào đó để ngoại suy
về hành vi của các thành phần khác cũng tại thời điểm đó.
Ngoại suy theo chuỗi số liệu (Time-series extrapolation) là dựa trên
chuỗi số liệu lịch sử và sử dụng mô hình toán học để đƣa ra kết quả ngoại suy
đối với biến quan tâm. Giả thiết cơ bản là hành vi của biến đƣợc ngoại suy sẽ
tiếp tục trong tƣơng lai nhƣ đã diễn ra trong quá khứ.
Xuất phát từ vai trò của bài toán ngoại suy trong thực tế, đề tài luận văn
đƣợc lựa chọn “Nghiên cứu một số kỹ thuật ngoại suy và ứng dụng”. Trên cơ
sở nghiên cứu một số kỹ thuật ngoại suy, ý nghĩa và tính chất ứng dụng của

chúng và đề xuất việc áp dụng kỹ thuật ngoại suy vào bài toán trong tƣơng lai
cho một số bài toán cụ thể.
Nội dung chính của luận văn đƣợc trình bày trong 3 chƣơng:
Chương 1: Giới thiệu chung về dữ liệu chuỗi thời gian.
Chương 2: Một số kỹ thuật ngoại suy.
Chương 3: Áp dụng kỹ thuật ngoại suy vào bài toán dự báo.
Luận văn này đƣợc hoàn thành dƣới sự hƣớng dẫn tận tình của TS
Nguyễn Văn Huân, tác giả xin bày tỏ lòng biết ơn chân thành của mình đối
với thầy. Tuy nhiên vì điều kiện thời gian và khả năng có hạn nên luận văn
không thể tránh khỏi những thiếu sót. Tác giả rất mong các thầy giáo và bạn
đóng góp ý kiến để đề tài đƣợc hoàn thiện hơn.

Số hóa bởi Trung tâm Học liệu – ĐHTN




5
Chƣơng 1
GIỚI THIỆU CHUNG VỀ DỮ LIỆU CHUỖI THỜI GIAN
1.1. Khái niệm Dữ liệu
1.1.1. Dữ liệu định tính và dữ liệu định lượng
a) Dữ liệu định tính:
Nghiên cứu định tính điển hình là liên quan đến phỏng vấn mặt đối mặt
với ngƣời trả lời để hiểu rõ hơn những suy nghĩ và cảm giác của họ.
Có 2 loại nghiên cứu định tính phổ biến là thảo luận bàn tròn và phỏng
vấn cá nhân.
b) Dữ liệu định lượng
Nghiên cứu định lƣợng liên quan đến các qui trình có tính hệ thống cao
hơn nhằm có đƣợc và phân tích các dữ liệu dƣới dạng các con số.

1.1.2. Dữ liệu sơ cấp và dữ liệu thứ cấp
a) Dữ liệu sơ cấp
Là những dữ liệu mà nhà nghiên cứu thu thập trực tiếp tại nguồn dữ
liệu và xử lý nó để phục vụ cho việc nghiên cứu đặt ra. Hay nói cách khác, dữ
liệu sơ cấp là dữ liệu do chính ngƣời nghiên cứu thu thập.
b) Dữ liệu thứ cấp
Dữ liệu thứ cấp là dữ liệu do ngƣời khác thu thập, sử dụng cho các mục
đích có thể là khác với mục đích nghiên cứu của chúng ta. Dữ liệu thứ cấp có
thể là dữ liệu chƣa xử lý (còn gọi là dữ liệu thô) hoặc dữ liệu đã xử lý. Nhƣ
vậy, dữ liệu thứ cấp không phải do ngƣời nghiên cứu trực tiếp thu thập.
Có nhiều nhà nghiên cứu, sinh viên đánh giá thấp nguồn dữ liệu thứ cấp có
sẵn. Vì vậy chúng ta bắt đầu xem xét sự hợp lý của nguồn dữ liệu thứ cấp đối
với vấn đề nghiên cứu của chúng ta trƣớc khi tiến hành thu thập dữ liệu của
chính mình. Các cuộc điều tra về dân số, nhà ở, điều tra doanh nghiệp, điều
tra mức sống dân cƣ, điều tra kinh tế xã hội gia đình (đa mục tiêu)... do chính
phủ yêu cầu là những nguồn dữ liệu rất quan trọng cho các nghiên cứu kinh tế
xã hội.
Số hóa bởi Trung tâm Học liệu – ĐHTN




6
Ngoài ra một số nguồn dữ liệu dƣới đây có thể là quan trọng cho các
nghiên cứu của chúng ta bao gồm:


Các báo cáo của chính phủ, bộ ngành, số liệu của các cơ quan thống

kê về tình hình kinh tế xã hội, ngân sách quốc gia, xuất nhập khẩu, đầu tƣ

nƣớc ngoài, dữ liệu của các công ty về báo cáo kết quả tình hình hoạt động
kinh doanh, nghiên cứu thị trƣờng...


Các báo cáo nghiên cứu của cơ quan, viện, trƣờng đại học.



Các bài viết đăng trên báo hoặc các tạp chí khoa học chuyên ngành

và tạp chí mang tính hàn lâm có liên quan.


Tài liệu giáo trình hoặc các xuất bản khoa học liên quan đến vấn đề

nghiên cứu.


Cuối cùng nhƣng không kém phần quan trọng là các bài báo cáo hay

luận văn của các sinh viên khác (khóa trƣớc) trong trƣờng hoặc ở các trƣờng khác.
Dữ liệu thứ cấp có ƣu điểm là giúp tiết kiệm tiền bạc, thời gian.
Nhƣng cần chú ý đến nhƣợc điểm trong sử dụng là:


Số liệu thứ cấp này đã đƣợc thu thập cho các nghiên cứu với các mục

đích khác và có thể hoàn toàn không hợp với vấn đề của chúng ta; khó phân
loại dữ liệu; các biến số, đơn vị đo lƣờng có thể khác nhau...



Dữ liệu thứ cấp thƣờng đã qua xử lý nên khó đánh giá đƣợc mức độ

chính xác, mức độ tin cậy của nguồn dữ liệu.
Vì vậy trách nhiệm của ngƣời nghiên cứu là phải đảm bảo tính chính
xác của dữ liệu, phải kiểm tra xem các kết quả nghiên cứu của ngƣời khác là
dựa vào dữ liệu thứ cấp hay sơ cấp. Vì vậy điều quan trọng là phải kiểm tra
dữ liệu gốc.

Số hóa bởi Trung tâm Học liệu – ĐHTN




7
1.2. Chuỗi thời gian và Dữ liệu chuỗi thời gian
1.2.1. Chuỗi thời gian
1.2.1.1. Khái niệm chuỗi thời gian.
Khái niệm chuỗi thời gian: Chuỗi các quan sát đƣợc thu thập trên
cùng một đối tƣợng tại các mốc thời gian cách đều nhau đƣợc gọi là chuỗi
thời gian. Các quan sát này có thể đo đƣợc một cách liên tục theo thời gian
hoặc là có thể đƣợc lấy theo một tập rời rạc các thời điểm khác nhau.
Một

chuỗi

thời

gian




một

dãy

các

giá

trị

quan

sát

X := {x 1, x 2,..., x n }đƣợc xếp thứ tự diễn biến thời gian với x 1 là các giá trị

quan sát tại thời điểm đầu tiên, x 2 là quan sát tại thời điểm thứ hai và x n là
quan sát tại thời điểm thứ n .
Ví dụ: Các báo cáo tài chính mà ta thấy hằng ngày trên báo chí, tivi hay
Internet về các chỉ số chứng khoán, tỷ giá tiền tệ, chỉ số tăng cƣờng hay chỉ số
tiêu dùng đều là những thể hiện rất thực tế của chuỗi thời gian.
Bƣớc đầu tiên của việc phân tích chuỗi thời gian là chọn một mô hình
toán học phù hợp với tập dữ liệu cho trƣớc X := {x 1, x 2,..., x n } nào đó. Để có
thể nói về bản chất của những quan sát chƣa diễn ra, ta giả thiết mỗi quan sát
x n là một giá trị thể hiện của biến ngẫu nhiên X t với t Î T . Ở đây T đƣợc

gọi là tập chỉ số. Khi đó ta có thể coi tập dữ liệu X := {x 1, x 2,..., x n }là thể
hiện của quá trình ngẫu nhiên {X t , t Î T }. Và vì vậy, ta có thể định nghĩa

một quá trình ngẫu nhiên nhƣ sau:
Định nghĩa 1.1 (Quá trình ngẫu nhiên)
Một quá trình ngẫu nhiên là một họ các biến ngẫu nhiên {X t , t Î T }
đƣợc định nghĩa trên một không gian xác suất (W, A, P ).

Số hóa bởi Trung tâm Học liệu – ĐHTN




8
Chú ý:
Trong việc phân tích chuỗi thời gian, tập chỉ số T là một tập các thời
điểm, ví dụ nhƣ là tập {1, 2,...}hay tập (- ¥ , + ¥ ). Tất nhiên cũng có những
quá trình ngẫu nhiên có T không phải là một tập con của R nhƣng trong giới
hạn của luận văn này ta chỉ xét cho trƣờng hợp T Î R . Và thƣờng thì ta xem
T là các tập các số nguyên, khi đó ta sẽ sử dụng ký hiệu tập chỉ số là Z thay

vì T ở trên. Một điểm chú ý nữa là trong luận văn này chúng ta sẽ dùng thuật
ngữ chuỗi thời gian để đồng thời chỉ dữ liệu cũng nhƣ quá trình có dữ liệu đó
là một thể hiện.
Trong các dạng dữ liệu đƣợc phân tích thì dữ liệu chuỗi thời gian luôn
thuộc tốp đầu về tính phổ biến
1.2.1.2. Quá trình ngẫu nhiên dừng
Định nghĩa 1.2 (Hàm tự hiệp phƣơng sai)
Giả sử {X t , t Î Z }là một quá trình ngẫu nhiên có V ar (X t ) < ¥ với
mỗi t Î Z . Khi đó hàm tự hiệp phương sai của X t được định nghĩa theo
công thức sau:
gx (r , s ) := cov(X r , X s ) = E [(X r - E X r )(X s - EX s )], với r , s Î Z .


Định nghĩa 1.3 (Quá trình dừng)
Chuỗi thời gian {X t , t Î Z } được gọi là dừng nếu nó thoả mãn 3 điều
kiện sau:
2

- E Xt < ¥ , " t Î Z
- EX t = m , " t Î Z
- gx (r , s ) = gx (r + t , s + t ), " t , r , s Î Z

Số hóa bởi Trung tâm Học liệu – ĐHTN




9
Định lý 1.1
Nếu {X t , t Î Z }là một quá trình dừng, và nếu như at Î R , i Î Z thoả
¥

mãn điều kiện

å

i= - ¥

¥

ai < ¥ thì hệ thức Y t :=

å


i= - ¥

ai X t -i, t Î Z sẽ định nghĩa

một quá dừng.
Chú ý: Cũng có tài liệu gọi “dừng” theo nghĩa trên là dừng yếu, dừng
theo nghĩa rộng hay dừng bậc hai. Tuy nhiên trong giới hạn luận văn chỉ xem
xét tính dừng theo định nghĩa ở trên.
Khi chuỗi thời gian {X t , t Î Z }là dừng thì
yx = (r , s ) º gx (r - s, 0), " r , s Î Z ,

Và vì vậy, với một quá trình dừng thì có thể định nghĩa lại hàm tự hiệp
phƣơng sai bằng cách chỉ thông qua hàm một biến. Khi đó, với quá trình dừng

{X , t Î Z }ta có:
t

yx (h ) º gx (h, 0) = Cov(X t + h , X t ), " t , h Î Z

Hàm số y x (.) = đƣợc gọi là hàm tự hiệp phƣơng sai của X t , còn
gx (h )là giá trị của nó tại “trễ” h . Đối với một quá trình dừng thì ta thƣờng ký

hiệu hàm tự hiệp phƣơng sai bởi g ()
. thay vì g x ()
. .
Với một quá trình dừng thì hàm hiệp phƣơng sai có các tính chất
g (0) ³ 0 , g (h ) £ g (0), " h Î Z

Và nó còn là một hàm chẵn nghĩa là:

g (h ) = g (- h ), " h Î Z

1.2.1.3. Hàm tự tương quan
Định nghĩa 1.4
Hàm tự tương quan của quá trình ngẫu nhiên {X t , t Î Z } được định
nghĩa tại trễ h như sau:
Số hóa bởi Trung tâm Học liệu – ĐHTN




10
r (h ) := g(h ) / g(0) = Corr (X t + h , X t ), " t , h Î Z

Chú ý:
Trong thực tế, ta chỉ quan sát đƣợc một thể hiện hữu hạn
X := {x t , t = 1, 2,..., n } của một chuỗi thời gian dừng nên về nguyên tắc ta

không thể biết chính xác đƣợc các hàm tự hiệp phƣơng sai của chuỗi thời gian
đó, muốn ƣớc lƣợng nó ta đƣa vào khái niệm hàm tự hiệp phƣơng sai mẫu của
thể hiện X .
Hàm tự hiệp phƣơng sai mẫu của một thể hiện X đƣợc định nghĩa bởi
công thức:
n- h
c(h ) := n - 1n - 1 å (x j - x )(x j + h - x ), 0 £ h < n
j= 1
n

Và c(h ) := c(- h ), n < h £ 0, trong đó x = n


- 1

å

x j là trung bình mẫu.

j=1

Khi đó thì hàm tƣơng tự tƣơng quan mẫu cũng định nghĩa thông qua
hàm tự hiệp phƣơng sai mẫu nhƣ sau:
r (h ) := c(h ) / c(0), h < n .

1.2.1.4. Tính chất của chuỗi thời gian
Các tính chất đặc trƣng của chuỗi thời gian là: Tính dừng và tính
mùa vụ.
Dù một chuỗi thời gian có thể biểu hiện một hoặc nhiều tính chất
nhƣng khi trình bày, phân tích và dự báo giá trị của chuỗi thời gian thì mỗi
tính chất đƣợc xử lý tách rời.
a) Tính dừng
Một dãy số liệu theo thời gian có giá trị trung bình và phƣơng sai không
đổi theo thời gian thì dãy số đƣợc xem nhƣ có tính dừng hay còn gọi là ổn định.
Trong trƣờng hợp ngƣợc lại, ta nói dãy số liệu đó không có tính dừng.

Số hóa bởi Trung tâm Học liệu – ĐHTN




11
Xét dãy số Y t , về mặt toán học, một dãy số liệu có tính dừng phải thỏa

mãn các điều kiện sau:
E (Y t ) = V ar (Y t ) = C ovar (Y t ,Y t - k )

Trung bình: E (Y t ) = Const
Phƣơng sai: V ar (Y t ) = Const
Đồng phƣơng sai: Covar (Y t ,Y t - k ) = gk
Chuỗi Y t đƣợc gọi là không dừng nếu vi phạm điều kiện trên.
Nếu chuỗi Y t không dừng, ta có thể lấy sai phân bậc 1. Khi đó chuỗi sai
phân bậc 1 ( Wt ) sẽ có thể dừng. Sai phân bậc 1: Wt = Y t - Y t - 1
Nếu chuỗi sai phân bậc 1 ( Wt ) không dừng, ta có thể lấy sai phân bậc
2. Khi đó chuỗi sai phân bậc 2 có thể dừng. Sai phân bậc 2: V t = Wt - Wt - 1 .
Chuỗi dừng có xu hƣớng trở về giá trị trung bình và những dao động
quanh giá trị trung bình sẽ là nhƣ nhau. Nói cách khác, một chuỗi thời gian
không dừng sẽ có giá trị trung bình thay đổi theo thời gian, hoặc giá trị
phƣơng sai thay đổi theo thời gian hoặc cả hai.
b) Tính mùa vụ
Nếu sai phân bậc 2 mà chƣa dừng, có thể chuỗi Y t có yếu tố mùa vụ.
(Nếu có yếu tố mùa vụ, tức là chuỗi vẫn chƣa dừng).
Nếu cứ sau m thời đoạn, SAC lại có giá trị cao. Khi đó Y t có tính mùa
vụ với chu kỳ m thời đoạn. Phƣơng pháp đơn giản nhất để khử tính mùa vụ là
lấy sai phân thứ m
Zt = Y t - Y t- m

Số hóa bởi Trung tâm Học liệu – ĐHTN




12
1.2.2. Dữ liệu chuỗi thời gian.

1.2.2.1. Khái niệm Dữ liệu chuỗi thời gian.
Mặt lƣợng của hiện tƣợng thƣờng xuyên biến động qua thời gian.
Trong thống kê để nghiên cứu sự biến động này ta thƣờng dựa vào dữ liệu
chuỗi thời gian.
Dữ liệu chuỗi thời gian là dãy số các trị số của chỉ tiêu thống kê đƣợc
sắp xếp theo thứ tự thời gian.
Dữ liệu chuỗi thời gian còn đƣợc phân biệt theo tần suất xuất hiện: số
liệu theo năm, số liệu theo quý, số liệu theo tháng…
Ví dụ:
- Số lƣợng hàng bán đƣợc trong 12 tháng của một công ty.
- Các gía trị của chuỗi thời gian của đại lƣợng X đƣợc ký hiệu
X 1, X 2,...X t ,...X n , với X t là gía trị quan sát của X ở thời điểm t .

Dữ liệu chuỗi thời gian có hai thành phần:
- Thời gian: có thể là ngày, tuần, tháng, quí, năm,.... Độ dài giữa hai
thời gian liền nhau đƣợc gọi là khoảng cách thời gian.
- Chỉ tiêu về hiện tƣợng nghiên cứu: chỉ tiêu này có thể là số tuyệt đối,
số tƣơng đối, số bình quân. Trị số của chỉ tiêu còn gọi là mức độ của dãy số.
* Phân loại dãy số thời gian:
Căn cứ vào tính chất thời gian của dữ liệu, có thể phân biệt thành 2 loại:
1. Dữ liệu thời kỳ: là dãy số biểu hiện mặt lƣợng của hiện tƣợng qua
từng thời kỳ nhất định.
2. Dữ liệu thời điểm: là loại dãy số biểu hiện mặt lƣợng của hiện tƣợng
qua các thời điểm nhất định. Dãy số này còn đƣợc phân biệt thành 2 loại:
- Dữ liệu thời điểm có khoảng cách thời gian đều nhau.
1.2.2.2. Các thành phần của dữ liệu chuỗi thời gian
Các nhà thống kê thƣờng chia chuỗi theo thời gian thành 4 thành phần:
- Thành phần xu hƣớng dài hạn (long –term trend component)

Số hóa bởi Trung tâm Học liệu – ĐHTN





13
- Thành phần mùa (seasional component)
- Thành phần chu kỳ (cyclical component)
- Thành phần bất thƣờng (irregular component)
a) Thành phần xu hướng dài hạn
Xu hƣớng dài hạn thể hiện sự tăng trƣởng hoặc giảm sút của một biến
số theo thời gian với khoảng thời gian đủ dài. Một số biến số kinh tế có xu
hƣớng tăng giảm dài hạn nhƣ
- Tốc độ tăng dân số của Việt Nam có xu hƣớng giảm.
- Tỷ trọng nông nghiệp trong GDP của Việt Nam có xu hƣớng giảm.
- Mức giá có xu hƣớng tăng.
Thành phần xu hƣớng dài hạn dùng để chỉ xu hƣớng tăng hay giảm của
đại lƣợng X trong thời gian dài. Về mặt đồ thị thành phần này có thể biểu diễn
bởi một đƣờng thẳng hay một đƣờng cong trơn.

Hình 1.1. Xu hướng giảm theo thời gian
 Đƣợc sử dụng khi:
- Tăng năng suất hay công nghệ mới làm thay đổi lối sống
- Dân số tăng làm tăng nhu cầu hàng hóa/dịch vụ
- Các biến bị ảnh hƣởng bởi lạm phát nhƣ lƣơng, chi phí sản xuất, sinh hoạt
- Mức độ chấp nhận của thị trƣờng gia tăng
 Phƣơng pháp áp dụng: Phƣơng pháp trung bình trƣợt, san mũ (Holt),
hồi quy đơn, đƣờng tăng trƣởng, mô hình mũ.
Số hóa bởi Trung tâm Học liệu – ĐHTN





14
b) Thành phần mùa
Biến động thời vụ của biến số kinh tế là sự thay đổi lặp đi lặp lại từ
năm này sang năm khác theo mùa vụ. Biến động thời vụ xảy ra do khí hậu,
ngày lễ, phong tục tập quán…Biến động thời vụ có tính ngắn hạn với chu kỳ
lặp lại thƣờng là 1 năm.
Thành phần mùa dùng để chỉ xu hƣớng tăng hay giảm của đại lƣợng X
tính theo mùa trong năm (có thể tính theo tháng trong năm)
Ví dụ:
- Lƣợng tiêu thụ chất đốt sẽ tăng vào mùa đông và giảm vào mùa hè,
ngƣợc lại, lƣợng tiêu thụ xăng sẽ tăng vào mùa hè và giảm vào mùa đông.
- Lƣợng tiêu thụ đồ dùng học tập sẽ tăng vào mùa khai trƣờng

Hình 1.2. Thành phần mùa
 Đƣợc sử dụng khi:
- Thời tiết ảnh hƣởng đến biến đang xem xét
- Niên lịch ảnh hƣởng đến biến đang xem xét
 Gồm có phƣơng pháp phân tích, san mũ Winter, hồi quy bội…
c) Thành phần chu kỳ (cyclical component)
Các số liệu kinh tế thƣờng có sự tăng giảm có quy luật theo chu kỳ kinh
tế. Sau một thời kỳ suy thoái kinh tế sẽ là thời kỳ phục hồi và bùng nổ kinh tế,
Số hóa bởi Trung tâm Học liệu – ĐHTN




15
kế tiếp tăng trƣởng kinh tế sẽ chựng lại và khỏi đầu cho một cuộc suy thoái

mới. Tuỳ theo nền kinh tế mà chu kỳ kinh tế có thời hạn là 5 năm, 7 năm hay
10 năm.
Thành phần chu kỳ chỉ thay đổi của đại lƣợng X theo chu kỳ. Sự khác
biệt của thành phần này so với thành phần mùa là chu kỳ của nó dài hơn một
năm. Để đánh gía thành phần chu kỳ các gía trị của chuỗi tuần tự theo thời
gian sẽ đƣợc quan sát hằng năm
Ví dụ:
Lƣợng dòng chảy đến hồ chứa Trị An từ năm 1959 đến 1985

Hình 1.3. Thành phần chu kỳ
 Đƣợc sử dụng khi:
- Chu kỳ kinh doanh ảnh hƣởng đến biến đang xem xét
- Chuyển biến trong sở thích chung nhƣ thời trang, âm nhạc, ..
- Chuyển biến trong dân số nhƣ đói, thiên tai
- Chuyển dịch trong chu kỳ vòng đời sản phẩm
 Phƣơng pháp áp dụng: Phƣơng pháp phân tích, chỉ số kinh tế, mô
hình kinh tế lƣợng, hồi quy bội.
d) Thành phần bất thường (irregular component)
Thành phần này dùng để chỉ những sự thay đổi bất thƣờng của các gía trị
trong chuỗi tuần tự theo thời gian. Sự thay đổi này không thể dự đoán bằng các số
liệu kinh nghiệm trong qúa khứ, về mặt bản chất này không có tính chu kỳ.
Số hóa bởi Trung tâm Học liệu – ĐHTN




16
1.3. Tổng quan về dự báo
Khái niệm dự báo đã tồn tại từ rất lâu trong đời sống xã hội. tuy nhiên
trong buổi đầu nó còn mang nặng tính thần bí, vô căn cứ. chỉ sau này khi mà

các môn khoa học tự nhiên phát triển thì dự báo mới thực sự đƣợc coi trọng
và những hoạt động dự báo diễn ra trên một cơ sơ khoa học vững chắc. Dự
báo vì thế ngày nay trở thành một trong những hoạt động không thể thiếu
trong hoạt động của các công ty thƣơng mại, các tổ chức xã hội. Tuy vậy thì
cho tới ngày nay hầu hết các cơ sở dữ liệu cũng nhƣ các hệ thống thông
tin quản lý đều chƣa đáp ứng đƣợc nhu cầu này. Cho dù những cấu trúc dữ
liệu đã đựợc tạo dựng một cách hết sức tinh vi, mạnh mẽ.
Khi tiến hành dự báo, ta căn cứ vào việc thu thập, xử lý số liệu trong
quá khứ và hiện tại để xác định xu hƣớng vận động của các hiện tƣợng trong
tƣơng lai nhờ vào một số mô hình toán học.
Dự báo có thể là một dự đoán chủ quan hoặc trực giác về tƣơng lai.
Nhƣng để cho dự báo đƣợc chính xác hơn, ngƣời ta cố loại trừ những tính chủ
quan của ngƣời dự báo.
Ngày nay, dự báo là một nhu cầu không thể thiếu đƣợc của mọi hoạt
động kinh tế - xác hội, khoa học - kỹ thuật, đƣợc tất cả các ngành khoa học
quan tâm nghiên cứu.
1.3.1. Đặc điểm của dự báo
- Dùng để dự báo các mức độ tƣơng lai của hiện tƣợng, qua đó giúp các
nhà quản trị doanh nghiệp chủ động trong việc đề ra các kế hoạch và các
quyết định cần thiết phục vụ cho quá trình sản xuất kinh doanh, đầu tƣ, quảng
bá, quy mô sản xuất, kênh phân phối sản phẩm, nguồn cung cấp tài chính…
và chuẩn bị đầy đủ điều kiện cơ sở vật chất, kỹ thuật cho sự phát triển trong
thời gian tới (kế hoạch cung cấp các yếu tố đầu vào nhƣ: lao động, nguyên vật
liệu, tƣ liệu lao động… cũng nhƣ các yếu tố đầu ra dƣới dạng sản phẩm vật
chất và dịch vụ).

Số hóa bởi Trung tâm Học liệu – ĐHTN





17
- Trong các doanh nghiệp, nếu công tác dự báo đƣợc thực hiện một cách
nghiêm túc còn tạo điều kiện nâng cao khả năng cạnh tranh trên thị trƣờng.
- Dự báo chính xác sẽ giảm bớt mức độ rủi ro cho doanh nghiệp nói
riêng và toàn bộ nền kinh tế nói chung.
- Dự báo chính xác là căn cứ để các nhà hoạch định hoạch định các
chính sách phát triển kinh tế, văn hoá, xã hội trong toàn bộ nền kinh tế
quốc dân.
- Nhờ có dự báo, các chính sách kinh tế, các kế hoạch và chƣơng trình
phát triển kinh tế đƣợc xây dựng có cơ sở khoa học và mang lại hiệu quả kinh
tế cao.
- Nhờ có dự báo thƣờng xuyên và kịp thời, các nhà quản trị doanh
nghiệp có khả năng kịp thời đƣa ra những biện pháp điều chỉnh các hoạt
động kinh tế của đơn vị mình nhằm thu đƣợc hiệu quả sản xuất kinh doanh
cao nhất.
1.3.2. Các loại dự báo
1.3.2.1. Căn cứ vào độ dài thời gian dự báo
Căn cứ vào độ dài thời gian dự báo có thể phân thành ba loại:
- Dự báo dài hạn: Là những dự báo có thời gian dự báo từ 5 năm trở
lên. Thƣờng dùng để dự báo những mục tiêu, chiến lƣợc về kinh tế chính trị,
khoa học - kỹ thuật trong thời gian dài ở tầm vĩ mô.
- Dự báo trung hạn: Là những dự báo có thời gian dự báo từ 3 đến 5
năm. Thƣờng phục vụ cho việc xây dựng những kế hoạch trung hạn về kinh
tế, văn hoá, xã hội… ở tầm vi mô và vĩ mô.
- Dự báo ngắn hạn: Là những dự báo có thời gian dự báo dƣới 3 năm,
loại dự báo này thƣờng dùng để dự báo hoặc lập các kế hoạch kinh tế, văn
hoá, xã hội chủ yếu ở tầm vi mô và vĩ mô trong khoảng thời gian ngắn nhằm
phục vụ cho công tác chỉ đạo kịp thời.
Cách phân loại này chỉ mang tính tƣơng đối tuỳ thuộc vào từng loại

hiện tƣợng để quy định khoảng cách thời gian cho phù hợp với loại hiện
Số hóa bởi Trung tâm Học liệu – ĐHTN




18
tƣợng đó. Ví dụ trong dự báo kinh tế, dự báo dài hạn là những dự báo có tầm
dự báo trên 5 năm, nhƣng trong dự báo thời tiết, khí tƣợng học chỉ là một
tuần. Thang thời gian đối với dự báo kinh tế dài hơn nhiều so với thang thời
gian dự báo thời tiết. Vì vậy, thang thời gian có thể đo bằng những đơn vị
thích hợp (Ví dụ: quý, năm đối với dự báo kinh tế và ngày đối với dự báo dự
báo thời tiết).
1.3.2.2. Dựa vào các phương pháp dự báo
Dự báo có thể chia thành ba nhóm:
- Dự báo bằng phƣơng pháp chuyên gia: Loại dự báo này đƣợc tiến
hành trên cơ sở tổng hợp, xử lý ý kiến của các chuyên gia thông thạo với hiện
tƣợng đƣợc nghiên cứu, từ đó có phƣơng pháp xử lý thích hợp để ra các dự
đoán, các dự đoán này đƣợc cân nhắc và đánh giá chủ quan từ các chuyên gia.
Phƣơng pháp này có ƣu thế trong trƣờng hợp dự đoán những hiện tƣợng hay
quá trình bao quát rộng, phức tạp, chịu sự chi phối của khoa học - kỹ thuật, sự
thay đổi của môi trƣờng, thời tiết, chiến tranh trong khoảng thời gian dài. Một
cải tiến của phƣơng pháp Delphi là phƣơng pháp dự báo dựa trên cơ sở sử
dụng một tập hợp những đánh giá của một nhóm chuyên gia. Mỗi chuyên gia
đƣợc hỏi ý kiến và rồi dự báo của họ đƣợc trình bày dƣới dạng thống kê tóm
tắt. Việc trình bày những ý kiến này đƣợc thực hiện một cách gián tiếp (không
có sự tiếp xúc trực tiếp) để tránh những sự tƣơng tác trong nhóm nhỏ qua đó
tạo nên những sai lệch nhất định trong kết quả dự báo. Sau đó, ngƣời ta yêu
cầu các chuyên gia duyệt xét lại những dự báo của họ trên cơ sở tóm tắt tất cả
các dự báo, có thể có những bổ sung thêm.

- Dự báo theo phƣơng trình hồi quy: Theo phƣơng pháp này, mức độ
cần dự báo phải đƣợc xây dựng trên cơ sở xây dựng mô hình hồi quy, mô
hình này đƣợc xây dựng phù hợp với đặc điểm và xu thế phát triển của hiện
tƣợng nghiên cứu. Để xây dựng mô hình hồi quy, đòi hỏi phải có tài liệu về
hiện tƣợng cần dự báo và các hiện tƣợng có liên quan. Loại dự báo này
thƣờng đƣợc sử dụng để dự báo trung hạn và dài hạn ở tầm vĩ mô.
Số hóa bởi Trung tâm Học liệu – ĐHTN




×