Tải bản đầy đủ (.pdf) (49 trang)

Nghiên cứu ứng dụng chuỗi thời gian trong việc dự báo kinh doanh xăng dầu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.28 MB, 49 trang )

www.themegallery.com
Họ và tên : Trần Văn Tâm Em.
Sinh viên Khoa CNTT – Trường ĐH lạc Hồng
Ngày tháng năm sinh : 06/09/1972
Cơ quan đang làm việc : Tín Nghĩa Corp.
Email :
Thông tin cá nhân
www.themegallery.com
Tên đề tài:
Nghiên cứu ứng dụng chuổi thời
gian trong việc dự báo kinh
doanh xăng dầu.
Tên đề tài
www.themegallery.com
Dựa vào dữ liệu theo chuổi thời gian - time series và
xây dựng mô hình ước lượng dữ liệu, dự báo giá trị
tương lai và áp dụng cho bài toán dự báo sản lượng
tiêu thụ xăng dầu. Trong luận văn tập trung sử dụng
chuỗi thời gian trong quá khứ, dùng mô hình ARIMA
của Box – Jenkins với phương pháp hồi quy AR
(AutoRegressive) và Mô hình trung bình trượt
(Moving Average), Áp dụng hàm tự tương quan -
ACF (AutoCorrelation Function) và hàm tự tương
quan riêng phần - PACF (Patial AutoCorrelation
Function) để giải quyết bài toán mô phỏng việc dự
báo sản lương tiêu thụ xăng dầu trong tương lai.
Mục tiêu đề tài
www.themegallery.com
Chương 1: Tổng Quan.
1
Chương 2: Cơ sở lý thuyết.


2
Chương 3: Ước lương tham số,
kiểm định giả thiết và dự báo
3
Chương 4: Hiện thực dữ liệu trên R
4
Nội dung
Chương 5: Kết luận.
5
Chương 6: Tài liệu tham khảo,
bảng biểu.
6
www.themegallery.com
1. Tổng Quan
1.1 Giới thiệu về lịch sử quá trình dự báo
1.2 Đặc điểm của dự báo
1.3 Các loại dự báo
1.3.1. Căn cứ vào độ dài thời gian dự báo
1.3.2. Dựa vào các phương pháp dự báo:
1.3.3. Căn cứ vào đối tượng dự báo
1.4 Các nghiên cứu liên quan & Lý do chọn đề tài.
1.5 Mục tiêu của luận văn.
www.themegallery.com
2. Cơ sở lý thuyết.
2.1 Dãy số thời gian.
2.2 Tương quan (Correlation ) và hàm tự tương quan
ACF (AutoCorrelation Function).
2.2.1 Tương quan (Correlation )
2.2.2 hàm tự tương quan ACF (AutoCorrelation Function).
2.3 Hàm tự tương quan riêng phần PACF (Partial

AutoCorrelation Function)
2.4 Nhận dạng các mô hình
2.4.1 Mô hình tự hồi qui bậc p (Auto Regression) -
AR(P)
2.4.2 Mô hình trung bình trượt bậc q (Moving
Average) - MA(q)
2.4.3 Mô hình ARMA(p,q)
2.4.4 Các bước thực hiện của phương pháp Box - Jenkins
www.themegallery.com
Dãy số thời gian là dãy số các trị số của chỉ tiêu thống
kê được sắp xếp theo thứ tự thời gian. Mỗi dãy số thời
gian có hai thành phần:
1. Thời gian: có thể là ngày, tuần, tháng, quí, năm, . .
Độ dài giữa hai thời gian liền nhau được gọi là
khoảng cách thời gian.
2. Chỉ tiêu về hiện tượng nghiên cứu: chỉ tiêu này
có thể là số tuyệt đối, số tương đối, số bình quân.
Trị số của chỉ tiêu còn gọi là mức độ của dãy số.
2.1 Dãy số thời gian
www.themegallery.com
Phân loại dãy số thời gian:
1. Dãy số thời kỳ: là dãy số biểu hiện mặt lượng của hiện tượng qua
từng thời kỳ nhất định. Muốn tính mức độ bình quân: ta cộng các
mức độ trong dãy số rồi chia cho số các mức độ, tức là:
Trong đó:
y
i
(i = 1,…, n): các mức độ của dãy số thời kỳ
n: số mức độ của dãy số
2. Dãy số thời điểm: là loại dãy số biểu hiện mặt lượng của hiện

tượng qua các thời điểm nhất định. Dãy số có khoảng cách thời
gian bằng nhau thì mức độ trung bình được tính như sau:


Trong đó:
yi (i=1,2, . . . ,n) là các mức độ của dãy số thời điểm.
n: số m
ức độ của dãy số.
2.1 Dãy số thời gian (tt)
www.themegallery.com
Sản lượng / Năm 2002 2003 2004 2005 2006
Sản lượng bán ra (triệu lít) 19 54 81 90 95
1
123 1

n
ni
y
yyy y
y
nn
=
++++
==

Vd:
Y = (19 +54+81+90+95)/5
Dãy số thời kỳ:
www.themegallery.com
Đối với dãy số thời điểm: Dãy số có khoảng cách thời gian bằng nhau

Sản lượng / Năm 2002 2003 2004 2005 2006
Sản lượng bán ra (triệu lít) 19 54 81 90 95
* Yi (i = 1,…, n): các mức độ của dãy số thời điểm
* n: số mức độ của dãy số
Vd:
Y = (19/2 +54+81+90+95/2)/(5-1)
y= (y
1
/2 + y
2
+ y
3
+ … + y
n-1
+ y
n
/ 2) / (n -1)
www.themegallery.com
Đối với dãy số thời điểm: Dãy số có khoảng cách thời gian Không bằng
nhau
11 2 2 3 3 1
123
1


n
ii
nn i
n
n

i
i
yt
yt yt yt yt
y
ttt t
t
=
=
++++
==
++++


Trong đó:
* yi (i=1,2,3, . . ., n): các mức độ của dãy số thời điểm.
* ti (i=1,2, . . . , n): độ dài của các khoảng cách thời gian.
www.themegallery.com
Vd: Đối với dãy số thời điểm: Sản lượng bán ra quí 1 năm 2010 như sau:
Ngày (thời điểm) 1-1 20-1 15-2 10-3
Sản lượng (ngàn lít) 400 600 500 700
y
t
t
i
(số ngày) y
i
t
i
400 19 (1.1 đến 19.1) 7600

600 26 (20.1 đến 14.2) 15600
500 23 (15.2 đến 9.3) 11500
700 22 (10.3 đến 31.3) 15400
Cộng 90 ngày 50100
Y = 556.66
www.themegallery.com
2.2 Tương quan (Correlation) và Hàm tự tương quan
ACF(AutoCorrelation Function)
Hệ số tương quan của hai đại lượng ngẫu nhiên X và Y, ký hiệu là r
XY
là số
được xác định như sau:
với S
X,
S
Y
là độ lệch tiêu chuẩn của X, Y.
Ý nghĩa của hệ số tương quan:
Hê số tương quan đo mức độ phụ thuộc tuyến tính giữa X và Y.
Khi r
XY
càng gần 1 thì mối quan hệ tuyến tính càng chặt, khi r
XY
càng
gần 0 thì quan hệ tuyến tính càng lỏng lẻo.
Ước lượng hệ số tương quan:
2.2.1 Tương quan (Correlation)
www.themegallery.com
Ước lượng hệ số tương quan:
•Lập mẫu ngẫu nhiên W

XY
= [(X
1
,Y
1
), (X
2
,Y
2
), …,(Xn,Yn)].
•Để ước lượng hệ số tương quan .
Ta sử dụng thống kê
2.2 Tương quan (Correlation) và Hàm tự tương quan
ACF(AutoCorrelation Function)
2.2.1 Tương quan – Correlation (tt)
YX
XY
SS
YEXEXYE
r
.
)().()(

=
YX
SS
YXXY
R
.
.−

=
Trong đó:
www.themegallery.com
Ước lượng hệ số tương quan:
Với mẫu cụ thể ta tính được ta tính được giá trị của R là
2.2 Tương quan (Correlation) và Hàm tự tương quan
ACF(AutoCorrelation Function)
2.2.1 Tương quan – Correlation (tt)
Trong đó:
YX
SS
YXXY
R
.
.−
=
Ta có:
www.themegallery.com
Tính chất của hệ số tương quan
Hê số tương quan

được dùng để đánh giá mức độ chặt chẻ của sự phụ thuộc tương quan tuyến
tính giữa hai đại lượng ngẫu nhiên X và Y có các tính chất như sau:
2.2 Tương quan (Correlation) và Hàm tự tương quan
ACF(AutoCorrelation Function)
2.2.1 Tương quan – Correlation (tt)
YX
SS
yxxy
r

.
.−
=
•|r| ≤ 1
•Nếu |r| =1 thì X và Y có quan hệ tuyến tính.
•Nếu |r| càng lớn thì sự phụ thuộc tương quan tuyến tính giữa X
và Y càng chặt chẻ.
•Nếu |r| =0 thì giữa X và Y không có phụ thuộc tuyến tính tương
quan.
•Nếu |r| > 0 thì X và Y tương quan thuận. Ngược lại, nếu |r| < 0
thì X vàY có tương quan nghịch (X tăng thì Y giảm)
www.themegallery.com
Ví dụ:
2.2 Tương quan (Correlation) và Hàm tự tương quan
ACF(AutoCorrelation Function)
2.2.1 Tương quan – Correlation (tt)
Hệ số tương quan của X
và Y là
www.themegallery.com
Tự tương quan có thể được định nghĩa là sự tương quan giữa
các thành phần của chuỗi các quan sát được sắp xếp theo thứ tự
thời gian hay không gian.
Hàm tự tương quan do lường phụ thuộc tuyến tính giữa các cặp
quan sát y(t) và y(t+k). Với độ trễ k =1,2, hàm tương tự quan tại
độ trễ k được xác định qua độ lệch giữa các biến ngẫu nhiên y(t)
và y(t+k) so với giá trị trung bình và được chuẩn hóa qua phương
sai (variance).
2.2 Tương quan (Correlation) và Hàm tự tương quan
ACF(AutoCorrelation Function)
2.2.2 Hàm tự tương quan ACF(AutoCorrelation Function)

www.themegallery.com
Giả sử các biến ngẫu nhiên trong chuỗi dừng thay đổi quanh giá
trị trung bình μ với phương sai σ
2
. Khi đó, hàm tương tự quan
tại các độ trễ khác nhau sẽ có giá trị khác nhau
Trong thực tế ta có thể ước lượng hàm tự tương quan tại độ trễ
k qua phép biến đổi trung bình của tất cả các cặp quan sát,
phân biệt bằng độ trễ k. Với giá trị trung bình mẫu là μ, được
chuẩn hóa bởi phương sai σ
2
. Cho chuỗi N điểm, giá trị r
k
của
hàm tương tự quan tại độ trễ k được tính như sau:
2.2.2 Hàm tự tương quan ACF - AutoCorrelation Function (tt)
www.themegallery.com
y
t
: dữ liệu chuỗi thời gian dừng tại thời điểm t
y
t+k
: dữ liệu chuỗi thời gian dừng tại thời điểm t +k
μ : giá trị trung bình của chuỗi thời gian dừng.
r
k
: giá trị tương quan giữa y
t
và y
t+k

tại độ trễ k.
r
k
=0 thì không có hiện tượng tự quan,
Trong đó
2.2 Hàm tự tương quan ACF (AutoCorrelation Function) (tt)
www.themegallery.com
2.2 Hàm tự tương quan ACF (AutoCorrelation Function) (tt)
Tính r
k
cho các độ trễ k =1, 2, 3, …, sau đóvẽ biểu đồ ACF của
mẫu dữ liệu. Biểu đồ có công dụng xác định xem xét hiện tượng
dừng của chuỗi để nhận dạng mô hình ARIMA dự định.
Ví dụ:
Giả sử ta có một chuỗi các giá trị đưa vào (42, 59, 35, 66, 37, 58, 49,
63, 52, 45, 36, 50, 43, 39, 52).
Khi đó:
-Giá trị trung bình mẫu μ = 48.4
-Phương sai mẫu σ2 = 92.6.
-Tính Hàm tự tương quan tại độ trễ k
ok =0, có giá trị 1 (hàm tự tương quan với chính nó).
ok=1, có giá trị là–0.48 (mô tả hàm tự tương quan tại
độ trễ thứ 1 dao trung bình giữa các quan sát liên tục
“42 và 59; 59 và 35; 35 và 66; 66 và 37; 37 và 58…”).
o…
-Áp dụng tương tự cho các độ trễ khác
www.themegallery.com
2.2 Hàm tự tương quan ACF (AutoCorrelation Function) (tt)
www.themegallery.com
2.2 Hàm tự tương quan ACF (AutoCorrelation Function) (tt)

Để kiểm định có phải là mô hình AR hay không hoặc r
k
=0 theo ý
nghĩa thống kê, ta sử dụng kiểm định cho những mẫu lớn. khi n khá
lớn, các hệ số r
k
sẽ gần như tuân theo phân phối chuẩn và có μ = 0,
phương sai (variance) được xác định theo công thức:
)] (21[
1
2
1
2
3
2
2
2
1 −
+++++=
k
rrrr
n
Var
var
0

=
k
r
t

Như vậy, giá trị của tới hạn t được tính:
www.themegallery.com
2.2 Hàm tự tương quan ACF (AutoCorrelation Function) (tt)
Nếu chúng ta muốn kiểm p
k
ở mức ý nghĩa 5%, ta sử dụng giá trị
tới hạn là 2 để so sánh với thống kê khi kiểm tra các giả thiết:
2
21
1
j
k
r
n
r
t
∑+
=
H
0
: p(k) = 0
H
a :
p(k) ≠ 0
Trong đó
k = độ trễ
n = số lần quan sát
j = 1,2,….k-1 (j<k)
Nếu t<2 thì ta sẽ không có AR (P
k

< 0)
www.themegallery.com
2.2 Hàm tự tương quan ACF (AutoCorrelation Function) (tt)
Nếu chúng ta muốn kiểm p
k
ở mức ý nghĩa 5%, ta sử dụng giá trị
tới hạn là 2 để so sánh với thống kê khi kiểm tra các giả thiết:
2
21
1
j
k
r
n
r
t
∑+
=
H
0
: p(k) = 0
H
a :
p(k) ≠ 0
Trong đó
k = độ trễ
n = số lần quan sát
j = 1,2,….k-1 (j<k)
Nếu t<2 thì ta sẽ không có AR (P
k

< 0)

×