Tải bản đầy đủ (.docx) (82 trang)

PHÂN TÍCH THỐNG kê và dự báo

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (403.22 KB, 82 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI
----------

VANLAYA PHOMOUDOM

PHÂN TÍCH THỐNG KÊ VÀ DỰ BÁO

LUẬN VĂN THẠC SĨ KHOA HỌC TOÁN HỌC

HÀ NỘI – 2014


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI
----------

VANLAYA PHOMOUDOM

PHÂN TÍCH THỐNG KÊ VÀ DỰ BÁO

Chuyên ngành: Lý thuyết xác suất và thống kê toán học
Mã số: 60.46.01.06

LUẬN VĂN THẠC SĨ KHOA HỌC TOÁN HỌC

Người hướng dẫn khoa học: NCVCC. TS. Nguyễn Hồng Hải

HÀ NỘI – 2014



I.

Lời mở đầu

Trong thống kê toán học, phân tích thống kê và dự báo đối với
chuỗi thời gian đóng một vai trò quan trọng và có ý nghĩa to lớn trong
thực tiễn: trong thực tiễn khoa học cũng như trong thực tiễn xã hội, cuộc
sống…
Vì vậy, tác giả lựa chọn đề tài là: “Phân tích thống kê và dự báo”
Luận văn ngoài phần mở đầu thì gồm hai chương chính
• Chương 1: Các khái niệm cơ bản về dự báo
• Chương 2: Phân tích chuỗi thời gian và dự báo
Tác giả xin bày tỏ long biết ơn chân thành tới thày hướng dẫn NCVCC. TS.
Nguyễn Hồng Hải, người đã tận tình hướng dẫn chỉ bảo trong suốt thời gian
thực hiện đề tài này. Tác giả cũng xin bày tỏ sự biết ơn tới các thày cô trong
tổ toán, các thày cô trong nhóm xác suất và bạn bè đồng nghiệp đã tạo điều
kiện cho tác giả trong suốt thời gian học tập và làm việc.
Hà Nội, tháng 6 năm 2014
Tác giả
Vanlaya Phomoudom

Chương1:
Các khái niệm cơ bản về dự báo


1.1.

Mở đầu
Việc dự báo một đại lượng biến thiên nói chung và dự báo nhu cầu nói


riêng đóng một vai tro rất quan trọng trong kinh tế và kỹ thuật. Chúng giúp
cho những người ra quyết định, các nhà doanh nghiệp tiên đoán một cách
khoa học xu hướng phát triển trong tương lai của các đại lượng, của thị
trường… và từ đó người ta có thể hoạch định các chính sách. Phương hướng
đầu tư một cách đúng đắn.
Ta lấy thí dụ ở ngành Bưu chính - Viễn thông. Đó là một ngành công
nghiệp dịch vụ có quy mô lớn. sử dụng các thiết bị đắt tiền, đòi hỏi việc đầu
tư về cơ sở hạ tầng rất lớn và liên tục. Vì vậy, để đảm bảo cho việc sử dụng
có hiệu quả các thiết bị và cơ sở vật chất sẽ được đầu tư, cần phải tiến hành
việc dự báo nhu cầu với mực độ càng chính xác càng tốt.
Bài toán dự báo cũng đặc biệt quan trọng trong lĩnh vực Khí tượng
-Thủy văn. Việc dự báo trước được thời tiết như nhiệt độ, nắng mưa. Lũ lụt…
sẽ giúp ích nhiều cho nên kinh tế quốc dân cũng như phòng tránh được thiệt
hai to lớn do thiên nhiên gây ra
Trong lĩnh vực tài chính, nếu ai biết trước được xu hướng tăng giảm
của một loại tiền tệ hay giá cổ phiếu thì chắc chắn mang lại nhiều lợi ích cho
người đó.
Những lĩnh vực có nhu cầu dự báo rất rộng lớn. Có những dự báo
mang tính chất định tính như màu sắc, bản chất con người và có những dự
báo mang tính chất định lượng như lượng mưa, sức gió, mực nước về ở sông
hồ, chỉ số tăng GDP, tốc độ phát triển dân số. Song với sự phát triển của kỹ
thuật số. tất cả các tính chất định tính đầu có thể lượng hóa. Thí dụ màu sắc
có thể đồng nhất với chỉ thị màu của nó… Vì vậy, từ nay về sau, từ dự báo
nhằm chỉ các dự báo mang tính chất định lượng.
Dự báo và “đoán mò” là hai điều khác hẳn nhau. Trong khi “đoán mò”
mang tính chất của công việc làm của thầy bói thí dụ báo phải căn cứ trên
những thông tin có được, thiết lập các mô hình các thuật toán để chỉ ra giá trị


cần dự đoán. Nói cách khác đi, dự báo chính là các “dự đoán” mang tính chất

khoa học. Cho dù với trình độ khoa học - kỹ thuật ngày nay,các mô hình cũng
như các thuật toán chưa hẳn đã đưa ra những dự báo chính xác hơn là các dự
đoán của các chuyên gia, thí dụ Trạng Trình Nguyễn Bỉnh Khiêm hay một vài
chuyên gia giỏi có thể đoán sự việc trước một thời gian rất dài, thì chúng ta
không nên xếp mình vào tầng lớp những danh nhân đó mà nên tiệp cận với
các phương pháp khoa học để dự báo một cách có cơ sở hơn.

Các bước cần thực hiện trong quá trình dự báo

1.2.

Thông thường thủ tục dự báo bao gồm các bước sau:
Bước 1: Xác định các mục tiêu dự báo
Bước đầu tiên của công tác dự báo là làm rõ các mục tiêu của nó. Ba
mục tiêu chính cần phải xác định là:


Đối tương dụ báo: Nhu cầu về thuê bao điện thoại, nhu cầu về nhà ở,
nhu cầu nghề nghiệp. Lương nước về trong hồ chứa, thời tiết, tỷ giá cổ



phiếu...
Khu vực dự báo: Theo địa dư (một tỉnh, khu vực, toàn quốc...) hay khu
vực xã hội (ngành công nghiệp, khu vực dịch vụ…). Khu vực dự báo
có thể là thu hạp trong vùng nông thôn hay một lĩnh vực cụ thể nào đó



như tỷ giá đồng đô-la Mỹ và đồng Việt Nam.

Khoảng thời gian cần dự báo: 1 năm, 5 năm, 10 năm…

Bước 2: Phân tích các yếu tố ảnh hưởng đến đại lượng cần dự báo.
Dự báo một địa lượng biến đổi theo thời gian có thể thực hiện trên tiền
đề là quan hệ giữa đại lượng này và các yếu tố quyết định các giá trị của đại
lượng này trong quá khứ về cơ bản không thay đổi cho đến thời điểm cần dự
báo trong tương lai. Do đó các điều kiện bên trong (như hệ thống giá và cơ
câu giá, cơ chế vận hành điều tiết lũ...) cũng các điều kiện bên ngoài (như các


kế hoạch phát triển vùng. Bảo đảm tính bền vững của môi trường...) phải
được xét đến.
Bước 3: Thu thập và phân loại dữ liệu.
Trong việc nghiên cứu các yếu tố ảnh hưởng trực tiếp đến đối tương dự
báo, cần phải thu thập những dữ liệu về các yếu tố đó. Sau đó sắp xếp và phân
loại chúng để xử lý.
Chẳng hạn, dữ liệu cần cho việc dự báo nhu cầu điện thoại có thể bao
gồm:







Dân số, số hộ gia đình
Số văn phòng các công ty, cơ quan, đoàn thể
Tốc độ tăng thu nhập
Tốc độ tăng trưởng kinh tế
Các kế hoạch phát triển đô thị

Nhu cầu điện thoại của các nam qua

Các dữ liệu trên cần được sắp xếp theo thời gian, vùng địa dư hay
ngành nghề.
Bước 4: Phân tích xu hướng tiến triển của đại lượng cần dự báo:
Xu hướng tiến triển được phân tích trên các bình diện sau:






Các số liệu của thời gian trước đó.
Cơ cấu phát triển của hệ.
Nguồn tác động đến quá trình phát triển.
Xem xét các đặc trưng của khu vực.
So sách với các vùng khác.

Bước 5: Xác định kỹ thuật dự báo sẽ sử dụng và tính toán các giá trị dự báo
Các phương pháp dự báo có thể tạm phân thành 3 loại sau:


Ngoại suy chuỗi thời gian





Phân tích hồi quy
Các phương pháp khác (so sánh, chuyên gia...)


Phương pháp dự báo thường được chọn tương ứng với đặc điểm của
đối tượng cần dự báo và các yếu tố liên quan, ứng với các dữ liệu có thể thu
thập được. Để đạt được các giá trị dự báo với độ tin cậy cao, điều quan trọng
là phải chọn được phương pháp dự báo thích hợp, khả thi nhất và chọn ra
được phương pháp tính toán tin cậy và tối ưu.
Bước 6: Kiểm tra tính phù hợp của mô hình
Bước 7: Xác định các giá trị dự báo: kết hợp kết qủa thu được ở bước 5 và
các phân tích thực hiện ở các bước 2 và 4, xác định các giá trị dự báo thích
hợp nhất.

Phân loại các kiểu dự báo

1.3.

Thông thường, dự báo được phân loại theo mục tiêu dự báo, chu kỳ dự
báo và quy mô vùng dự báo đích.

1.3.1.

Phân loại dự báo theo mục tiêu



Mục tiêu của dự báo có thể được phân thành 3 loại.
Loại thứ nhất là nhằm nghiên cứu chính sách quản lý hoặc chiến lược



khác

Loại thứ hai là nhằm phác họa chi tiết để tính toán số lượng thiết bị. đặt



hệ thống, bố trí và thiết kế thí nghiệm.
Loại thứ ba gồm dự đoán sự phát triển của hệ để khai thác hệ hay đề
phòng rủi ro
Trong nghiên cứu chính sách quản lý hoặc chiến lược khác, các giá trị

tương lai được ước tính một cách đại thể để thiết lập một chính sách hoàn
chỉnh và một mục tiêu. Vì vậy, thong thường các dự báo mang màu sắc toàn


cực hơn là các vấn đề, gian đoạn cụ thể. Thí dụ dự báo một nhu cầu thường
nằm ở tầm vĩ mô cho cả quốc gia, cả vùng được sử dụng.
Để lập một kế hoạch thiết bị cụ thể cho việc lắp đặt mới hoặc bổ sung
thiết bị cũ, dự báo nhu cầu một cách chi tiết cho từng vùng phải được thực
trên cơ sở một khảo sát tổng thể trong vùng đó
1.3.2.

Phân loại theo các thời kỳ dự báo
Thời kỳ dự báo nhu cầu được phân thành dự báo ngắn hạn, trung hạn

và dài hạn tùy theo độ dài của thời kỳ dự báo.
1. Dự báo ngắn hạn
Dự báo này là dự báo cho khoảng thời gian 1 hoặc 2 thời kỳ tiếp
theo (thí dụ tháng hoặc quý). Dự báo ngắn hạn thường được sử dụng cho kế
hoạch cung cấp thiết bị từng kỳ. Dự báo này đòi hỏi thông tin chính xác có
xét tới các điều kiện kinh tế, các khả năng về ngân sách. Các đơn yêu cầu còn
chưa được thực hiện.

2.

Dự báo trung hạn
Một kế hoạch lắp đặt bổ sung dùng cho các thiết bị (tổng đài và các

thiết bị truyền tin chẳng hạn) đòi hỏi dự báo cho khoảng thời gian từ 3- 5 thời
kỳ. Do vậy, chúng ta cần phải có dự báo xa hơn một ít và ta gọi là dự báo
trung hạn.
Đối với các dự báo ngắn và trung hạn. Phương pháp chuỗi thời gian
thường hay được sử dụng. Nó dụng xu hướng được phát hiện ra từ các dữ liệu
có được cho đến thời điểm hiện tại làm cơ sở cho việc đoán định các giá trị
trong tương lai (phép ngoại suy). Nhìn từ góc độ toàn quốc dự báo này có khả
năng bị ảnh hưởng bởi các điều kiện kinh doanh và các điều kiện kinh tế.
Dưới góc độ từng vùng thì nó chịu ảnh hưởng lớn của các kế hoạch phát triển
khu vực hoặc đô thị có liên quan chặt chẽ với vùng này.
3. Dự báo dài hạn
Dự báo dài hạn cho khoảng thời gian 5 thời kỳ trở lên. Nó được sử
dụng cho kế hoạch đầu tư thiết bị quy mô lớn hoặc những chiến lược có tầm


vĩ mô. Trong trường hợp này. Việc dự báo bằng cách mở rộng các dữ liệu
thực tế có được đến thời điểm hiện tai sẽ không thích hợp. Mà phải xem xét
đến sự tăng lên của mức sống và sự thay đổi của đời sống xã hội. Dự báo này
được thực hiện về cơ bản có được bằng cách dự đoán gián tiếp, sử dụng các
mối quan hệ giả định của các yếu tố khác đối với đối tượng cần dự báo.
Chẳng hạn, tổng thu nhập quốc nội thường được coi là một yếu tố của ảnh
hưởng quan trọng nhất đến sự tăng trưởng của nhu cầu điện thoại. Trong dự
báo dài hạn người ta thường sử dụng các phương pháp hồi quy.
4. Điều chỉnh dự báo theo thời kỳ
Đối với các thời kỳ dự báo khác nhau, người ta sử dụng các loại

phương pháp dự đoán khác nhau. Không thể áp dụng cùng một phương pháp

Ngắn hạn



cho tất cả các dự báo ngắn hạn. trung hạn và dài hạn.
Vì vậy, cần phải tiến hành các công việc sau:
Khi hai phương pháp khác nhau được sử dụng, thì các giá trị dự báo của phần



gối đầu lên nhau phải được điều chỉnh.
Trung/dài
Khoảng trống giữa các đường
tănghạn
trưởng (của 2 thời kỳ lien tục không bị gối
lên nhau) phải được điều chỉnh

Nhu cầu
…Ngoại suy giữa các dự báo
Năm dự báo

Hình 1.1 cho thấy một phương pháp điều chỉnh chủ quan mà ở đó 1 đường
cong trơn được vẽ ra giữa 2 đường cong vẽ bằng các phương pháp khác
nhau. Ngược lai là một ví dụ của phương pháp điều chỉnh khách quan,


phương pháp mỏ rộng điểm cuối của một đường cong ngắn hạn làm một
giá trị ban đầu có thể sử dụng được cho tốc độ tăng trưởng của các mô hình

trung hạn và dài hạn.
1.3.3.

Phân loại theo quy mô vùng dự báo
Đây là phân sự phân loại tương đối theo quy mo vùng dự báo.

Chẳng hạn, việc dự báo cho một đơn vị lớn như nhu cầu điện thoại toàn
quốc được gọi là dự báo cấp vĩ mô, trong khi việc dự báo cho một đơn vị
dự báo cấp vi mô


1.

Dự báo cấp vĩ mô
Trong dự báo cấp vĩ mô, nói chung có thể dùng nhiều phép thống kê

xã hội. Vì vậy, có thể tiến hành nghiên cứu chi tiết về chúng. Chúng thường
được sử dụng để dự thảo một ngân sách toàn bộ hay hoạch định một kế hoạch
mang tính chất chiến lược
2. Dự báo cấp vi mô
Dự báo cấp vi mô là dự báo của vùng hay dự báo cho khu vực nhỏ.
Nó có thể hiểu là dự báo một đại lượng cho một ngành cụ thể. Thí dụ, đối với
việc thiết kế công việc lắp đặt thiết bị mới hoặc thiết bị bổ sung như đấu cáp,
thiết kế kỹ thuật và xây dựng kế hoạch bố trí tổng đài việc dự báo cấp vi mô
là cần thiết.
3. Điều chỉnh dự báo giữa vi mô và vĩ mô
Nhìn chung, có sự khác nhau ở chừng mực nào đó giữa tổng các giá
trị dự báo tầm vi mô và các giá trị dự báo tầm vĩ mô. Đối với vùng địa lý nhỏ,
ta khó có thể thu được các dữ liệu thống kê ổn định (các dữ liệu quá khwsmaf
ta có thể sử dụng làm cơ sở cho dự báo khác) và điều này có khả năng gây ra

những xét đoán sai lệch. Do đó, dự báo trực tiếp của một vùng địa lý lớn cho
chúng ta một xu hướng chính xác hơn là tổng của các kết của dự báo cấp vi mô
Khi đối chiếu giữa dự báo vi mô và dự báo vĩ mô, ta thường phải
điều chỉnh dự báo vi mô theo dự báo vĩ mô. Những nhân tố bị bỏ qua bởi dự
báo vĩ mô đôi khi có thể được dự báo vi mô chỉ rõ. Ý nghĩa của việc điều
chỉnh dự báo là nâng cao độ chính xác của dự báo. Xóa bỏ sai lệch trong việc
đánh giá gây ra bởi dự báo cấp vi mô.
Có hai phương pháp dự báo cơ bản là:
1) Phương pháp phân tích hội quy
2) Phương pháp chuỗi thời gian
Các phương này sẽ được xét chi tiết trong các chương sau:
1.4.
1.4.1.

Các khái niệm về dự báo
Các yếu tố ảnh hưởng đến nhu cầu


Nhu cầu của xã hội về một loại sản phẩm. một loại dịch vụ náo đó
thường bị chi phối bởi nhiều yếu tố. Các nhân tố nay có thể chia thành hai
nhóm: các yếu tố bên ngoài và các yếu tố bên trong. Thành phần của các
nhóm này hoàn toàn tùy thuộc vào bài toán cụ thể ta đang xét.
Chẳng hạn, đối với bài toán dự báo nhu cầu điện thoại, có thể xếp
các yếu tố như các hoạt động chính trị, đoàn thể và tư nhân, sự tăng trưởng
GDP: các yếu tố xã hội như dân số, số hộ gia định, và dân số làm việc… vào
nhóm các yếu tố bên ngoài. Các yếu tố bên trong có thể bao gồm: chi phí đâu
tư thiết bị, chi phí thuê bao, phụ phí sử dụng và các yếu tố marketing như hệ
thống sản xuất, quảng cáo và chiến lược marketing.
Dự báo nhu cầu là nhằm nắm vững và phân tích các nhân tố này để
xác định nhu cầu tương lai về số lượng. Ta minh họa những điều vừa nói ở

trên trong bài toán dự báo nhu cầu điện thoại:

Nhân tố bên ngoài

Nhân tố bên trong

Nhân tố kinh tế
Độ tăng trưởng kinh tế
Tiêu thụ cá nhân

Cước phí
Tiền thiết bị
Phí thuê bao
Phí truyền thong
Phụ phí sử dụng

Nhu cầu

Nhân tố xã hội
1.4.2. Các
giai
Dân
số đoạn tăng trưởng của nhu cầu
Chiến
lược
tiếptrải
thị qua 3 giai
chung, sự tăng trưởng của nhu cầu bao
giờ
cũng

HộNói
gia đình
Chiến lược sản xuất
Người đang lao động
đoạn:
Chiến lược quảng cáo


Giai đoạn khởi đầu: Trong giai đoạn này, nhu cầu tăng dần




nhưng chậm chạp.
Giai đoạn tăng trưởng nhanh
Giai đoạn bão hòa: Giai đoạn có tốc độ tăng trưởng chậm lại và
giảm dần.

1.4.3.

Các cộng việc cần làm để dự báo nhu cầu


Dự báo nhu cầu nhằm đưa ra các giá trị dự đoán về nhu cầu náo đó
để làm điều này, người ta phải tiến hành các bước: thu thập và chỉnh lý các dữ
liệu; phân tích và đanh giá độ chính xác của các giá trị dự báo: cuối cùng là
đưa ra giá trị dự báo nhu cầu. Ba phần việc này liên quan chặt chẽ với nhau.
Ta minh họa các phần việc của dự báo nhu cầu theo sơ đồ:
Dữ liệu
Dự báo nhu cầu

Thu thập sắp xếp dữ liệu

Quản lý giá trị nhu cầu

Dữ liệu

Chẳng hạn để dự báo nhu cầu điện thoại, cần tiến hành các công việc
a)

Thu thập và chỉnh lý các số liệu về nhu cầu điện thoại (số liệu bên
trong); các số liệu thống kê về dân số, số hộ gia đình, các chỉ số
kinh tế v.v… (dữ liệu bên ngoài) theo trình tự thời gian và địa

b)

phương.
Thiết lập mô hinh toán học cho bài toán. Sau đó căn cứ trên các số
liệu thu tập được ta tiến hành tính toán đê ước lượng mô hình. Các
bước tính toán này thường có kích thước lớn nên ta phải cần đến sự

c)

trợ giúp của máy tính
Tiến hành tính các giá trị dự báo theo phương pháp đã lựa chọn. Sử
dụng các tính toán này phục vụ cho mục đích của chúng ta.



Chương2:
Phân tích chuỗi thời gian và dự báo

Mở đầu

2.1.

Chương này đưa ra một vài ý tưởng cơ bản của bài toán phân tích chuỗi
thời gian. Trong bài toán đó, các khái niệm về tính dừng. Về hệ số tương quan
có vai trò đặc biệt quan trọng. Chúng ta cũng tóm lược qua một vài nét về các
kỹ thuật cơ bản ước lượng và loại bỏ đừng xu thế cũng như tính chất theo
mùa từ một chuỗi thời gian quan sát được. Một vài thí dụ minh họa đưa ra
được tính toán bằng phần tích mềm EVIEWS.
2.1.1.

Khái niệm và các thí dụ về chuỗi thời gian

Mục tiêu của việc phân tích kinh tế thể nghiệm là chỉ ra cơ chế kinh tế
và đưa ra các quyết sách. Vì vậy ta đòi hỏi có một số lượng lớn các quan sát
cho các đại lượng thích hợp để nghiên cứu các mối lien hệ giữa các đại lượng
này. Các quan sát này có thể được tiến hành đều đặn qua từng thời kỳ chẳng
hạn theo từng tháng, theo từng quý hoặc hàng năm hoặc chỉ trong những thời
điểm đặc biệt như các thời kỳ xảy ra khủng hoảng kinh tế. Dãy các quan sát
này ta gọi là chuỗi thời gian. Như vậy, chuỗi thời gian là tập hợp các quan sát
mà mỗi quan sát dược ghi nhận tại thời điểm t với tT. Chuỗi thời gian được
gọi rời rạc nếu như T là tập hợp rời rạc (thí dụ các quan sát được thực hiện
cách nhau một khoảng thời gian đều đặn như là doanh thu cước phí điện thoại
hàng tháng của một trạm bưu điện từ tháng 12 năm 1995 đến tháng 12 năm
2001. Trái lại nếu T là một khoảng thì chuỗi được gọi là liên tục. Biểu đồ ghi
nhịp tim của một bệnh nhân trong 2 giờ là một minh họa cho chuỗi thời gian
liên tục với T= [0,2]

2.1.2.


Mục đích của việc phân tích chuỗi thời gian


Tất cả các kỹ thuật dự báo chuỗi thời gian dựa trên giả định là có một
mẫu hình cơ bản tiềm ẩn trong các số liệu đang nghiên cứu cùng với các yếu
tố ngẫu nhiên ảnh hưởng lên hệ thống đang xét. Công việc chính của phân
tích chuỗi thời gian là ngiên cứu các kỹ thuật để tách mẫu hình cơ bản này và
sử dụng nó như là cơ sở để dự báo cho tương lai.
Vấn đề là ở chỗ phần lớn các chuỗi thời gian trong cuộc sống thực tại là
rất phức tạp nên các kỹ thuật đơn giản như là làm trơn số liệu …ở các phần
trước sẽ không thể dùng được trong các trường hợp này (kỹ thuật làm trơn số
liệu chỉ phù hợp cho các chuỗi mà độ thăng giáng không lớn lắm). Vì vậy,
chương này dành cho việc giới thiệu phương pháp Box-Jenkins để dự báo các
chuỗi thời gian có độ phức tạp cao hơn. Kỹ thuật này rất phù hợp cho công
việc dự báo chuỗi thời gian mặc dù nó tương đối phức tạp về phương diện
toán học và yêu cầu phải có nhiều số liệu. Trên thức tế, nó đòi hỏi ít nhất 50
số liệu và thong thường tốt nhất là nên có khoảng 100 số liệu mới có thể nhận
dạng chính xác mô hình.
Kỹ thuật dự báo Box-Jenkins được đề xuất hỏi George Box và Gwinlym Jenkinsnăm 1970 song thường được gọi là phương pháp dự báo các quá
trình tự hồi quy trung bình trượt ARMA(ARMA = Autogregres-sive
/Moving/Average).
Đề làm được điều đó, trước hết ta giả thiết có một hình xác suất để
biểu diễn dãy số liệu. Sau khi chọ ra mọt mô hình gần dãy số liệu, chúng ta
tiến hành ước lượng các tham số của mô hình, kiểm tra lại xem mô hình được
sử dụng có thích hợp không.

2.1.2.1.

Dự báo


Dự báo là ước lượng các giá trị tương lai yt+h , h ≥ 1 của một biến
ngẫu nhiên dựa trên các quan sát các giá trị quá khứ của nó y1, y2,…,yt. Dự
báo của yt+h thường được ký hiệu là.


Chất lượng của dự báo phụ thuộc vào nhiểu yếu tố. Trước hết nó
phụ thuộc váo xu hướng phát triển của chuỗi thời gian. Nếu chuỗi thời gian là
làm “đều đặn” theo thời gian thì càng dễ dự báo.Thí dụ nếu tiến trình phát
triển kinh tế không có những biến động đặc biệt thì dễ dàng dự báo tổng sản
phẩm quốc nội (GDP) cho những năm sau. Cho đến này, các phương pháp dự
báo chuỗi thời gian chưa cho phép dự báo được các giá trị đột biến.
Chất lượng dự báo chuỗi thời gian còn phụ thuộc xa gần của thời gian.
Dự báo các giá trị càng gần hiện tại càng chính xác. Như vậy, việc ước lượng
GĐP cho năm sau sẽ chính xác hơn là ược lượng GĐP cho 10 năm sau.
Ngoài ra, phương pháp ước lượng cũng đóng vai trò hết sức quan
trọng. Nếu chúng ta sử dụng phương pháp dự báo tốt thì giá trị dự báo càng
chính xác.
2.1.2.2.

Tách các xu thế
Trong các chu kỳ tăng trưởng, nhiều chuỗi thời gian có sự tiến triển

trung hạn tương tự nhau. Sự tiến triển trung hạn này được gọi là các xu thế.
Như vậy, nếu tồn tại một xu thế trong chuỗi thời gian thì ta nên tách nó ra để
dễ dàng cho việc xử lý các số liệu còn lại.
2.1.2.3.

Hiệu chỉnh theo mùa
Có lẽ chẳng cần nghiên cứu nhiều cũng biết hàng năm cứ đến mùa


thu thì áo len bán chạy hơn mùa hè. Cũng như vậy đối với các hiện tượng khí
tượng như mây mưa, bão lụt và các vấn đề kinh tế khác. Thí dụ về lượng hành
khách của ngành đường sắt Pháp cho ta thấy cứ đến tháng tám thì số hành
khách đi tàu thấp nhất trong năm đó. Ta gọi tình trạng đó là hiện tượng theo


mùa. Chuỗi số nhận được sau khi loại bỏ xu thế theo mùa trong chuỗi thời
gian gọi là “chuỗi được hiệu chỉnh theo mùa”.
Có nhiều phương pháp khác nhau để hiệu chỉnh một chuỗi thời gian
theo mùa. Tuy nhiên bất cứ một phương pháp nào cũng đòi hỏi có các tính
chất sau: nếu ta ký hiệu zSA là chuỗi hiệu chỉnh theo mùa của chuỗi (zt) thì
xSA + ySA = (x + y)SA , x,y

i)

ii)
iii)
2.1.2.4.

xSAySA = (xy)SA , x,y

Phát hiện các thời điểm đột biến
Có thể do khủng hoảng kinh tế - chính trị hay chiến tranh mà chiều

hướng phát triển kinh tế có thể thay đổi mạnh mẽ ở những thời điểm nào đó về
xu thế cũng như mức độ. Rõ ràng rằng việc phát hiện ra những điểm đột biến
này càng sớm càng tốt là một việc quan trọng trong dự báo chuỗi thời gian.
2.1.3.


Một vai mô hình chuỗi thời gian đơn giản

Phần quan trọng của việc phân tích chuỗi thời gian là chọn mô hình xác suất
phù hợp (hay là phân lớp mô hình) cho dãy số liệu. Để còn có một khả năng
nào đó cho việc không thể dự đoán được giá trị tương lai, ta giá thiết mỗi
quan sát xt, là một thể hiện của biến ngẫu nhiên Xt.
Bây giờ ta hãy xét việc mô hình hóa chuỗi thời gian đối với các số liệu
quan sát {xt} từ các biến ngẫu nhiên{xt}, đó là việc nhận dạng các phân phối
đồng thời {xt }, tức là tập hợp các phân phối xác suất.


Của biến ngẫu nhiên (X1, X2,…, Xn). Tuy nhiên tập các phân bố này ít được sử
dụng bởi vì nó chứa quá nhiều tham số. Vì vậy, trong nhiều trường hợp ta chỉ
cần xác định một vài tham số như là kỳ vọng EXt và hệ số tương quan
Trong trường hợp các phân phối đồng thời của (X1, X2,…, Xn) là chuẩn
thì việc biết hai tham số này sẽ đủ xác định phân phối đó.
Sau đây ta xét 3 trường hợp đơn giản nhất của mô hình chuỗi thời gain.
Mô hình ướt trung bình zero
Mô hình tiếng ồn độc lập cùng phân phối ( ồn trắng )
Trong mô hình này các quan sát {xt} là các mẫu ngẫu nhiên đơn giản
1)
a)

tức là nó là các quan sát từ các biển ngẫu nhiên {xt} độc lợp cùng phân phối
với trung bình zero. Đây là mô hình chuỗi thời gian đơn giản nhất vì nó
không chứa bất cứ một xu thế hoặc tính chất theo mùa nào. Theo định nghĩa
mô hình là ồn trắng (viết tắt nếu

Và Xt = 0, DXt =
b)


Mô hình nhị thức

Nếu {xt} lấy hai giá trị với

Và là dãy độc lập thì mô hình ồn trắng gọi là mô hình nhị thức.
Chúng ta có thể nhận được các chuỗi thời gian nhị thức bằng cách tung
một đồng tiền cân đối, đồng nhật. Nếu ở lần tung thứ t đồng tiền.


Xuất hiện mật sấp thì ta gán cho giá trị + 1 còn xuất hiện mặt ngừa thì gán
giá trị - 1. Chuỗi thời gian nhị thức thường gặp trong các tiếng ồn điện báo,
các bài toán liên quan may rủi trong song bạc hay kết quả các trận đấu…
Từ định nghĩa của mô hình ta có

Đẳng thức này cho thấy việc biết được các giá trị của quá khứ (X1, X2,…, Xn)
không giúp ích gì cho dự báo giá trị tương lai . Mặc dù vậy chuỗi thời gian
độc lập cùng phân phối vẫn đóng vai trò quan trọng trong việc xây dựng
những mô hình phức tạp hơn như ví dụ sau đây.
c)

Di động ngẫu nhiên
Từ mô hình nhị thức ta đặt
St = X1+X2+…+ Xn

St có thể minh họa như là vị trí của một chuyển động xuất phát từ 0 và
sau mỗi đơn vị thời gian vật thể sẽ tiến lên hay lùi lại một bước. Ta có nhận
xét rằng để nhân được Xt ta chỉ cần sai phân chuỗi St tức là Xt= St – St-1
{St} được gọi là di động ngẫu nhiên đối xứng. Nó hay gặp trong các
mô hình kinh tế - tài chính như là tính toán cổ phiếu hay rủi ro ở các ngẫu

nhiên hàng.
2) Mô hình có xu thế và mô hình có tính chất theo mùa
Các mô hình được đưa ra trong mục 1) thuần túy ngẫu nhiên. Tức là số
liệu quan sát tại một thời điểm hoàn toàn không kế thừa bất cứ thông tin nào
từ các số liệu quan sát tại thời điểm khác. Tuy nhiên trong niều bài toán phân
tích chuỗi thời gian ta nhận thấy có một xu thế rõ ràng trong số liệu. Rõ ràng
trong các trường hợp này, mô hình trung bình zero không còn thích hợp.
Đường biểu diễn các số liệu này trên mặt phẳng gợi cho ta mô hình dạng.
Xt = mt +Yt

với t=1,2…


Với mt là hàm có dạng đã biết. Nó được mình họa như là thành phần có xu thế
của chuỗi thời gian còn Yt có trung bình zero. Kỹ thuật để ước lượng mt sẽ
được đề cập về sau.
Có nhiều chuỗi thời gian bị ảnh hưởng của nhiều yếu tố có tính chất
theo mùa như là thời tiết, chu kỳ sinh đẻ hay chu kỳ tăng (giảm) kinh tế. Các
chuỗi thời gian này có thể mô hình hóa nhờ một thành phần tuần hoàn với chu
kỳ cố định. Để biểu thị được ảnh hưởng theo mùa này, ta giả thiết mô hình có
thể có nhiều nhưng không có xu thế và viết
Xt = st +Yt

với t=1,2…

Với st là hàm tuần hoàn với chu kỳ d ( tức là ). Thường ta lựa chọn

Vớilà các tham số chưa biết, là các tần số cố định, mỗi số là một bội nguyên
của
3) Phương pháp chung để mô hình hóa chuỗi thời gian

Qua phân tích ở trên cách tiếp cận chung để phân tích chuỗi thời gian là


Vẽ các số liệu của chuỗi lên mặt phẳng tọa độ và xết các đặc trưng chính của
chúng, chú ý đến
a) Xu thế,
b) Thành phần theo mùa,
c) Những thời điểm thay đổi dáng điệu lớn,
d) Những quan sát dị thường.
• Khử các xu thế và thành phần theo mùa. Có hai phương pháp chính:
a) Ước lượng các xu thế hay các biểu diễn theo mùa nhờ phương pháp bình
phương tối thiểu sau đó trừ các giá trị của hàm vừa ước lương vào các số liệu:


b) Sai phân số liệu: Xết một chuỗi thời gian mới {Yt} từ chuỗi ban đầu nhờ
toán tử sai phân (hoạc lạp lại một vài lần sai phân như vậy). Mục tiêu là nhận
được một chuỗi dừng (xem phần 2.3.3 về nhận dạng chuỗi thời gian).
2.2.

Quá trình dừng và phân tích hệ số tự tương quan
2.2.1.
Khái niệm về quá trình dừng
Quá trình dừng là quá trình ngẫu nhiên có một vài đặc trưng không

biến đổi theo thời gian. Dây là một khái niệm cốt lõi trong việc phân tích
chuỗi thời gian. Nếu đặc trưng đó là phân phối đồng thời của các {X t} thì
ta có
Định nghĩa 2.2.1:
Quá trình ngẫu nhiên {Xt} được gọi là dừng theo nghĩa chặt nếu như
với mọi t1< t2<…<tk và h > 0 ta có () có cùng phần phối với ().

Việc đòi hỏi phân phối đồng thời của {Xt} bất biến của phép dịch
chuyển thời gian là quá mạnh nên đôi khi ta chỉ đòi hỏi một vai đặc trưng yếu
hơn liên quan tới các mô men cấp 1 và cấp 2 không phụ thuộc theo thời gian
như định nghĩa sau đây.
Định nghĩa2.2.2:
Giả sử {Xt} là chuỗi thời gian với . Khi đó
a) Hàm số gọi là hàm trung bình.
b) Hàm theo biến ] được gọi là hàm tự hiệp phương sai.
Định nghĩa 2.2.3:
Quá trình ngẫu nhiên gọi là dừng theo nghĩa rộng nếu
i) Hàm số hằng số theo t.
ii) Với mỗi h=0, cố định hàm số
]
Không phụ thuộc vào t, tức là
Ta nhận xét rằng quá trình dừng theo nghĩa chặt với suy ra nó phải
đúng theo nghĩa rộng. Điều ngược lại chỉ đúng trong một vài tương hợp đặc
biệt. Trong suốt giáo trình này khi nói quá trình dừng là ta ngụ ý dừng theo
nghĩa rộng nếu không chú thích thêm.
Định nghĩa 2.2.4.


Nếu {Xt} t = 0, là quá trinh dừng với thì hàm (theo h):
Gọi là hàm tự hiệp phương sai(autocovaiancer)còn
(2.2.1)
Gọi là hàm tự tương quan.
Giải thích: Khi nghiên cứu hai véc - tơ trên mặt phẳng, ngoài thống số
độ dài của từng véc - tơ, còn có một đại lượng rất quan trọng là số đo cosin
của góc giữa hai véc - tơ đó. Về phương diện nào đó thì hệ số tương quan của
hai đại lương ngẫu nhiên X và Y được cho bởi cũng mang một ý nghĩa tương
tự như vậy. Nó là một chỉ số đơn giản chỉ sự phụ thuộc lẫn nhau của hai đại

lượng ngẫu nhiên. Khi chỉ có một dãy quan sát, ta đưa vào khái niệm mới là
các hàm tự tương quan để đo sự phụ thuộc lẫn nhau giữa các quan sát. Giá rị
của hệ số tự tương quan tại h đo mối quan hệ giữa hai giá trị của chuỗi thời
gian cách nhau một khoảng h. Khoảng cách xa nhau của hai số liệu này gọi là
độ trễ của thời gian.
Các tính chất của các hệ số hiệp phương sai, tương quan có thể xem
trong các tài liệu về lý thuyết xác suất và thống kê toán học (thí dụ [2]). ở đây
ta chỉ nhấn mạnh đến tính chất tuyến tính của các hệ số tương quan. Nếu và
a,b,c là các số thức bất kỳ thì
Ví dụ 2.2.1. Dãy tiếng ồn độc lập cùng phân phối
Nếu là độc lập cùng phân phối với thì
Ví dụ 2.2.2. Di động ngẫu nhiên
Vì hệ số tự tương quan phụ thuộc theo t nên di động ngẫu nhiên không
có tính chất dừng
Vai trò của hệ số tự tương quan (HSTTQ) có thể được minh họa nhứ
thí dụ sau đây. Giả sử là chuỗi thời gian dừng Gauss (tức là các phân)
Phối đồng thời của (X1,X2, ….., Xk) là chuẩn với mọi k). Giả sử ta đã
quan sát được giá trị của , ta muốn tìm một hàm số của để ước lượng tốt nhất


cho theo nghĩa bình phương tối thiểu. Theo ý thuyết quá trình ngẫu nhiên,
người ta đã chứng minh rằng ước lượng đó là

Với sai số của ước lượng

Trong đó tương ứng là giá trị trung bình và phương sai của Biểu thức
này cho thấy (ít nhất là trong trường hợp chuỗi thời gian Gauss), ước lượng
càng chính xác nếu Càng gần giá trị 1.
Từ định nghĩa 2.2.4 ta thấy HSTTQ là hàm chẵn tức là với mọi h vì
vậy trong các lập luận về sau, ta chỉ quan tâm đến các giá trị của h) với h > 0.

Cách đơn giản nhất để xây dựng chuỗi thời gian dừng theo nghĩa chặt
là “lọc” nó từ quá trình ngẫu nhiên độc lập cùng phân phối. Giả sử là dãy độc
lập cùng phân phối còn là hàm (đo được) q biến số, khi đó

Sẽ là chuỗi thời gian dừng theo nghĩa chặt. Trong trường hợp này dễ
thấy và sẽ độc lập với mọi |h| > q nên với mọi |h| > q.
Các quá trình có tính chất này ta sẽ gọi là q – tương quan. Ta xét trường
hợp riêng nhưng quan trọng sau
Định nghĩa 2.2.5:
(Quá trình trung bình trượt MA(q)). {Xt} là quá trình trung bình trượt
cấp q(viết tắt MA(q)) nếu
Xt = Zt + θ1Zt - 1 +…+ θqZt - q
(2.2.2)
Trong đó {Zt} là dãy lập có cùng phân phối với trung bình 0 và
phương sai σ2, còn θ1, θ2, ..., θqlà các hằng số, θq≠0


Tầm quan trọng của quá trình trung bình MA (q)) ở chỗ mỗi quá trình
q - tương quan sẽ là một quá trình MA(q)) như mệnh đề sau
Mệnh đề 2.2.1:
Mỗi quá trình dừng, trung bình zero, q- tương quan có thể biểu diễn ở
dạng (2.2).
Độc giả quan tâm đến mệnh đề này có thể tìm thấy chứng minh trong
[5].
2.2.2.

Các quá trình tuyến tính
Các quá trình ngẫu nhiên tuyến tính cho chúng ta bối cảnh chung

để nghiên cứu chuỗi thời gian. Thật vậy, theo khai triển Wold, mỗi quá trình

ngẫu nhiên dừng có mô mem cấp 2 hữu hạn thì hoặc là tuyến tính, hoặc có thể
biến đổi thành quá trình tuyến tính bằng cách khử thành phần tất định trong
chuỗi thời gian.
Định nghĩa 2.2.6:
Chuỗi thời gian {Xt} là tuyến tính nếu nó có biểu diễn dạng
(2.2.3)
Vớc mọi t, trong đó {Zt} Là chuỗi độc lập, cùng phân phối với trung bình
zero và phương sai (viết tắt là còn Là dãy các hằng số với .
Để tiện việc trình bày, ta dẫn vào khái niệm toán tử dịch chuyển B định
nghĩa bởi . Với ký hiệu này (2.2.3) có thể viết lại dưới dạng
(2.2.4)
Với
Chú ý : Điều kiện đảm bảo cho chuỗi (2.2.3) hội tụ với xác suất 1 (xem
(5)). Ta cũng có thể thay điểu kiện này bằng điểu kiện yếu hơn . Vẫn đảm bảo
cho chuỗi (2.2.3) hội tụ nhưng theo nghĩa bình phương trung bình


×