Tải bản đầy đủ (.docx) (71 trang)

Phân tích thống kê và dự báo

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (470.88 KB, 71 trang )

Lời mở đầu
Trong thống kê toán học, phân tích thống kê và dự báo đối với chuỗi thời gian
đóng một vai trò quan trọng và có ý nghĩa to lớn trong thực tiễn: trong thực tiễn khoa




học cũng như trong thực tiễn xã hội, cuộc sống…
Vì vậy, chúng tôi lựa chọn đề tài là: “Phân tích thống kê và dự báo”.
Luận văn ngoài phần mở đầu thì gồm hai chương chính
Chương 1: Các khái niệm cơ bản về dự báo
Chương 2: Phân tích chuỗi thời gian và dự báo
Bản luận văn được thực hiện từ tháng 08 năm 2013 và đã hoàn thành vào
tháng 06 năm 2014, đánh một dấu mốc quan trọng trong sự nghiệp của tôi. Nhân
dịp này, tôi xin gửi lời cảm ơn chân thành nhất đến những người thân yêu của tôi,
gia đình, bạn bè và đồng nghiệp đã luôn ở bên cạnh động viên, ủng hộ và chia sẻ
cùng tôi công việc cũng như những khó khăn trong cuộc sống để tôi vượt qua dấu
mốc quan trọng này. Bản luận văn cũng là lời cảm ơn sâu sắc nhất của tôi dành
cho các thầy cô giáo và các bạn học Việt Nam đã giảng dạy và giúp đỡ tôi trong
quá trình học tập tại trường Đại học Sư phạm Hà Nội, đặc biệt là NCVCC. TS.
Nguyễn Hồng Hải , người đã dìu dắt và tận tình hướng dẫn tôi hoàn thành luận
văn này. Do kiến thức còn hạn chế và gặp nhiều khó khăn trong ngôn ngữ nên
chắc chắn luận văn thạc sĩ của tôi còn rất nhiều thiếu sót. Tôi rất mong nhận
được nhiều ý kiến đóng góp của các thầy giáo, cô giáo, của các bạn để luận văn
được hoàn thiện hơn.
Tôi xin trân trọng cảm ơn!

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI
----------


1

1
1


VANLAYA PHOMOUDOM

PHÂN TÍCH THỐNG KÊ VÀ DỰ BÁO

LUẬN VĂN THẠC SĨ KHOA HỌC TOÁN HỌC

HÀ NỘI – 2014

2

2
2


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI
----------

VANLAYA PHOMOUDOM

PHÂN TÍCH THỐNG KÊ VÀ DỰ BÁO
Chuyên ngành: Lý thuyết xác suất và thống kê toán học
Mã số: 60.46.01.06


LUẬN VĂN THẠC SĨ KHOA HỌC TOÁN HỌC

Người hướng dẫn khoa học: NCVCC. TS. Nguyễn Hồng Hải

3

3
3


HÀ NỘI – 2014

4

4
4


MỤC LỤC
Lời mở đầu
Trong thống kê toán học, phân tích thống kê và dự báo đối với chuỗi
thời gian đóng một vai trò quan trọng và có ý nghĩa to lớn trong thực tiễn:




trong thực tiễn khoa học cũng như trong thực tiễn xã hội, cuộc sống…
Vì vậy, chúng tôi lựa chọn đề tài là: “Phân tích thống kê và dự báo”.
Luận văn ngoài phần mở đầu thì gồm hai chương chính
Chương 1: Các khái niệm cơ bản về dự báo

Chương 2: Phân tích chuỗi thời gian và dự báo
Bản luận văn được thực hiện từ tháng 08 năm 2013 và đã hoàn
thành vào tháng 06 năm 2014, đánh một dấu mốc quan trọng trong sự
nghiệp của tôi. Nhân dịp này, tôi xin gửi lời cảm ơn chân thành nhất đến
những người thân yêu của tôi, gia đình, bạn bè và đồng nghiệp đã luôn ở
bên cạnh động viên, ủng hộ và chia sẻ cùng tôi công việc cũng như
những khó khăn trong cuộc sống để tôi vượt qua dấu mốc quan trọng
này. Bản luận văn cũng là lời cảm ơn sâu sắc nhất của tôi dành cho các
thầy cô giáo và các bạn học Việt Nam đã giảng dạy và giúp đỡ tôi trong
quá trình học tập tại trường Đại học Sư phạm Hà Nội, đặc biệt là
NCVCC. TS. Nguyễn Hồng Hải, người đã dìu dắt và tận tình hướng dẫn
tôi hoàn thành luận văn này. Do kiến thức còn hạn chế và gặp nhiều khó
khăn trong ngôn ngữ nên chắc chắn luận văn thạc sĩ của tôi còn rất nhiều
thiếu sót. .Tôi rất mong nhận được nhiều ý kiến đóng góp của các thầy
giáo, cô giáo, của các bạn để luận văn được hoàn thiện hơn.
Tôi xin trân trọng cảm ơn!

5

5


Chương 1
CÁC KHÁI NIỆM CƠ BẢN VỀ DỰ BÁO

Các khái niệm cơ bản về dự báo
1

Mở đầu
Việc dự báo một đại lượng biến thiên nói chung và dự báo nhu cầu nói riêng

đóng một vai trò rất quan trọng trong kinh tế và kỹ thuật. Chúng giúp cho những
người ra quyết định, các nhà doanh nghiệp tiên đoán một cách khoa học xu hướng
phát triển trong tương lai của các đại lượng, của thị trường… và từ đó người ta có thể
hoạch định các chính sách, phương hướng đầu tư một cách đúng đắn.
Ta lấy thí dụ ở ngành Bưu chính-Viễn thongthông,. đó là một ngành công
nghiệp dịch vụ có quy mô lớn. sử dụng các thiết bị đắt tiền, đòi hỏi việc đầu tư về cơ
sở hạ tầng rất lớn và liên tục. Vì vậy, để đảm bảo cho việc sử dụng có hiệu quả các
thiết bị và cơ sở vật chất sẽ được đầu tư, cần phải tiến hành việc dự báo nhu cầu với
mức độ càng chính xác càng tốt.
Bài toán dự báo cũng đặc biệt quan trọng trong lĩnh vực Khí tượng -Thủy văn.
Việc dự báo trước được thời tiết như nhiệt độ, nắng mưa, lũ lụt… sẽ giúp ích nhiều
cho nền kinh tế quốc dân cũng như phòng tránh được thiệt hại to lớn do thiên nhiên
gây ra
Trong lĩnh vực tài chính, nếu ai biết trước được xu hướng tăng giảm của một
loại tiền tệ hay giá cổ phiếu thì chắc chắn mang lại nhiều lợi ích cho người đó.
Những lĩnh vực có nhu cầu dự báo rất rộng lớn. Có những dự báo mang tính
chất định tính như màu sắc, bản chất con người và có những dự báo mang tính chất
định lượng như lượng mưa, sức gió, mực nước về ở sông hồ, chỉ số tăng GDP, tốc độ
phát triển dân số. Song với sự phát triển của kỹ thuật số, tất cả các tính chất định tính
đều có thể lượng hóa. Thí dụ màu sắc có thể đồng nhất với chỉ thị màu của nó… Vì
vậy, từ nay về sau từ dự báo nhằm chỉ các dự báo mang tính chất định lượng.
Dự báo và “đoán mò” là hai điều khác hẳn nhau. Trong khi “đoán mò” mang
tính chất của công việc làm của thầy bói thì dự báo phải căn cứ trên những thông tin
có được, thiết lập các mô hình các thuật toán để chỉ ra giá trị cần dự đoán. Nói cách
6

6


khác đi, dự báo chính là các “dự đoán” mang tính chất khoa học. Cho dù với trình độ

khoa học - kỹ thuật ngày nay các mô hình cũng như các thuật toán chưa hẳn đã đưa ra
những dự báo chính xác hơn là các dự đoán của các chuyên gia, thí dụ Trạng Trình
Nguyễn Bỉnh Khiêm hay một vài chuyên gia giỏi có thể đoán sự việc trước một thời
gian rất dài. Chúng ta không nên xếp mình vào tầng lớp những danh nhân đó mà nên
tiệp cận với các phương pháp khoa học để dự báo một cách có cơ sở hơn.

Các bước cần thực hiện trong quá trình dự báo

2

Thông thường thủ tục dự báo bao gồm các bước sau:
Bước 1: Xác định các mục tiêu dự báo
Bước đầu tiên của công tác dự báo là làm rõ các mục tiêu của nó. Ba mục
tiêu chính cần phải xác định là:



Đối tương dự báo
: Nhu cầu về thuê bao điện thoại, nhu cầu về nhà ở, nhu cầu nghề nghiệp, lượng nước



về trong hồ chứa, thời tiết, tỷ giá cổ phiếu...
Khu vực dự báo: Theo địa dư (một tỉnh, khu vực, toàn quốc...) hay khu vực xã hội
(ngành công nghiệp, khu vực dịch vụ…). Khu vực dự báo có thể là thu hẹp trong
vùng nông thôn hay một lĩnh vực cụ thể nào đó như tỷ giá đồng đô-la Mỹ và đồng



Việt Nam.

Khoảng thời gian cần dự báo
: 1 năm, 5 năm, 10 năm…
Bước 2: Phân tích các yếu tố ảnh hưởng đến đại lượng cần dự báo.
Dự báo một đại lượng biến đổi theo thời gian có thể thực hiện trên tiền đề là
quan hệ giữa đại lượng này và các yếu tố quyết định các giá trị của đại lượng này
trong quá khứ về cơ bản không thay đổi cho đến thời điểm cần dự báo trong tương
lai. Do đó các điều kiện bên trong (như hệ thống giá và cơ cấu giá, cơ chế vận hành
điều tiết lũ...) cùng các điều kiện bên ngoài (như các kế hoạch phát triển vùng. Bảo
đảm tính bền vững của môi trường...) phải được xét đến.
Bước 3: Thu thập và phân loại dữ liệu.
Trong việc nghiên cứu các yếu tố ảnh hưởng trực tiếp đến đối tượng dự báo
cần phải thu thập những dữ liệu về các yếu tố đó. Sau đó sắp xếp và phân loại chúng
để xử lý.
7

7


Chẳng hạn, dữ liệu cần cho việc dự báo nhu cầu điện thoại có thể bao gồm:







Dân số, số hộ gia đình
Số văn phòng các công ty, cơ quan, đoàn thể
Tốc độ tăng thu nhập
Tốc độ tăng trưởng kinh tế

Các kế hoạch phát triển đô thị
Nhu cầu điện thoại của các năm qua
Các dữ liệu trên cần được sắp xếp theo thời gian, vùng địa dư hay ngành nghề.
Bước 4: Phân tích xu hướng tiến triển của đại lượng cần dự báo:
Xu hướng tiến triển được phân tích trên các bình diện sau:
Các số liệu của thời gian trước đó
Cơ cấu phát triển của hệ
Nguồn tác động đến quá trình phát triển
Xem xét các đặc trưng của khu vực
So sánh với các vùng khác
Bước 5: Xác định kỹ thuật dự báo sẽ sử dụng và tính toán các giá trị dự báo
Các phương pháp dự báo có thể tạm phân thành 3 loại sau:
Ngoại suy chuỗi thời gian
Phân tích hồi quy
Các phương pháp khác (so sánh, chuyên gia...)
Phương pháp dự báo thường được chọn tương ứng với đặc điểm của đối tượng
cần dự báo và các yếu tố liên quan, ứng với các dữ liệu có thể thu thập được. Để đạt
được các giá trị dự báo với độ tin cậy cao, điều quan trọng là phải chọn được phương
pháp dự báo thích hợp, khả thi nhất và chọn ra được phương pháp tính toán tin cậy và
tối ưu.
Bước 6: Kiểm tra tính phù hợp của mô hình
Bước 7: Xác định các giá trị dự báo
: kết hợp kết quả thu được ở bước 5 và các phân tích thực hiện ở các bước 2 và
4, xác định các giá trị dự báo thích hợp nhất.

3

Phân loại các kiểu dự báo
8


8


Thông thường, dự báo được phân loại theo mục tiêu dự báo, chu kỳ dự báo và
quy mô vùng dự báo đích.

Phân loại dự báo theo mục tiêu

1




Mục tiêu của dự báo có thể được phân thành 3 loại.
Loại thứ nhất là nhằm nghiên cứu chính sách quản lý hoặc chiến lược khác
Loại thứ hai là nhằm phác họa chi tiết để tính toán số lượng thiết bị, đặt hệ thống, bố
trí và thiết kế thí nghiệm.
Loại thứ ba gồm dự đoán sự phát triển của hệ để khai thác hệ hay đề phòng rủi ro.
Trong nghiên cứu chính sách quản lý hoặc chiến lược khác, các giá trị tương
lai được ước tính một cách đại thể để thiết lập một chính sách hoàn chỉnh và một mục
tiêu.Vì vậy, thông thường các dự báo mang màu sắc toàn cực hơn là các vấn đề, giai
đoạn cụ thể. Thí dụ dự báo một nhu cầu thường nằm ở tầm vĩ mô cho cả quốc gia, cả
vùng được sử dụng.
Để lập một kế hoạch thiết bị cụ thể cho việc lắp đặt mới hoặc bổ sung thiết bị
cũ, dự báo nhu cầu một cách chi tiết cho từng vùng phải được thực trên cơ sở một
khảo sát tổng thể trong vùng đó.

Phân loại theo các thời kỳ dự báo

2


Thời kỳ dự báo nhu cầu được phân thành dự báo ngắn hạn, trung hạn và dài
1

hạn tùy theo độ dài của thời kỳ dự báo.
Dự báo ngắn hạn
Dự báo này là dự báo cho khoảng thời gian 1 hoặc 2 thời kỳ tiếp theo (thí dụ
tháng hoặc quý). Dự báo ngắn hạn thường được sử dụng cho kế hoạch cung cấp thiết
bị từng kỳ. Dự báo này đòi hỏi thông tin chính xác có xét tới các điều kiện kinh tế,

2

các khả năng về ngân sách. Các đơn yêu cầu còn chưa được thực hiện.
Dự báo trung hạn
Một kế hoạch lắp đặt bổ sung dùng cho các thiết bị (tổng đài và các thiết bị
truyền tin chẳng hạn) đòi hỏi dự báo cho khoảng thời gian từ 3- 5 thời kỳ. Do vậy,
chúng ta cần phải có dự báo xa hơn một ít và ta gọi là dự báo trung hạn.
Đối với các dự báo ngắn và trung hạn, phương pháp chuỗi thời gian thường
hay được sử dụng.Nó dùng xu hướng được phát hiện ra từ các dữ liệu có được cho
đến thời điểm hiện tại làm cơ sở cho việc đoán định các giá trị trong tương lai (phép
ngoại suy).Nhìn từ góc độ toàn quốc dự báo này có khả năng bị ảnh hưởng bởi các
điều kiện kinh doanh và các điều kiện kinh tế.Dưới góc độ từng vùng thì nó chịu ảnh
9

9


hưởng lớn của các kế hoạch phát triển khu vực hoặc đô thị có liên quan chặt chẽ với
3


vùng này.
Dự báo dài hạn
Dự báo dài hạn cho khoảng thời gian 5 thời kỳ trở lên. Nó được sử dụng cho kế
hoạch đầu tư thiết bị quy mô lớn hoặc những chiến lược có tầm vĩ mô.
4 Trong trường hợp này việc dự báo bằng cách mở rộng các dữ liệu thực tế có
được đến thời điểm hiện tai sẽ không thích hợp mà phải xem xét đến sự
tăng lên của mức sống và sự thay đổi của đời sống xã hội. Dự báo này được
thực hiện về cơ bản có được bằng cách dự đoán gián tiếp, sử dụng các mối
quan hệ giả định của các yếu tố khác đối với đối tượng cần dự báo. Chẳng
hạn, tổng thu nhập quốc nội được coi là một yếu tố ảnh hưởng quan trọng
nhất đến sự tăng trưởng của nhu cầu điện thoại. Trong dự báo dài hạn người
ta thường sử dụng các phương pháp hồi quy.
5 Điều chỉnh dự báo theo thời kỳ
Đối với các thời kỳ dự báo khác nhau, người ta sử dụng các loại phương pháp
dự đoán khác nhau. Không thể áp dụng cùng một phương pháp cho tất cả các dự báo



Ngắn hạn

ngắn hạn, trung hạn và dài hạn.
Vì vậy, cần phải tiến hành các công việc sau:
Khi hai phương pháp khác nhau được sử dụng, thì các giá trị dự báo của phần gối đầu
lên nhau phải được điều chỉnh. Trung/dài hạn
Khoảng trống giữa các đường tăng trưởng (của 2 thời kỳ liên tục không bị gối lên
nhau)
phải được điều chỉnh.
Nhu cầu
…Ngoại suy giữa các dự báo
Năm dự báo


10

10


Hình 1.1 cho thấy một phương pháp điều chỉnh chủ quan mà ở đó 1 đường
cong trơn được vẽ ra giữa 2 đường cong vẽ bằng các phương pháp khác nhau.Ngược
lai là một ví dụ của phương pháp điều chỉnh khách quan, phương pháp mở rộng điểm
cuối của một đường cong ngắn hạn làm một giá trị ban đầu có thể sử dụng được cho
tốc độ tăng trưởng của các mô hình trung hạn và dài hạn.

Phân loại theo quy mô vùng dự báo

3

Đây là phân loại tương đối theo quy mô vùng dự báo. Chẳng hạn, việc dự báo
cho một đơn vị lớn như nhu cầu điện thoại toàn quốc được gọi là dự báo cấp vĩ mô,
1

trong khi việc dự báo cho một đơn vị dự báo cấp vi mô.
Dự báo cấp vĩ mô
Trong dự báo cấp vĩ mô, nói chung có thể dùng nhiều phép thống kê xã hội. Vì
vậy, có thể tiến hành nghiên cứu chi tiết về chúng. Chúng thường được sử dụng để dự

2

thảo một ngân sách toàn bộ hay hoạch định một kế hoạch mang tính chất chiến lược.
Dự báo cấp vi mô
Dự báo cấp vi mô là dự báo của vùng hay dự báo cho khu vực nhỏ. Nó có thể

hiểu là dự báo một đại lượng cho một ngành cụ thể. Thí dụ, đối với việc thiết kế công
việc lắp đặt thiết bị mới hoặc thiết bị bổ sung như đấu cáp, thiết kế kỹ thuật và xây

3

dựng kế hoạch bố trí tổng đài việc dự báo cấp vi mô là cần thiết.
Điều chỉnh dự báo giữa vi mô và vĩ mô
Nhìn chung, có sự khác nhau ở chừng mực nào đó giữa tổng các giá trị dự báo
tầm vi mô và các giá trị dự báo tầm vĩ mô. Đối với vùng địa lý nhỏ, ta khó có thể thu
được các dữ liệu thống kê ổn định (các dữ liệu quá khó mà ta có thể sử dụng làm cơ
sở cho dự báo khác) và điều này có khả năng gây ra những xét đoán sai lệch. Do đó,
dự báo trực tiếp của một vùng địa lý lớn cho chúng ta một xu hướng chính xác hơn là
tổng của các kết của dự báo cấp vi mô.
Khi đối chiếu giữa dự báo vi mô và dự báo vĩ mô, ta thường phải điều chỉnh dự
báo vi mô theo dự báo vĩ mô. Những nhân tố bị bỏ qua bởi dự báo vĩ mô đôi khi có
thể được dự báo vi mô chỉ rõ. Ý nghĩa của việc điều chỉnh dự báo là nâng cao độ
chính xác của dự báo. Xóa bỏ sai lệch trong việc đánh giá gây ra bởi dự báo cấp vi
mô.

1
2

Có hai phương pháp dự báo cơ bản là:
Phương pháp phân tích hồi quy
Phương pháp chuỗi thời gian
11

11



Các phương này sẽ được xét chi tiết trong các chương sau.
4
1

Các khái niệm về dự báo
Các yếu tố ảnh hưởng đến nhu cầu
Nhu cầu của xã hội về một loại sản phẩm, một loại dịch vụ nào đó thường bị
chi phối bởi nhiều yếu tố. Các nhân tố này có thể chia thành hai nhóm: các yếu tố bên
ngoài và các yếu tố bên trong. Thành phần của các nhóm này hoàn toàn tùy thuộc vào
bài toán cụ thể ta đang xét.
Chẳng hạn, đối với bài toán dự báo nhu cầu điện thoại, có thể xếp các yếu tố
như các hoạt động chính trị, đoàn thể và tư nhân, sự tăng trưởng GDP: các yếu tố xã
hội như dân số, số hộ gia định, và dân số làm việc… vào nhóm các yếu tố bên ngoài.
Các yếu tố bên trong có thể bao gồm: chi phí đâu tư thiết bị, chi phí thuê bao, phụ phí
sử dụng và các yếu tố marketing như hệ thống sản xuất, quảng cáo và chiến lược
marketing.
Dự báo nhu cầu là nhằm nắm vững và phân tích các nhân tố này để xác định
nhu cầu tương lai về số lượng. Ta minh họa những điều vừa nói ở trên trong bài toán
dự báo nhu cầu điện thoại:

12

12


Nhân tố bên ngoài

Nhân tố bên trong

Nhân tố kinh tế

Độ tăng trưởng kinh tế
Tiêu thụ cá nhân

Cước phí
Tiền thiết bị
Phí thuê bao
Phí truyền thông
Phụ phí sử dụng

Nhu cầu
Nhân tố xã hội
Dân số
Hộ gia
đình
Hình
1.2:
Sơ đồ phân tích các nhân tố
đang lao
động trưởng của nhu cầu
Các Người
giai đoạn
tăng

2

Chiến lược tiếp thị
Chiến lược sản xuất
Chiến lược quảng cáo

Nói chung, sự tăng trưởng của nhu cầu bao giờ cũng trải qua 3 giai đoạn:




3

Giai đoạn khởi đầu: Trong giai đoạn này, nhu cầu tăng dần nhưng chậm chạp.
Giai đoạn tăng trưởng nhanh.
Giai đoạn bão hòa: Giai đoạn có tốc độ tăng trưởng chậm lại và giảm dần.

Các công việc cần làm để dự báo nhu cầu
Dự báo nhu cầu nhằm đưa ra các giá trị dự đoán về nhu cầu nào đó để làm điều
này người ta phải tiến hành các bước: thu thập và chỉnh lý các dữ liệu; phân tích và
đánh giá độ chính xác của các giá trị dự báo; cuối cùng là đưa ra giá trị dự báo nhu
cầu. Ba phần việc này liên quan chặt chẽ với nhau. Ta minh họa các phần việc của dự
báo nhu cầu theo sơ đồ:

13

13


Dữ liệu
Dự báo nhu cầu
Thu thập sắp xếp dữ liệu

Quản lý giá trị nhu cầu

Dữ liệu

Hình 1.3: Sơ đồ các công việc của dự báo nhu cầu


14

14


Chẳng hạn để dự báo nhu cầu điện thoại, cần tiến hành các công việc
a

Thu thập và chỉnh lý các số liệu về nhu cầu điện thoại (số liệu bên trong); các số liệu
thống kê về dân số, số hộ gia đình, các chỉ số kinh tế v.v… (dữ liệu bên ngoài) theo

b

trình tự thời gian và địa phương.
Thiết lập mô hình toán học cho bài toán. Sau đó căn cứ trên các số liệu thu thập được
ta tiến hành tính toán để ước lượng mô hình. Các bước tính toán này thường có kích
thước lớn nên ta phải cần đến sự trợ giúp của máy tính.
Tiến hành tính các giá trị dự báo theo phương pháp đã lựa chọn. Sử dụng các
tính toán này phục vụ cho mục đích của chúng ta.

Chương 2
PHÂN TÍCH CHUỖI THỜI GIAN VÀ DỰ BÁO
:Phân tích chuỗi thời gian và dự báo
1

Mở đầu
Chương này đưa ra một vài ý tưởng cơ bản của bài toán phân tích chuỗi thời
gian. Trong bài toán đó, các khái niệm về tính dừng, về hệ số tương quan có vai trò
đặc biệt quan trọng. Chúng ta cũng tóm lược qua một vài nét về các kỹ thuật cơ bản

ước lượng và loại bỏ từng xu thế cũng như tính chất theo mùa từ một chuỗi thời gian
quan sát được. Một vài thí dụ minh họa đưa ra được tính toán bằng phần mềm
EVIEWS.

15

15


1

Khái niệm và các thí dụ về chuỗi thời gian
Mục tiêu của việc phân tích kinh tế thể nghiệm là chỉ ra cơ chế kinh tế và đưa
ra các quyết sách. Vì vậy ta đòi hỏi có một số lượng lớn các quan sát cho các đại
lượng thích hợp để nghiên cứu các mối liêen hệ giữa các đại lượng này. Các quan sát
này có thể được tiến hành đều đặn qua từng thời kỳ chẳng hạn theo từng tháng, theo
từng quý hoặc hàng năm hoặc chỉ trong những thời điểm đặc biệt như các thời kỳ xảy
ra khủng hoảng kinh tế. Dãy các quan sát này ta gọi là chuỗi thời gian. Như vậy,
chuỗi thời gian là tập hợp các quan sát mà mỗi quan sát được ghi nhận tại thời điểm t
với tT. Chuỗi thời gian được gọi rời rạc nếu như T là tập hợp rời rạc (thí dụ các quan
sát được thực hiện cách nhau một khoảng thời gian đều đặn như là doanh thu cước
phí điện thoại hàng tháng của một trạm bưu điện từ tháng 12 năm 1995 đến tháng 12
năm 2001. Trái lại nếu T là một khoảng thì chuỗi được gọi là liên tục. Biểu đồ ghi
nhịp tim của một bệnh nhân trong 2 giờ là một minh họa cho chuỗi thời gian liên tục
với T= [0, 2].

2

Mục đích của việc phân tích chuỗi thời gian
Tất cả các kỹ thuật dự báo chuỗi thời gian dựa trên giả định là có một mẫu hình

cơ bản tiềm ẩn trong các số liệu đang nghiên cứu cùng với các yếu tố ngẫu nhiên ảnh
hưởng lên hệ thống đang xét. Công việc chính của phân tích chuỗi thời gian là ngiên
cứu các kỹ thuật để tách mẫu hình cơ bản này và sử dụng nó như là cơ sở để dự báo
cho tương lai.
Vấn đề là ở chỗ phần lớn các chuỗi thời gian trong cuộc sống thực tại là rất
phức tạp nên các kỹ thuật đơn giản như là làm trơn số liệu …ở các phần trước sẽ
không thể dùng được trong các trường hợp này (kỹ thuật làm trơn số liệu chỉ phù hợp
cho các chuỗi mà độ thăng giáng không lớn lắm). Vì vậy, chương này dành cho việc
giới thiệu phương pháp Box-Jenkins để dự báo các chuỗi thời gian có độ phức tạp
cao hơn.Kỹ thuật này rất phù hợp cho công việc dự báo chuỗi thời gian mặc dù nó
tương đối phức tạp về phương diện toán học và yêu cầu phải có nhiều số liệu.Trên
thức tế, nó đòi hỏi ít nhất 50 số liệu và thông thường tốt nhất là nên có khoảng 100 số
liệu mới có thể nhận dạng chính xác mô hình.

16

16


Kỹ thuật dự báo Box-Jenkins được đề xuất bởi George Box và Gwin-lym
Jenkins năm 1970 song thường được gọi là phương pháp dự báo các quá trình tự hồi
quy trung bình trượt ARMA(ARMA = Autogregres-sive /Moving/Average).
Đề làm được điều đó, trước hết ta giả thiết có một hình xác suất để biểu diễn
dãy số liệu.Sau khi chọn ra một mô hình gần dãy số liệu, chúng ta tiến hành ước
lượng các tham số của mô hình, kiểm tra lại xem mô hình được sử dụng có thích hợp
không.
1

Dự báo
Dự báo là ước lượng các giá trị tương lai yt+h , h ≥ 1 của một biến ngẫu nhiên

dựa trên các quan sát các giá trị quá khứ của nó y1, y2,…,yt. Dự báo của yt+h thường
được ký hiệu là.
Chất lượng của dự báo phụ thuộc vào nhiều yếu tố.Trước hết nó phụ thuộc vào
xu hướng phát triển của chuỗi thời gian. Nếu chuỗi thời gian là làm “đều đặn” theo
thời gian thì càng dễ dự báo. Thí dụ nếu tiến trình phát triển kinh tế không có những
biến động đặc biệt thì dễ dàng dự báo tổng sản phẩm quốc nội (GDP) cho những năm
sau.Cho đến nay, các phương pháp dự báo chuỗi thời gian chưa cho phép dự báo
được các giá trị đột biến.
Chất lượng dự báo chuỗi thời gian còn phụ thuộc xa gần của thời gian. Dự
báo các giá trị càng gần hiện tại càng chính xác. Như vậy, việc ước lượng GDP cho
năm sau sẽ chính xác hơn là ược lượng GDP cho 10 năm sau.
Ngoài ra, phương pháp ước lượng cũng đóng vai trò hết sức quan trọng. Nếu
chúng ta sử dụng phương pháp dự báo tốt thì giá trị dự báo càng chính xác.

17

17


Tách các xu thế

2

Trong các chu kỳ tăng trưởng, nhiều chuỗi thời gian có sự tiến triển trung hạn
tương tự nhau. Sự tiến triển trung hạn này được gọi là các xu thế. Như vậy, nếu tồn
tại một xu thế trong chuỗi thời gian thì ta nên tách nó ra để dễ dàng cho việc xử lý
các số liệu còn lại.

Hiệu chỉnh theo mùa


3

Có lẽ chẳng cần nghiên cứu nhiều cũng biết hàng năm cứ đến mùa thu thì áo
len bán chạy hơn mùa hè. Cũng như vậy đối với các hiện tượng khí tượng như mây
mưa, bão lụt và các vấn đề kinh tế khác. Thí dụ về lượng hành khách của ngành
đường sắt Pháp cho ta thấy cứ đến tháng tám thì số hành khách đi tàu thấp nhất trong
năm đó. Ta gọi tình trạng đó là hiện tượng theo mùa. Chuỗi số nhận được sau khi loại
bỏ xu thế theo mùa trong chuỗi thời gian gọi là “chuỗi được hiệu chỉnh theo mùa”.
Có nhiều phương pháp khác nhau để hiệu chỉnh một chuỗi thời gian theo mùa.
Tuy nhiên bất cứ một phương pháp nào cũng đòi hỏi có các tính chất sau: nếu ta ký
hiệu zSA là chuỗi hiệu chỉnh theo mùa của chuỗi (zt) thì
i

xSA + ySA = (x + y)SA , x,y

ii
iii

xSAySA = (xy)SA , x,y

Phát hiện các thời điểm đột biến

4

Có thể do khủng hoảng kinh tế - chính trị hay chiến tranh mà chiều hướng phát
triển kinh tế có thể thay đổi mạnh mẽ ở những thời điểm nào đó về xu thế cũng như mức
độ. Rõ ràng rằng việc phát hiện ra những điểm đột biến này càng sớm càng tốt là một việc
quan trọng trong dự báo chuỗi thời gian.
3


Một vài mô hình chuỗi thời gian đơn giản
Phần quan trọng của việc phân tích chuỗi thời gian là chọn mô hình xác suất
phù hợp (hay là phân lớp mô hình) cho dãy số liệu. Để còn có một khả năng nào đó
cho việc không thể dự đoán được giá trị tương lai, ta giả thiết mỗi quan sát xt là một
thể hiện của biến ngẫu nhiên Xt.

18

18


Bây giờ ta hãy xét việc mô hình hóa chuỗi thời gian đối với các số liệu
quan sát {xt} từ các biến ngẫu nhiên{xt}, đó là việc nhận dạng các phân phối đồng
thời {xt }, tức là tập hợp các phân phối xác suất
của biến ngẫu nhiên (X1, X2,…, Xn). Tuy nhiên tập các phân bố này ít được sử dụng
bởi vì nó chứa quá nhiều tham số. Vì vậy, trong nhiều trường hợp ta chỉ cần xác định
một vài tham số như là kỳ vọng EXt và hệ số tương quan .
Trong trường hợp các phân phối đồng thời của (X1, X2,…, Xn) là chuẩn thì việc
biết hai tham số này sẽ đủ xác định phân phối đó.
Sau đây ta xét 3 trường hợp đơn giản nhất của mô hình chuỗi thời gian.
1
a

Mô hình với ướt trung bình zero
Mô hình tiếng ồn độc lập cùng phân phối (ồn trắng)
Trong mô hình này các quan sát {xt} là các mẫu ngẫu nhiên đơn giản tức là nó
là các quan sát từ các biển ngẫu nhiên {xt} độc lậợp cùng phân phối với trung bình
zero. Đây là mô hình chuỗi thời gian đơn giản nhất vì nó không chứa bất cứ một xu
thế hoặc tính chất theo mùa nào. Theo định nghĩa mô hình là ồn trắng (viết tắt nếu
Và Xt = 0, DXt= .


b

Mô hình nhị thức
Nếu{xt} lấyhai giá trị với
và là dãy độc lập thì mô hình ồn trắng gọi là mô hình nhị thức.
Chúng ta có thể nhận được các chuỗi thời gian nhị thức bằng cách tung một
đồng tiền cân đối, đồng nhật. Nếu ở lần tung thứ t đồng tiền xuất hiện mặt sấp thì ta
gán cho giá trị +1 còn xuất hiện mặt ngửa thì gán giá trị -1. Chuỗi thời gian nhị thức
thường gặp trong các tiếng ồn điện báo, các bài toán liên quan may rủi trong song bạc
hay kết quả các trận đấu…
Từ định nghĩa của mô hình ta có
.

19

19


Đẳng thức này cho thấy việc biết được các giá trị của quá khứ (X1, X2…, Xn)
không giúp ích gì cho dự báo giá trị tương lai . Mặc dù vậy chuỗi thời gian độc lập
cùng phân phối vẫn đóng vai trò quan trọng trong việc xây dựng những mô hình
phức tạp hơn.
c

Di động ngẫu nhiên
Từ mô hình nhị thức ta đặt
St = X1+X2+…+ Xn
St có thể minh họa như là vị trí của một chuyển động xuất phát từ 0 và sau mỗi
đơn vị thời gian vật thể sẽ tiến lên hay lùi lại một bước. Ta có nhận xét rằng để nhận

được Xt ta chỉ cần sai phân chuỗi St tức là Xt= St – St-1.
{St} được gọi là di động ngẫu nhiên đối xứng. Nó hay gặp trong các mô hình
kinh tế-tài chính như là tính toán cổ phiếu hay rủi ro ở các ngẫu nhiên hàng.
2) Mô hình có xu thế và mô hình có tính chất theo mùa
Các mô hình được đưa ra trong mục 1) thuần túy ngẫu nhiên. Tức là số liệu quan
sát tại một thời điểm hoàn toàn không kế thừa bất cứ thông tin nào từ các số liệu quan
sát tại thời điểm khác. Tuy nhiên trong niều bài toán phân tích chuỗi thời gian ta nhận
thấy có một xu thế rõ ràng trong số liệu. Rõ ràng trong các trường hợp này, mô hình
trung bình zero không còn thích hợp. Đường biểu diễn các số liệu này trên mặt phẳng
gợi cho ta mô hình dạng.
Xt = mt +Yt

với t=1,2…

Với mt là hàm có dạng đã biết. Nó được mình họa như là thành phần có xu thế
của chuỗi thời gian còn Yt có trung bình zero. Kỹ thuật để ước lượng mt sẽ được đề
cập về sau.
Có nhiều chuỗi thời gian bị ảnh hưởng của nhiều yếu tố có tính chất theo mùa
như là thời tiết, chu kỳ sinh đẻ hay chu kỳ tăng (giảm) kinh tế. Các chuỗi thời gian
này có thể mô hình hóa nhờ một thành phần tuần hoàn với chu kỳ cố định. Để biểu
thị được ảnh hưởng theo mùa này, ta giả thiết mô hình có thể có nhiều nhưng không
có xu thế và viết
Xt = st +Yt

với t=1,2…

Với st là hàm tuần hoàn với chu kỳ d (tức là ). Thường ta lựa chọn
20

20



Vớilà các tham số chưa biết, là các tần số cố định, mỗi số là một bội nguyên
của .
3) Phương pháp chung để mô hình hóa chuỗi thời gian
Qua phân tích ở trên cách tiếp cận chung để phân tích chuỗi thời gian là








Vẽ các số liệu của chuỗi lên mặt phẳng tọa độ và xết các đặc trưng chính của chúng.,
chú ý đến
Xu thế
Thành phần theo mùa
Những thời điểm thay đổi dáng điệu lớn
Những quan sát dị thường.
Khử các xu thế và thành phần theo mùa. Có hai phương pháp chính:
a) Ước lượng các xu thế hay các biểu diễn theo mùa nhờ phương pháp bình
phương tối thiểu sau đó trừ các giá trị của hàm vừa ước lượng vào các số liệu.
b) Sai phân số liệu: Xét một chuỗi thời gian mới {Yt} từ chuỗi ban đầu nhờ
toán tử sai phân (hoặc lặp lại một vài lần sai phân như vậy). Mục tiêu là nhận được
một chuỗi dừng (xem phần 2.3.3 về nhận dạng chuỗi thời gian).

Quá trình dừng và phân tích hệ số tự tương quan
Khái niệm về quá trình dừng


2
1

Quá trình dừng là quá trình ngẫu nhiên có một vài đặc trưng không biến đổi
theo thời gian. Đây là một khái niệm cốt lõi trong việc phân tích chuỗi thời gian. Nếu
đặc trưng đó là phân phối đồng thời của các {Xt} thì ta có
Định nghĩa 2.2.1:
Quá trình ngẫu nhiên {Xt} được gọi là dừng theo nghĩa chặt nếu như với mọi
t1< t2<…<tk và h > 0 ta có () có cùng phân phối với ().
Việc đòi hỏi phân phối đồng thời của {Xt} bất biến của phép dịch chuyển thời
gian là quá mạnh nên đôi khi ta chỉ đòi hỏi một vài đặc trưng yếu hơn liên quan tới

a
b

i

các mô men cấp 1 và cấp 2 không phụ thuộc theo thời gian như định nghĩa sau đây.
Định nghĩa2.2.2:
Giả sử {Xt} là chuỗi thời gian với . Khi đó
Hàm số gọi là hàm trung bình.
Hàm theo biến ] được gọi là hàm tự hiệp phương sai.
Định nghĩa 2.2.3:
Quá trình ngẫu nhiên gọi là dừng theo nghĩa rộng nếu
Hàm số là hằng số theo t.
21

21



ii

Với mỗi h=0, cố định hàm số
]
không phụ thuộc vào t, tức là .
Ta nhận xét rằng quá trình dừng theo nghĩa chặt với suy ra nó phải đúng theo
nghĩa rộng. Điều ngược lại chỉ đúng trong một vài trường hợp đặc biệt.
Định nghĩa 2.2.4.
Nếu {Xt}, t = 0, là quá trình dừng với thì hàm (theo h):
gọi là hàm tự hiệp phương sai (autocovaiancer) còn
(2.2.1)
gọi là hàm tự tương quan.
Giải thích: Khi nghiên cứu hai véc - tơ trên mặt phẳng, ngoài thông số độ dài của
từng véc - tơ, còn có một đại lượng rất quan trọng là số đo cosin của góc giữa hai véc
- tơ đó. Về phương diện nào đó thì hệ số tương quan của hai đại lương ngẫu nhiên X
và Y được cho bởi cũng mang một ý nghĩa tương tự như vậy. Nó là một chỉ số đơn
giản chỉ sự phụ thuộc lẫn nhau của hai đại lượng ngẫu nhiên. Khi chỉ có một dãy
quan sát, ta đưa vào khái niệm mới là các hàm tự tương quan để đo sự phụ thuộc lẫn
nhau giữa các quan sát. Giá rị của hệ số tự tương quan tại h đo mối quan hệ giữa hai
giá trị của chuỗi thời gian cách nhau một khoảng h. Khoảng cách xa nhau của hai số
liệu này gọi là độ trễ của thời gian.
Các tính chất của các hệ số hiệp phương sai, tương quan có thể xem trong các
tài liệu về lý thuyết xác suất và thống kê toán học (thí dụ [2]).Ở đây ta chỉ nhấn mạnh
đến tính chất tuyến tính của các hệ số tương quan. Nếu
và a,b,c là các số thức bất kỳ thì
Ví dụ: 2.2.1. Dãy tiếng ồn độc lập cùng phân phối
Nếu là độc lập cùng phân phối với thì
Ví dụ 2.2.2. Di động ngẫu nhiên
Vì hệ số tự tương quan phụ thuộc theo t nên di động ngẫu nhiên không có tính
chất dừng

.
Vai trò của hệ số tự tương quan (HSTTQ) có thể được minh họa nhứ thí dụ sau
đây. Giả sử là chuỗi thời gian dừng Gauss (tức là các phân phối đồng thời của
22
22


(X1,X2, ….., Xk) là chuẩn với mọi k). Giả sử ta đã quan sát được giá trị của , ta muốn
tìm một hàm số của để ước lượng tốt nhất cho theo nghĩa bình phương tối thiểu.
Theo ý thuyết quá trình ngẫu nhiên, người ta đã chứng minh rằng ước lượng đó là
Với sai số của ước lượng
Trong đó tương ứng là giá trị trung bình và phương sai của . Biểu thức này
cho thấy (ít nhất là trong trường hợp chuỗi thời gian Gauss), ước lượng càng chính
xác nếu càng gần giá trị 1.
Từ định nghĩa 2.2.4 ta thấy HSTTQ là hàm chẵn tức là với mọi h vì vậy trong
các lập luận về sau, ta chỉ quan tâm đến các giá trị của với h > 0.
Cách đơn giản nhất để xây dựng chuỗi thời gian dừng theo nghĩa chặt là “lọc”
nó từ quá trình ngẫu nhiên độc lập cùng phân phối. Giả sử là dãy độc lập cùng phân
phối còn là hàm (đo được) q biến số, khi đó
sẽ là chuỗi thời gian dừng theo nghĩa chặt. Trong trường hợp này dễ thấy và
sẽ độc lập với mọi |h| > q nên với mọi |h| > q.
Các quá trình có tính chất này ta sẽ gọi là q – tương quan. Ta xét trường hợp
riêng nhưng quan trọng sau:
Định nghĩa 2.2.5: (Quá trình trung bình trượt MA(q))
{Xt} là quá trình trung bình trượt cấp q (viết tắt MA(q)) nếu
Xt = Zt + θ1Zt - 1 +…+ θqZt - q
(2.2.2)
Trong đó {Zt} là dãy lập có cùng phân phối với trung bình 0 và phương sai σ2,
còn θ1, θ2, ..., θqlà các hằng số, θq≠0
Tầm quan trọng của quá trình trung bình MA (q)) ở chỗ mỗi quá trình q tương quan sẽ là một quá trình MA(q)) như mệnh đề sau

Mệnh đề 2.2.1:
Mỗi quá trình dừng, trung bình zero, q- tương quan có thể biểu diễn ở dạng
(2.2).
Độc giả quan tâm đến mệnh đề này có thể tìm thấy chứng minh trong [5].
2

Các quá trình tuyến tính
23

23


Các quá trình ngẫu nhiên tuyến tính cho chúng ta bối cảnh chung để nghiên
cứu chuỗi thời gian. Thật vậy, theo khai triển Wold, mỗi quá trình ngẫu nhiên dừng
có mô menm cấp 2 hữu hạn thì hoặc là tuyến tính, hoặc có thể biến đổi thành quá
trình tuyến tính bằng cách khử thành phần tất định trong chuỗi thời gian.
Định nghĩa 2.2.6:
Chuỗi thời gian {Xt} là tuyến tính nếu nó có biểu diễn dạng
(2.2.3)
với mọi t, trong đó {Zt} là chuỗi độc lập, cùng phân phối với trung bình zero
và phương sai (viết tắt là còn là dãy các hằng số với .
Để tiện việc trình bày, ta dẫn vào khái niệm toán tử dịch chuyển B định
nghĩa bởi . Với ký hiệu này (2.2.3) có thể viết lại dưới dạng
(2.2.4)
với .
Chú ý : Điều kiện đảm bảo cho chuỗi (2.2.3) hội tụ với xác suất 1 (xem
(5)). Ta cũng có thể thay điểu kiện này bằng điểu kiện yếu hơn . Vẫn đảm bảo cho
chuỗi (2.2.3) hội tụ nhưng theo nghĩa bình phương trung bình.
Từ (2.2.3) dễ dàng tính được
(2.2.5)


.

(2.2.6)

Ví dụ 2.2.3. Quá trình trung bình trượt (dĩ nhiên) là quá trình tuyến tính.
Ví dụ : 2.2.4. Quá trình tự hồi quy cấp một AR(1) có dạng
.

(2.2.7)

Với . Nếu thì từ ta có
.

(2.2.8)
Từ (2.2.6) và (2.2.7) ta nhận được
(2.2.9)

24

24


với mọi h>0.
Nếu || >1, chuỗi (2.2.8) không hội tụ. Tuy nhiên ta có thể viết lại chuỗi thời
gian (2.2.7) ở dạng
.

(2.2.10)


Từ đó
.
Suy ra
(2.2.11)
là quá trình dừng tuyến tính.
Ví dụ 2.2.5. Lý luận trên có thể mở rộng cho quá trình tự hồi quy trung
bình trượt cấp 1 (viết tắt là quá trình ARMA(1,1) có dạng sau
(2.2.12)
với và
Để đơn giản ta ký hiệu
;

(2.2.13)

Ta nhận được phương trình
.

(2.2.14)

Vì vậy, khi || <1 ta có
. (2.2.15)
Tương tự, khi || > 1 ta nhận được
(2.2.16)
là quá trình tuyến tính dừng.
3

Hệ số tương quan và tự tương quan mẫu
Cũng như trong tất cả bài toán thống kê, các HSTTQ chưa được biết nên ta tìm
các ước lượng chúng qua các thể hiện của chuỗi thời gian.


1

Hệ số tương quan mẫu
Nếu ta quan sát được n giá trị của chuỗi là và n giá trị của chuỗi {Yt} là thì hệ
số hiệp phương sai sẽ được ước lượng bởi
.
25

25


×