Tải bản đầy đủ (.pdf) (74 trang)

Ứng dụng mô hình mạng thần kinh dự báo lạm phát Việt Nam

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1021.59 KB, 74 trang )

Header Page 1 of 126.

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC KINH TẾ TP.HCM
-----------------

CÔNG TRÌNH DỰ THI
GIẢI THƯỞNG NGHIÊN CỨU KHOA HỌC SINH VIÊN
“NHÀ KINH TẾ TRẺ – NĂM 2011”

TÊN CÔNG TRÌNH:

ỨNG DỤNG MÔ HÌNH MẠNG THẦN KINH
DỰ BÁO LẠM PHÁT VIỆT NAM

THUỘC NHÓM NGÀNH: KHOA HỌC KINH TẾ

Footer Page 1 of 126.


Header Page 2 of 126.

i

MỤC LỤC

DANH MỤC CÁC TỪ VIẾT TẮT
DANH MỤC BẢNG BIỂU
DANH MỤC HÌNH
DANH MỤC PHỤ LỤC
LỜI MỞ ĐẦU



CHƯƠNG 1: CƠ SỞ LÝ THUYẾT VỀ LẠM PHÁT
VÀ MÔ HÌNH MẠNG THẦN KINH NHÂN TẠO .............................3
1.1. Tổng quan lý thuyết và các nghiên cứu về lạm phát ............................................3
1.1.1. Các quan điểm về lạm phát ...............................................................................3
1.1.2. Phân loại lạm phát ............................................................................................4
1.1.3. Tác động của lạm phát ......................................................................................4
1.1.3.1. Tác động phân phối lại thu nhập của lạm phát.........................................5
1.1.3.2. Tác động của lạm phát đối với tăng trưởng kinh tế ..................................5
1.1.3.3. Tác động của lạm phát lên tỷ giá hối đoái ................................................6
1.1.3.4. Các tác động khác của lạm phát ..............................................................7
1.2. Mô hình mạng thần kinh nhân tạo .......................................................................7
1.2.1. Ý tưởng nền tảng của mô hình mạng thần kinh .................................................8
1.2.2. Mô hình mạng thần kinh đơn giản ....................................................................9
1.2.3. Cấu tạo của mô hình mạng thần kinh .............................................................. 11
1.2.3.1. Hàm kích hoạt ........................................................................................ 11
1.2.3.2. Cấu trúc mạng ....................................................................................... 13
1.2.3.3. Huấn luyện mạng ................................................................................... 15
1.2.3.3.1. Học không giám sát (Unsupervised learning) ............................. 15
1.2.3.3.2. Học có giám sát (Supervised learning) .......................................15
1.2.4. Xây dựng mô hình mạng thần kinh nhân tạo .................................................... 16
1.2.4.1. Xác định biến số cho mô hình mạng thần kinh ........................................17
Footer Page 2 of 126.


Header Page 3 of 126.

ii

1.2.4.2. Thu thập và xử lý dữ liệu......................................................................... 18

1.2.4.3. Sắp xếp lại bộ dữ liệu.............................................................................. 19
1.2.4.4. Xây dựng cấu trúc mô hình mạng ............................................................ 21
1.2.4.4.1. Số lớp ẩn của mô hình mạng truyền thẳng đa lớp ........................ 21
1.2.4.4.2. Số nơ-ron của mỗi lớp ẩn trong mô hình mạng ............................ 21
1.2.4.5. Huấn luyện mạng và các tiêu chuẩn đánh giá mô hình............................. 22
1.2.5. Bằng chứng thực nghiệm của mô hình mạng thần kinh ....................................22
1.2.5.1. Ứng dụng trong dự báo tài chính ............................................................. 23
1.2.5.2. Ứng dụng trong xếp hạng tín dụng ........................................................... 23
1.2.5.3. Ứng dụng trong dự báo lạm phát ............................................................. 24
1.2.5.4. Một số ứng dụng khác của mô hình mạng thần kinh nhân tạo .................. 25

CHƯƠNG 2: ỨNG DỤNG MÔ HÌNH MẠNG THẦN KINH
DỰ BÁO LẠM PHÁT VIỆT NAM .................................................... 27
2.1. Xác định biến số đầu vào của mô hình ...................................................................27
2.2. Thu thập và xử lý dữ liệu ....................................................................................... 32
2.3. Sắp xếp lại bộ dữ liệu ............................................................................................ 36
2.4. Xây dựng mô hình dự báo lạm phát .......................................................................36
2.5. Kết quả thực nghiệm của mô hình và kết luận ....................................................... 39

CHƯƠNG 3: MỘT SỐ GỢI MỞ TỪ KẾT QUẢ MÔ HÌNH ..................................48
3.1. Gợi ý về hướng nghiên cứu tiếp theo .....................................................................48
3.2. Gợi ý chính sách ....................................................................................................49

KẾT LUẬN
PHẦN PHỤ LỤC
TÀI LIỆU THAM KHẢO

Footer Page 3 of 126.



Header Page 4 of 126.

iii

DANH MỤC CÁC TỪ VIẾT TẮT

ADB

Ngân hàng phát triển châu Á (Asian development bank)

ANN

Mạng thần kinh nhân tạo (Artificial neural networks)

CR

Tăng trưởng tín dụng (Credit)

FFNN

Mạng thần kinh truyền thẳng (Feedforward Neural Networks)

FX

Thay đổi tỷ giá (Foreign exchange)

GRNN

Mạng thần kinh hồi quy tổng quát (Generalized regression neural
networks)


IMF

Quỹ tiền tệ quốc tế

INF

Tỷ lệ lạm phát (Inflation)

JCN

Mô hình mạng thần kinh kết nối bước nhảy (Jump connection
networks)

LR

Mô hình hồi quy tuến tính (Linear regression model)

M2

Tăng trưởng cung tiền M2 (Money supply M2)

MA

Trung bình di động (Simple moving average)

MFN

Mô hình mạng thần kinh chuyển tiếp đa tầng (Multi feedforward
networks)


NNNN

Ngân hàng nhà nước Việt Nam

NSNN

Ngân sách nhà nước

OIL

Thay đổi giá dầu

OLS

Phương pháp bình phương nhỏ nhất (Ordinary least squares)

OPEC

Hiệp hội các nước xấu khẩu dầu mỏ (Organization of the Petroleum
Exporting Countries)

VN

Footer Page 4 of 126.

Việt Nam


Header Page 5 of 126.


iv

DANH MỤC BẢNG BIỂU
Danh mục bảng.................................................................................................... Trang
Bảng 2.1: Mô tả các biến cơ sở và ký hiệu sử dụng ...................................................... 34
Bảng 2.2: Một số chỉ số thống kê cơ bản của các biến cơ sở ........................................35
Bảng 2.3: Thống kê các mô hình mạng được sử dụng .................................................. 38
Bảng 2.4: Kết quả kiểm định ngoài mẫu chuỗi các mô hình MLF
sử dụng hàm kích hoạt log-sigmoid ............................................................. 40
Bảng 2.5: Kết quả kiểm định ngoài mẫu chuỗi các mô hình MLF
sử dụng hàm kích hoạt tag-sigmoid .............................................................. 40
Bảng 2.6: Kết quả kiểm định ngoài mẫu chuỗi các mô hình GNN ................................ 44

Footer Page 5 of 126.


Header Page 6 of 126.

v

DANH MỤC HÌNH
Danh mục hình .................................................................................................... Trang
Hình 1.1: Cấu trúc nơ-ron trong não bộ và hệ thần kinh .................................................9
Hình 1.2: Cấu trúc mạng thần kinh đơn giản ................................................................ 10
Hình 1.3: Hàm log-sigmoid ......................................................................................... 12
Hình 1.4: Cấu trúc mạng truyền thẳng (feed forward)
và mạng phản hồi (feed back) ......................................................................13
Hình 1.5: Mô hình mạng truyền thẳng một lớp ẩn ........................................................ 14


Hình 2.1: Tốc độ tăng trưởng cung tiền M2, tín dụng và lạm phát ............................... 28
Hình 2.2: Giá dầu thô và tỷ lệ lạm phát hàng tháng ...................................................... 29
Hình 2.3: Giá xăng dầu trên thị trường trong nước và thế giới .....................................30
Hình 2.4: Tỷ trọng các nhân tố ảnh hưởng đến chỉ số CPI của Việt Nam ..................... 31
Hình 2.5: Tỷ lệ lạm phát hàng tháng và trung bình lạm phát 3 kỳ trước đó .................. 33
Hình 2.6: Kết quả kiểm định ngoài mẫu mô hình MLF 7-3-1 .......................................41
Hình 2.7: Kết quả kiểm định ngoài mẫu mô hình MLF 7-4-1 .......................................42
Hình 2.8: Kết quả kiểm định ngoài mẫu mô hình MLF 7-5-1 .......................................42
Hình 2.9: Kết quả kiểm định ngoài mẫu mô hình MLF 7-4-3-1 ...................................43
Hình 2.10: Kết quả kiểm định ngoài mẫu mô hình MLF 7-5-4-1 .................................43
Hình 2.11: Kết quả kiểm định ngoài mẫu mô hình MLF 7-3-2-1 .................................44
Hình 2.12: Chuỗi giá trị INF dự báo từ các mô hình GNN ........................................... 45
Hình 2.13: Chuỗi giá trị INF dự báo trung bình
từ các mô hình MLF-GNN và chuỗi thực tế ................................................. 46

Footer Page 6 of 126.


Header Page 7 of 126.

vi

DANH MỤC PHỤ LỤC

Danh mục phụ lục ............................................................................................... Trang
Phụ lục 1: Các chỉ số đo lường lạm phát ......................................................................54
Phụ lục 2: Mô hình hồi quy tuyến tính ......................................................................... 55
Phụ lục 3: Các phương pháp chuẩn hóa dữ liệu ........................................................... 59
Phụ lục 4: Ba cách tiếp cận để lựa chọn số lượng nơ-ron ẩn phù hợp ........................... 60
Phụ lục 5: Mô hình mạng truyền thẳng một lớp ẩn ...................................................... 60

Phụ lục 6: Mô hình mạng truyền thẳng đa lớp ............................................................. 61
Phụ lục 7: Kết quả kiểm định ngoài mẫu mô hình MLF-7-5-4-1 ..................................63
Phụ lục 8: Kết quả kiểm định ngoài mẫu mô hình GNN-7-4-1.....................................64
Phụ lục 9: Kết quả kiểm định ngoài mẫu mô hình GNN-7-4-4-4-1 .............................. 65

Footer Page 7 of 126.


Header Page 8 of 126.

-1-

LỜI MỞ ĐẦU

1. Lý do chọn đề tài.
Nếu như lạm phát trong nền kinh tế Việt Nam được duy trì ổn định trong suốt những
năm 2000 thì đến năm 2004, lạm phát bắt đầu tăng tốc mà đỉnh điểm là năm 2008, tỷ
lệ lạm phát đạt đến mức gần 20%. Trong nửa năm đầu 2011, tỷ lệ lạm phát đã vào
khoảng 13%. Lạm phát, nhất là lạm phát cao đã tác động đến nhiều mặt đời sống kinh
tế - xã hội: làm tăng chi phí sản xuất kinh doanh và giảm khả năng cạnh tranh của các
doanh nghiệp; làm méo mó nền kinh tế và làm cho việc thực hiện các kế hoạch chi
tiêu và tiết kiệm của dân chúng bị đảo lộn, gây tác động xấu đến những người có thu
nhập thấp, đặc biệt là những người sống chủ yếu bằng nguồn thu nhập từ tiền lương.
Trong bối cảnh đó, lạm phát mục tiêu, một công cụ của chính sách tiền tệ, đang dần
được chú ý nhiều hơn bởi các nhà điều hành chính sách lẫn giới nghiên cứu học thuật
bởi tính hiệu quả của nó trong việc ổn định giá cả, thúc đẩy tăng trưởng. Tuy nhiên,
một trong những điều kiện tiên quyết cho việc sử dụng hiệu quả công cụ lạm phát
mục tiêu chính là công tác dự báo của Ngân hàng Nhà nước đối với xu hướng chung
của giá cả để từ đó đề ra những biện pháp chủ động đưa mức lạm phát về mức mục
tiêu kỳ vọng. Mặt khác, nhận thấy tiềm năng của mô hình mạng thần kinh phi tuyến

trong việc dự báo các biến số vĩ mô như tỷ giá, lạm phát, tăng trưởng… bên cạnh các
mô hình truyền thống được minh chứng trong các nghiên cứu thực nghiệm. Trên cơ
sở đó, đề tài “Ứng dụng mô hình mạng thần kinh dự báo lạm phát Việt Nam” đã
được lựa chọn để tiến hành nghiên cứu.
2. Mục tiêu nghiên cứu.
Mục tiêu của đề tài là hướng đến việc xây dựng mô hình mạng thần kinh phù hợp để
dự báo tỷ lệ lạm phát của Việt Nam. Để hoàn thành mục tiêu trên, bài nghiên cứu sẽ
lần lượt trả lời cho các câu hỏi:
-

Thế nào là mô hình mạng thần kinh nhân tạo? Mô hình có những đặc điểm
nổi bật gì so với các mô hình tuyến tính truyền thống và cơ chế vận hành
của mô hình này như thế nào?

Footer Page 8 of 126.


Header Page 9 of 126.

-

-2-

Cấu trúc mô hình mạng nào sẽ phù hợp nhất để dự báo tỷ lệ lạm phát của
Việt Nam?

-

Những gợi ý nào có thể được đưa ra từ kết quả thực nghiệm của mô hình?


3. Kết cấu đề tài.
Để đi vào giải quyết mục tiêu nghiên cứu trên, đề tài được xây dựng với kết cấu gồm
ba chương với nội dung như sau:
Chương 1: Cơ sở lý thuyết về lạm phát và mô hình mạng thần kinh nhân tạo.
Chương 2: Ứng dụng mô hình mạng thần kinh dự báo lạm phát Việt Nam.
Chương 3: Một số gợi mở từ kết quả mô hình.
4. Đóng góp của đề tài.
Đề tài đã góp phần vào việc hệ thống hóa các khái niệm và nguyên lý nền tảng của
mô hình mạng, cơ chế vận hành của mô hình cùng với quy trình các bước để tiến
hành ứng dụng xây dựng mô hình trong dự báo thực tiến. Tiếp đó, kết quả thực
nghiệm đã cho thấy cấu trúc mạng tốt nhất để dự báo tỷ lệ lạm phát hàng tháng ở Việt
Nam là mô hình truyền thẳng giản đơn với một lớp ẩn và ba nơ-ron ẩn. Cuối cùng,
trên cơ sở kết quả thực nghiệm của mô hình, một số gợi ý về chính sách điều hành
lạm phát trong thời gian tới đã được đưa ra.
5. Hướng phát triển đề tài.
Mô hình mạng thần kinh được sử dụng trong đề tài chỉ là mô hình mạng truyền thẳng
giản đơn, do vậy, những nghiên cứu trong thời gian tới hướng đến việc áp dụng mô
hình mạng có phản hồi hoặc kết hợp với thuật toán di truyền và logic mờ để xây dựng
các mô hình “lai tạp” kỳ vọng sẽ góp phần vào việc nâng cao hiệu quả dự báo. Mặt
khác, bên cạnh lạm phát thì mô hình còn có thể được ứng dụng trong dự báo các biến
số khác như tỷ giá, tốc độ tăng trưởng GDP… Ngoài ra, một hướng phát triển khả dĩ
khác cho đề tài chính là ứng dụng mô hình trong hoạt động phân loại đối tượng đi
vay để hỗ trợ cho quá trình thẩm định tín dụng của các ngân hàng.

Footer Page 9 of 126.


Header Page 10 of 126.

-3-


CHƯƠNG 1: CƠ SỞ LÝ THUYẾT VỀ LẠM PHÁT
VÀ MÔ HÌNH MẠNG THẦN KINH NHÂN TẠO

1.1.

Tổng quan lý thuyết và các nghiên cứu về lạm phát.

1.1.1. Các quan điểm về lạm phát
Khi nghiên cứu về chế độ bản vị vàng, Karl Marx đã khẳng định: việc phát hành tiền
giấy phải được giới hạn trong số lượng vàng sẽ thực sự lưu thông dưới hình thức là
các đại diện tiền giấy của mình. Một khi lượng tiền giấy vượt quá mức giới hạn này
thì tiền giấy sẽ mất dần giấy trị làm gia tăng mức giá chung của tất cả các loại hàng
hóa và tình trạng lạm phát xuất hiện. Theo đó, lạm phát, dưới quan điềm của Karl
Marx, được định nghĩa như sau: Lạm phát là việc các kênh, các luồng lưu thông tràn
đầy những tờ giấy bạc dư thừa dẫn đến sự tăng vọt trong mức giá chung.
Cũng bàn về vấn đề lưu thông tiền tệ, Milton Friendman đã từng phát biểu: Lạm phát
ở mọi lúc mọi nơi đều là hiện tượng của lưu thông tiền tệ. Lạm phát xuất hiện và chỉ
xuất hiện khi nào số lượng tiền trong lưu thông tăng nhanh hơn so với sản xuất.
Tuy nhiên, John Keynes với thuyết cầu của mình cho rằng nguồn gốc sâu xa của lạm
phát là sự biến động cung cầu. Khi cung đã vượt xa cầu thì sản xuất sẽ đình đốn, nền
kinh tế bị suy giảm. Lúc đó, Nhà Nước buộc phải tung ra các khoản chi tiêu, đầu tư
công lớn, tăng cường các chính sách tín dụng nhằm kéo mức cầu của cả nền kinh tế
về cân bằng và vượt qua tổng cung. Lúc này, lạm phát đã xuất hiện. Trong trường
hợp nền kinh tế phát triển hiệu quả, áp dụng những tiến bộ khoa học kỹ thuật, cơ cấu
kinh tế được đổi mới thành công; lạm phát này có tác dụng thúc đẩy sản xuất. Ngược
lại, lạm phát, theo Keynes, đã không còn là động lực phát triển của nền kinh tế.
Với Paul A. Samuelson thì lạm phát xảy ra khi mức tăng trong chi phí sản xuất, kinh
doanh cao hơn mức tăng trong năng suất lao động. Chi phí gia tăng có thể do sự gia
tăng trong mức tiền lương, chi phí nguyên vật liệu đầu vào, hoặc cũng có thể là do

công nghệ lạc hậu, cơ chế quản lý cồng kềnh… Khi mức chi phí này vượt qua khỏi
sự bù đắp của năng suất lao động thì giá cả các mặt hàng sẽ tăng vọt và lạm phát xuất
hiện. Lúc này, lạm phát không còn là động lực để phát triển nữa mà nó sẽ khiến cho
nền kinh tế bị suy thoái, cần các biện pháp cấp bách nhằm khống chế lạm phát.
Footer Page 10 of 126.


Header Page 11 of 126.

-4-

Tóm lại, có rất nhiều góc nhìn khác nhau về lạm phát. Mỗi quan điểm, lý thuyết chỉ
giải thích cho một số thời kỳ nhất định và ngày càng nhiều quan điểm mới ra đời
cùng sự phát triển của nền kinh tế. Nhìn chung, dưới bất kỳ quan điểm nào lạm phát
cũng được đặc trưng bởi 3 điểm chính yếu sau:
o Sự gia tăng quá mức của lượng tiền trong lưu thông.
o Dẫn đến sự mất giá của đồng tiền.
o Từ đó, khiến cho giá cả các loại mặt hàng tăng cao.
1.1.2. Phân loại lạm phát
Xét về định tính, lạm phát được nhà kinh tế học Paul A. Samuelson phân thành hai
loại như sau:
 Lạm phát cân bằng và có thể dự đoán trước:
Đây là loại lạm phát khi toàn bộ giá cả của nền kinh tế đều tăng và mức tăng này đã
được dự đoán trước thì thu nhập của người dân cũng đồng thời được tăng lên một
cách tương ứng. Theo đó, lạm phát cân bằng và có thể dự đoán trước sẽ không gây ra
một tác hại nào cho việc sản xuất kinh doanh, tốc độ tăng trưởng của kinh tế hay việc
phân phối thu nhập của người dân.
 Lạm phát không cân bằng và không được dự đoán trước:
Loại lạm phát này xảy ra khi mức giá cả các loại hàng hóa, dịch vụ tăng không đều
nhau, vượt xa mức tăng trong tiền lương và không được dự báo trước. Đây là loại

phát gây khó khăn cho người dân, thiệt hại cho cả nền kinh tế. Một khi lạm phát này
xảy ra đồng tiền bị mất giá khiến cho những người nắm giữ hàng hóa giàu lên trong
khi những người cầm tiền thì lại nghèo đi một cách tương đối, thu nhập được phân
phối lại. Vì thế dẫn đến tình trạng đầu cơ tích trữ hàng hóa, ngoại tệ, vàng bạc, bất
động sản… gây ra trạng thái khan hiếm hàng hóa, bóp méo, xuyên tạc các yếu tố thị
trường, ảnh hưởng đến cả hoạt động sản xuất kinh doanh.
1.1.3. Tác động của lạm phát
Lạm phát có những ảnh hưởng nhất định đến sự phát triển kinh tế - xã hội tùy theo
mức độ của nó. Một điểm quan trọng là tác động của lạm phát phụ thuộc rất nhiều
vào việc lạm phát đó có dự đoán trước được hay không. Điều này có nghĩa là nếu
doanh nghiệp, các hộ gia đình hoàn toàn có thể dự báo được mức độ lạm phát thì khi
đó, lạm phát sẽ không trở nên gánh nặng cho nền kinh tế bởi ta đã có được những giải
Footer Page 11 of 126.


Header Page 12 of 126.

-5-

pháp để thích nghi với nó. Trong khi đó, lạm phát không dự đoán trước sẽ dẫn đến
những quyết định đầu tư sai lầm và phân phối lại thu nhập một cách ngẫu nhiên làm
mất tinh thần và sinh lực của nền kinh tế.
1.1.3.1.

Tác động phân phối lại thu nhập của lạm phát.

Tác động phân phối lại thu nhập của lạm phát chủ yếu phát sinh bởi hầu hết các
khoản nợ hoặc tài sản đều được xác định theo giá trị danh nghĩa và gắn liền với
những khoản kỳ hạn cố định. Ví dụ, các khoản tiết kiệm ngân hàng, trái phiếu của
doanh nghiệp và Chính phủ hoặc các khoản nợ khác… đều không được điều chỉnh

theo lạm phát. Vì vậy, khi lạm phát tăng cao, giá trị của những khoản nợ và tài sản
này sẽ bị giảm xuống. Đó là do trong điều kiện lạm phát, giá của hầu hết các hàng
hóa và dịch vụ trong nền kinh tế đều tăng trong khi các khoản chi trả gắn liền với
những khoản nợ hoặc tài sản này vẫn luôn giữ cố định. Nghiên cứu của Césaire A.
Meh (2009), trên cơ sở dữ liệu của Ngân hàng Trung Uơng Canada, đã lượng hóa tác
động tác động của lạm phát đối với việc phân phối lại thu nhập. Kết quả cho thấy tác
động này thật sự đáng kể cho dù lạm phát chỉ ở mức thấp.
1.1.3.2.

Tác động của lạm phát đối với tăng trưởng kinh tế.

Hầu hết mọi người đều đồng ý rằng lạm phát cao sẽ tác động bất lợi đối với nền kinh
tế. Thế nhưng, các nghiên cứu lại không đồng nhất quan điểm về mối tương quan
giữa lạm phát và tăng trưởng. Lý thuyết cổ điển cho rằng, giữa tăng trưởng và lạm
phát tồn tại mối tương quan dương. Tuy nhiên, những nghiên cứu thực nghiệm ban
đầu về vấn đề này hầu như chưa thể đưa ra một kết luận rõ ràng về mối tương quan
giữa hai biến số trên. Một trong những nguyên nhân này theo Michael và William
(1996) là do giới hạn trong việc xác định mối tương quan phi tuyến, được cho là vốn
dĩ tồn tại trong mối quan hệ giữa lạm phát và tăng trưởng. Nghiên cứu của Robert
(1996), sử dụng dữ liệu của gần 100 quốc gia trong giai đoạn từ năm 1960 đến 1990
để đánh giá tác động của lạm phát lên tăng trưởng kinh tế, đã đưa ra kết luận như sau:
khi lạm phát gia tăng ở mức trung bình khoảng 10% thì tỷ tăng trưởng GDP bình
quân đầu người sẽ giảm khoảng 0.4 – 0.6%. Mức tác động này không thật sự lớn.
Tuy nhiên, nghiên cứu của Min Li (2005) sử dụng dữ liệu lạm phát và tăng trưởng ở
90 quốc gia đang phát triển và 25 nước phát triển đã cho thấy sự tồn tại mối tương
quan phi tuyến giữa hai biến số này. Kết quả nghiên cho thấy, tại các nước đang phát
Footer Page 12 of 126.


Header Page 13 of 126.


-6-

triển tồn tại hai mức ngưỡng của lạm phát. Khi lạm phát dưới mức ngưỡng đầu tiên,
tác động của lạm phát đối với tăng trưởng hầu như không đáng kể và đặc biệt trong
một số trường hợp tồn tại mối tương quan dương. Tiếp đó, trong trường hợp nằm
trong khoảng giữa hai mức ngưỡng thì lạm phát sẽ có tác động đáng kể đến tăng
trưởng theo hướng nghịch chiều. Cuối cùng, khi lạm phát vượt hơn mức ngưỡng thứ
hai, “lạm phát phi mã” trong trường hợp này vẫn cho thấy tác động âm đối với tăng
trưởng. Tuy nhiên, mức độ tác động biên của lạm phát lúc này hầu như suy giảm.
1.1.3.3.

Tác động của lạm phát lên tỷ giá hối đoái.

Theo lý thuyết, trong điều kiện các yếu tố khác không đổi, khi tỷ lệ lạm phát của một
nước tăng tương đối so với lạm phát của một nước khác, sẽ dẫn đến sự sụt giảm trong
cầu nhập khẩu đối với hàng hóa của quốc gia này. Trong khi đó, quốc gia có lạm phát
cao sẽ có khuynh hướng nhập khẩu nhiều hơn. Hai tác động này cũng lúc tạo áp lực
làm giảm giá đồng tiền của nước có mức lạm phát cao hơn. Tỷ lệ lạm phát thường
khác nhau giữa các quốc gia, tạo nên các kiểu mậu dịch quốc tế để điều chỉnh thích
hợp và quá trình này sẽ ảnh hưởng đến tỷ giá hối đoái. Mối liên hệ giữa lạm phát và
tỷ giá đã được giải thích bằng lý thuyết ngang giá sức mua (Purchasing power parity
– PPP). Hình thức tuyệt đối của lý thuyết này cho rằng giá cả của các sản phẩm giống
nhau của hia nước khác nhau sẽ bằng nhau khi được tính bằng một đồng tiền chung.
Theo đó, nếu sự chênh lệch trong giá cả hàng hóa khi được tính bằng một đồng tiền
chung hiện hữu, mức cầu sẽ dịch chuyển để các mức giá này gặp nhau. Tỷ giá hối
đoái của đồng tiền hai nước sẽ luôn điều chỉnh để duy trì sự ngang giá trong sức mua.
Do vậy mà lạm phát sẽ có tác động đến tỷ giá hối đoái. Tuy nhiên, các nghiên cứu
thực nghiệm đã cho thấy là tình trạng ngang giá không phải luôn tồn tại. Phần trăm
thay đổi tỷ giá hối đoái thường biến chuyển nhiều hơn chênh lệch lạm phát hai quốc

gia. Trong một số trường hợp, lý thuyết ngang giá sức mua không thể dự đoán được
ngay cả chiều hướng biến động của một đồng tiền. Điều này được lý giải một phần là
do lạm phát không phải là yếu tố duy nhất tác động đến tỷ giá. Bên cạnh lạm phát, tỷ
giá còn chịu ảnh hưởng của các yếu tố khác như: lãi suất, mức thu nhập và sự can
thiệp của Chính phủ.

Footer Page 13 of 126.


Header Page 14 of 126.

1.1.3.4.

-7-

Các tác động khác của lạm phát.

Trong điều kiện lạm phát cao và không dự đoán trước được, cơ cấu nền kinh tế dễ bị
mất cân đối vì khi đó các nhà kinh doanh thường hướng đầu tư vào những khu vực
hàng hóa có giá cả tăng lên cao, những ngành sản xuất có chu kỳ ngắn, thời gian thu
hồi vốn nhanh, hạn chế đầu tư vào những ngành sản xuất có chu kỳ dài, thời gian thu
hồi vốn chậm vì có nguy cơ gặp phải nhiều rủi ro.
Bên cạnh đó, trong lĩnh vực lưu thông, khi vật giá tăng quá nhanh thì tình trạng đầu
cơ, tích trữ hàng hóa thường là hiện tượng phổ biến, gây nên mất cân đối giả tạo làm
cho lưu thông hàng hóa càng thêm rối loạn.
Lạm phát hoặc siêu lạm phát làm cho hoạt động của hệ thống tín dụng rơi vào tình
trạng khủng hoảng. Nguồn tiền gửi trong xã hội bị sụt giảm nhanh chóng, nhiều ngân
hàng bị phá sản do mất khả năng thanh toán. Lạm phát điều chỉnh quá nhanh, biểu
giá thường xuyên thay đổi làm cho lượng thông tin trong giá cả bị phá hủy, các tính
toán kinh tế bị sai lệch nhiều theo thời gian, từ đó gây khó khăn cho các hoạt động

đầu tư.
Hơn nữa, lạm phát còn gây thiệt hại cho ngân sách Nhà nước bằng việc bào mòn giá
trị thực của các khoản công phí. Lạm phát kéo dài và không dự đoán trước được làm
cho nguồn thu ngân sách Nhà nước bị giảm do sản xuất bị suy thoái. Tuy nhiên, lạm
phát cũng có tác động làm gia tăng số thuế mà Nhà nước thu được trong những
trường hợp nhất định.

1.2.

Mô hình mạng thần kinh nhân tạo.

Dưới góc độ khoa học máy tính, mô hình mạng thần kinh vốn là một trong những
ứng dụng của ngành khoa học trí tuệ nhân tạo. Trí tuệ nhân tạo được mô tả là một
phần mềm có khả năng mô phỏng tương tự một số hoạt động của con người. Cụ thể
hơn, đấy là những hệ thống có khả năng tự học hỏi, chuyển hóa dữ liệu thành “kiến
thức” (knowledge) để giải quyết một vấn đề nào đó. Mặc dù chỉ mới được ứng dụng
trong lĩnh vực kinh tế - tài chính trong thời gian gần đây, các công cụ trí tuệ nhân tạo
đã có một thời gian dài được sử dụng ở những lĩnh vực khác. Phần lớn các ứng dụng
của trí tuệ nhân tạo được bắt nguồn từ những quy luật của khoa học tự nhiên mà điển
hình là thuật toán di truyền, một trong những ứng dụng được vận dụng nhiều trong
Footer Page 14 of 126.


Header Page 15 of 126.

-8-

các nghiên cứu tài chính những năm gần đây. Thuật toán này được sử dụng để tìm
kiếm giải pháp thích hợp cho các bài toán tốt dựa trên việc vận dụng các nguyên lý
của quy luật tiến hóa như di truyền, đột biến, chọn lọc tự nhiên và trao đổi chéo. Bên

cạnh đó khoa học về trí tuệ nhân tạo còn có những ứng dụng khác như lý thuyết hỗn
loạn (chaos theory), thuật toán mô phỏng luyện kim (simulated annealing), hệ chuyên
gia (expert system) và lý thuyết logic mờ (Fuzzy logic)…
Tuy nhiên, trong số những ứng dụng của trí tuệ nhân tạo thì mô hình mạng thần kinh
(Artificla Neural Network) được cho là có khả năng thích nghi tốt nhất với yếu tố
“bất định”, vốn tồn tại trong các biến số kinh tế - tài chính và tạo nên rủi ro cho các
chủ thể kinh tế trong quá trình ra quyết định. Mô hình mạng thần kinh đã giải quyết
vấn đề này tốt hơn so với các công cụ khác là do khả năng nhận biết các mẫu hình
trong chuỗi dữ liệu để từ đó đưa ra những dự báo về xu hướng biến động trong tương
lai. Đây vốn là khả năng đặc biệt của não bộ con người mà mô hình mạng nhân tạo
đã mô phỏng được. Những ý tưởng cơ bản về cách thức hoạt động của não bộ sẽ giúp
cho việc tìm hiểu mô hình dễ dàng hơn.
1.2.1. Ý tưởng nền tảng của mô hình mạng thần kinh.
Não bộ và hệ thần kinh của con người được cấu thành bởi các tế bào được gọi là nơron. Theo như minh họa trong hình, mỗi nơ-ron sẽ bao gồm các thành phần chính
thực hiện nhiệm vụ tiếp nhận tín hiệu đầu vào, xử lý và cho ra các phản ứng ở đầu ra.
Bộ phận đầu vào sẽ tiếp nhận các xung thần kinh vốn dĩ là tín hiệu đầu ra của các nơron khác thông qua các khớp thần kinh. Khi tiếp nhận những tín hiệu đầu vào này, bộ
phận xử lý trung tâm của nơ-ron sẽ tổng hợp chúng lại và so sánh với mức “ngưỡng
phản ứng đầu ra”. Theo đó, chỉ khi nào các tín hiệu kích thích đầu vào vượt qua mức
ngưỡng này thì nơ-ron mới được kích hoạt và phản ứng lại bằng cách truyền tín hiệu
đầu ra đến một nơ-ron khác. Mức độ phản ứng của mỗi nơ-ron sẽ phụ thuộc vào mức
độ của các kích thích đầu vào và bản thân nơ-ron mà nó đã được nhận tín hiệu. Khi
các tín hiện được lan truyền giữa các nơ-ron thì sẽ dần hình thành nên một hệ thống
mạng lưới các nơ-ron được kích hoạt đồng thời và đây chính là nguồn gốc cho sự kỳ
diệu của não bộ con người trong việc nhận dạng các mẫu hình từ quá khứ.

Footer Page 15 of 126.


Header Page 16 of 126.


-9-

Hình 1.1: Cấu trúc nơ-ron trong não bộ và hệ thần kinh

1.2.2. Mô hình mạng thần kinh đơn giản.
Tương tự não bộ con người, hệ thống mạng thần kinh cũng bao gồm một tập hợp các
nơ-ron nhân tạo. Mỗi nơ-ron sẽ tiếp nhận thông tin đầu vào, xử lý chúng và cho ra giá
trị đầu ra. Quá trình này được thể hiện trong hình dưới. Giá trị đầu vào của mỗi nơron có thể là dữ liệu thô hoặc cũng có thể là đầu ra của một nơ-ron khác. Tiếp đó, các
nơ-ron nhân tạo này sẽ được được liên kết với nhau và sắp xếp thành các phân lớp
(layer).
Tương tự các mô hình hồi quy truyền thống, mô hình mạng thần kinh sẽ xác lập mối
quan hệ giữa một tập hợp các biến đầu vào {xi}, i = 1, 2,…, k với một hoặc nhiều
biến đầu ra, {yj}, j = 1, 2,…, k* . Điều khác biệt là ở sự tồn tại của các “lớp ẩn”
(hidden layer). Tại đó, các biến đầu vào sẽ được nén lại hoặc chuyển đổi bởi một hàm
số đặc biệt nào đó, thường là hàm logistic hoặc logsigmoid. Chính sự tồn tại của các
lớp ẩn này đã giúp cho mô hình mạng thần kinh có khả năng mô phỏng mối tương
quan phi tuyến giữa các biến số tốt hơn so với mô hình truyền thống.

Footer Page 16 of 126.


Header Page 17 of 126.

- 10 -

Hình 1.2: Cấu trúc mạng thần kinh đơn giản

Mỗi biến đầu vào (Input) sẽ đại diện cho một yếu tố có khả năng tác động đến biến
đầu ra. Về cơ bản, đây chính là biến độc lập trong phương trình hồi quy cổ điển. Ví
dụ, khi muốn ứng dụng mô hình mạng thần kinh để đưa ra quyết định có nên chấp

nhận hay không đối với một khoản cho vay, các biến đầu vào có giá trị tham khảo để
đưa ra quyết định này sẽ bao gồm mức thu nhập hàng tháng, trình độ học vấn, tuổi,
giới tính… Giá trị của mỗi biến số này sẽ trở được đưa vào các nơ-ron của lớp Input.
Trong một số trường hợp, giá trị của biến đầu vào sẽ đại diện cho các biến định tính
như: “đúng” hoặc “sai”; “tăng” hoặc “giảm”; “đậu” hoặc “rớt”…
Tiếp đó, biến đầu ra (Output) của mô hình chính là giải pháp của vấn đề, chính là
biến độc lập trong môi hình hồi quy tuyến tính. Tiếp theo ví dụ trong trường hợp trên,
khi đó, biến đầu ra sẽ là quyết định “cho vay” hoặc “không cho vay”. Kết quả này sẽ
được mã hóa dưới dạng giá trị số học là +1 và 0. Mục tiêu của mô hình mạng, cũng
tương tự các mô hình hồi quy khác sẽ là tính toán và dự báo giá trị của biến đầu ra
với một tập hợp các thông tin của biến đầu vào được cho trước trên cơ sở các thông
tin thu thập được từ dữ liệu quá khứ. Tương tự với quá trình hồi quy tuyến tính thông
thường, mô hình mạng thần kinh sẽ được “huấn luyện” để có thể “học” từ những
thông tin trong dữ liệu quá khứ để từ đó có thể đưa ra quyết định hoặc kết quả dự
báo. Quá trình này sẽ được tiến hành bằng các thuật toán huấn luyện mạng sẽ được
đề cập kỹ hơn ở các phần sau.

Footer Page 17 of 126.


Header Page 18 of 126.

- 11 -

Chính trong quá trình “học” này, hệ thống mạng thần kinh sẽ liên tục điều chỉnh các
trọng số (weight) của mỗi nơ-ron sao cho đạt được mục tiêu cuối cùng là giá trị dự
báo, kết quả của biến đầu ra từ mô hình mạng sẽ gần sát nhất với giá trị thực tế. Các
trọng số là một trong những thành phần quan trọng nhất của hệ thống mạng nhân tạo.
Nó sẽ ảnh hưởng đến mức độ tín hiệu được lan truyền từ lớp nơ-ron này sang lớp nơron khác. Các trọng số thể hiện mức độ ảnh hưởng của mỗi nơ-ron bởi các nơ-ron
trước đó. Khi so sánh với môi hình hồi quy tuyến tính truyền thống, các trọng số này

cũng chính là các hệ số hồi quy thể hiện mức độ tác động của mỗi biến độc lập lên
biến phụ thuộc. Tuy nhiên, điểm khác biệt ở mô hình này là các trọng số không chỉ
có ở các nơ-ron biến đầu vào mà còn tồn tại ở nơ-ron của các lớp ẩn.
1.2.3. Cấu tạo của mô hình mạng thần kinh.
Hệ thống mạng thần kinh nhân tạo được cấu thành bởi 3 bộ phận chính:
 Hàm kích hoạt/hàm truyền – thành phần chính của mỗi nơ-ron
 Cấu trúc mạng - sự tương tác giữa các nơ-ron.
 Thuật toán huấn luyện mạng.
1.2.3.1.

Hàm kích hoạt.

Các nơ-ron xử lý dữ liệu đầu vào theo hai hướng: trước hết là sẽ định hình các kết
hợp tuyến tính của dữ liệu đầu vào và sau đó tiến hành “nén” những kết hợp tuyến
tính này thông qua hàm logsigmoid. Hình 1.1 là đồ thị của hàm kích hoạt logistic
(hoặc logsidmoid), còn gọi là hàm “nén” (squasher function), của chuỗi số liệu trong
khoảng từ -5 đến +5. Theo đó, dữ liệu đầu vào đã được biến đổi trước khi tác động
lên biến đầu ra.
Sở dĩ hàm logsigmoid được sử dụng là bởi vì “đặc trưng ngưỡng” (threshold
behavior) của nó. Điều này rất phù hợp với đặc điểm của các biến số kinh tế trước
các tác nhân thay đổi. Ví dụ, khi lãi suất đã ở mức rất thấp hoặc rất cao, sự thay đổi
nhỏ lúc này sẽ có tác động rất ít lên quyết định mua một chiếc ô tô hoặc các hàng hóa
lâu bền khác của người tiêu dùng. Tuy nhiên, trong một khoảng nào đó được xác định
bởi hai giá trị biên, một sự điều chỉnh nhỏ cũng sẽ báo hiệu cho một xu hướng vận
động lên hoặc xuống và vì vậy sẽ có tác động lớn đến nhu cầu xe của người tiêu
dùng.
Footer Page 18 of 126.


Header Page 19 of 126.


- 12 -

Hình 1.3: Hàm log-sigmoid

Hơn nữa, hình dạng của hàm logsigmoid còn được sử dụng vì nó phản ánh quá trình
học hỏi từ hành động thực tế (learning by doing). Cụ thể là, đồ thị hàm số thể hiện độ
dốc tăng dần cho đến một điểm uốn xác định, sau đó, nó dần trở nên phẳng hơn và độ
dốc dần tiến đến không. Tiếp theo ví dụ trước ta sẽ thấy, khi lãi suất bắt đầu tăng từ
mức thấp, người tiêu dùng sẽ đánh giá xác suất của một đợt điều chỉnh tăng hoặc
giảm mạnh của lãi suất dựa trên thông tin về mức cho vay ở hiện tại. Họ càng có
nhiều kinh nghiệm thì càng có khả năng phân tích tín hiệu này để đi đến kết luận rằng
đây là một thời cơ tốt để tận dụng mức lãi suất hiện tại hoặc đây là thời điểm nên trì
hoãn quyết định mua sắm. Kết quả cuối cùng cũng sẽ khác nhau khi những người này
phải ra quyết định ở những các thời điểm khác nhau của mức lãi suất. Tóm lại, hàm
phi tuyến logsigmoid đã nắm bắt được các “ngưỡng phản ứng” (threshold response)
đặc trưng cho “sự hợp lý có giới hạn” (bounded rationality) hoặc “quá trình tự học
hỏi” (learning porcess) của các chủ thể trong trong quá trình hình thành nên các kỳ
vọng của mình. Kuan và White (1994) đã cho rằng các điểm “ngưỡng” chính là đặc
điểm cốt lõi của các phản ứng phi tuyến trong mô hình mạng thần kinh. Điều này
được mô tả là “một số nơ-ron có khuynh hướng phản ứng thụ động trước các tác
nhân kích thích khiêm tốn, và chúng nhanh chóng trở nên “năng động” hơn chỉ khi
các kích thích này vượt qua một mức ngưỡng nào đó. Tuy nhiên, sau khi vượt quá
giai đoạn này, một sự gia tăng trong các kích thích đầu vào sẽ chỉ còn tác động hạn
chế”.

Footer Page 19 of 126.


Header Page 20 of 126.


1.2.3.2.

- 13 -

Cấu trúc mạng

Sau khi xác định được các nơ-ron cụ thể, phần tiếp theo sẽ là kết hợp chúng lại với
nhau để hình thành nên hệ thống mạng. Cách thức mà các nơ-ron được sắp xếp và
tương tác với nhau chính là cấu trúc của mô hình. Các nghiên cứu cho thấy có thể có
nhiều loại cấu trúc mạng. Tuy nhiên, phần lớn chúng sẽ được chia vào hai loại chính
là: mạng truyền thẳng (feed-forward) và mạng phản hồi (feedback).
Với cấu trúc mạng truyền thẳng, tín hiệu của mô hình sẽ đi theo một chiều duy nhất
từ các nơ-ron đầu vào, lần lượt qua các nơ-ron của lớp ẩn và cuối cùng đến nơ-ron
đầu ra. Trong khi đó, với cấu trúc mạng phản hồi, các tín hiệu đầu ra của các nơ-ron
lớp này sẽ có thể trở thành đầu vào cho các nơ-ron của lớp trước đó và ta có mô hình
mạng thần kinh tuần hoàn (Recurrent Neural Network).

Hình 1.4 : Cấu trúc mạng (a) truyền thẳng (feed-forward) và
(b) mạng phản hồi (feed-back)

Nguồn: Joarder, Rezaul va Ruhul (2006) “Artificial Neural Network in Finance and
Manufacturing”.

Footer Page 20 of 126.


Header Page 21 of 126.

- 14 -


Hình 1.5 : Mô hình mạng truyền thẳng một lớp ẩn

Nguồn: Paul D. MaNelis (2005) “Neural Network in Finance”.

Hình 1.5 minh họa cho mô hình mạng thần kinh truyền thẳng 3 lớp: 1 lớp nơ-ron của
biến đầu vào, 1 lớp nơ-ron của biến đầu ra và 1 lớp ẩn. Mạng truyền thẳng với một
lớp ẩn duy nhất là loại mô hình mạng thần kinh cơ bản, được sử dụng phổ biến nhất
trong ứng dụng kinh tế, tài chính. Nhìn chung, hệ thống mạng này sẽ mô phỏng cách
thức mà não người xử lý những dữ liệu kích thích được tiếp nhận ở nơ-ron đầu vào
và cho ra kết quả phản ứng ở nơ-ron đầu ra. Tương tự sự phát triển của não, ngày
càng có nhiều nơ-ron sẽ được kết nối với nhau bởi các khớp thần kinh. Kết quả là
nhiều lớp ẩn hơn sẽ được hình thành, tín hiệu từ những nơ-ron khác nhau sẽ hoạt
động đồng thời và được kết nối bởi các khớp thần kinh để cho ra những phản ứng có
nhiều sắc thái hơn.
Điều hiển nhiên là, với những dữ liệu kích thích đầu vào đơn giản, chẳng hạn như
kinh nghiệm về nhiệt độ quá nóng hoặc quá lạnh, thì không cần phải được xử lý bởi
quá nhiều nơ-ron ở nhiều lớp ẩn trước khi cho ra kết quả phản ứng lại. Tuy nhiên, khi
dữ liệu kích thích đầu vào trở nên phức tạp hoặc đa dạng hơn, nhiều nơ-ron hơn ở các
lớp ẩn sẽ được kích hoạt và các phản ứng hoặc những quyết định được đưa ra sẽ là
kết quả của quá trình cân nhắc khi kết hợp các tín hiệu từ nhiều nơ-ron của nhiều lớp
ẩn khác nhau.

Footer Page 21 of 126.


Header Page 22 of 126.

1.2.3.3.


- 15 -

Huấn luyện mạng.

Ý tưởng cơ bản của quá trình huấn luyện mạng chính là xác định tập trọng số phù
hợp sao cho mô hình có thể được ứng dụng để đưa ra các quyết định hoặc dự báo tốt
nhất trên cơ sở các dữ liệu quá khứ đã có được. Quá trình này sẽ được thực hiện bằng
cách sử dụng các thuật toán được xây dựng phù hợp với các loại mô hình mạng khác
nhau. Các thuật toán này có thể được chia là hai loại chính là “học có giám sát” và
“học không giám sát”.
1.2.3.3.1. “Học không giám sát” (Unsupervised learning).
Trong quá trình “học không giám sát”, chỉ có dữ liệu quá khứ của biến đầu vào là
được đưa vào mô hình. Theo đó, hệ thống mạng thần kinh sẽ “tự tổ chức” (selforganizing), sắp xếp để phân loại các biến đầu vào thông các các nơ-ron thần kinh
của lớp ẩn. Với quá trình “tự huấn luyện” này, hệ thống mạng hầu như không có
thông tin về phân loại đầu ra như thế nào là phù hợp. Những thuật toán loại này
thường sẽ được ứng dụng cho mô hình mạng thần kinh “Sơ đồ tự tổ chức” (Selforgainizing map).
1.2.3.3.2. “Học có giám sát” (Supervised learning).
Khác với các thuật toán ở phần trên, các thuật toán “học có giám sát” đòi hỏi dữ liệu
quá khứ của biến đầu vào và đầu ra tương ứng phải được biết trước. Khi đó, sự chênh
lệch giữa giá trị đầu ra của mô hình với giá trị thực tế sẽ là cơ sở để tiến hành điều
chỉnh tập các trọng số của mô hình mạng thần kinh sao cho mục tiêu cuối cùng là tối
thiểu hóa sai lệch giữa hai giá trị này. Ví dụ điển hình của hình thức “học có giám
sát” là thuật toán lan truyền ngược (back-propagation). Đây là thuật toán được sử
dụng phổ biến trong hầu hết các nghiên cứu về mạng thần kinh nhân tạo và cũng là
thuật toán được lựa chọn sử dụng trong bài nghiên cứu này. Do vậy, từ đây trở đi,
thuật toán huấn luyện mạng được sử dụng trong bài nghiên cứu được hiểu là thuật
toán lan truyền ngược được ứng dụng cho mạng thần kinh truyền thẳng.
Trong mô hình mạng thần kinh, mục tiêu của ta sẽ là xác định tập hợp trọng số
Ω= ω ;; γ


(đối với mô hình chỉ có một lớp ẩn) hoặc Ω = ω ; ; ρ ; ; γ

(đối

với hệ có hai lớp ẩn) sao cho tối thiểu hóa bình phương chênh lệch giữa giá trị dự báo
đầu ra và giá trị thực tế, được ký hiệu là hàm
Footer Page 22 of 126.

.


Header Page 23 of 126.

- 16 -

( ) = ∑

(



)

= f( , )
Trong đó, T là số lượng quan sát của vector biến đầu ra y, và ( ;

) đại diện cho

hệ thống mạng thần kinh.
Nguyên tắc chung là tất cả các phương pháp tối ưu hóa phi tuyến đều bắt đầu bằng

việc cho trước một tập hợp nghiệm ước đoán Ω , và tiếp theo là tìm kiếm những tập
nghiệm khác tốt hơn cho đến khi xác định được kết quả khả dĩ tốt nhất trong phạm vi
một số lần tìm kiếm hợp lý. Quá trình này sẽ được thực hiện bằng thuật toán tìm kiếm
dựa trên gradient. Vấn đề ở đây là một số ước đoán ban đầu sẽ tốt hơn so với những
giá trị khác trong quá trình xác định giá trị các hệ số tối ưu cho tiến trình dự báo. Một
số giá trị ước đoán sẽ chỉ đưa ta đến các giá trị tối ưu cục bộ. Đó chính là điểm mà
cho kết quả dự báo tốt nhất so với các điểm khác xung quanh ước đoán ban đầu. Tuy
nhiên, nếu tìm kiếm xa hơn so với giá trị ước đoán ban đầu, ta sẽ xác định được
những điểm cho kết quả dự báo tốt hơn, những giá trị tối ưu toàn cục. Thực tế là
không có giải pháp tuyệt đối cho vấn đề bị rơi vào cực trị địa phương trong quá trình
ước lượng các hệ phi tuyến và phương án duy nhất chính là không ngừng “thử và sai”
với các ước lượng ban đầu khác nhau và dựa trên kết quả có được để lựa chọn mô
hình tương đối tốt nhất.
1.2.4. Xây dựng mô hình mạng thần kinh nhân tạo.
Hầu hết các nghiên cứu về mô hình mạng thần kinh nhân tạo đều thống nhất với nhau
rằng, xây dựng mô hình mạng phù hợp để giải quyết một vấn đề cụ thể luôn là quá
trình “thử và sai” với những biến số, thông số khác nhau của mô hình. Tuy nhiên, các
nghiên cứu của Iebeling Kaastra Milton (1995), JingTao (2000) đã phát họa những
bước đi cơ bản, những nguyên tắc chung của quá trình này. Theo đó, mô hình mạng
thần kinh nhân tạo sẽ được xây dựng lần lượt theo các bước sau.
Trước hết, tương tự như mọi mô hình hồi quy truyền thống, ta cần xác định các biến
số đầu vào và đầu ra của mô hình.

Footer Page 23 of 126.


Header Page 24 of 126.

- 17 -


Tiếp đến là quá trình thu thập những dữ liệu cần thiết cho quá trình huấn luyện hệ
thống mạng và dự báo ngoài mẫu. Trong quá trình này, việc chuẩn hóa số liệu, trong
một số trường hợp là hết sức cần thiết.
Dữ liệu đã thu thập được cần phải được phân chia thành ba phần: tập các quan sát
được dùng để huấn luyện mạng, tập các quan sát được dùng để thử nghiệm lại và
cuối cùng là tập được dùng để kiểm định ngoài mẫu.
Kế đó là những vấn đề về việc lựa chọn cấu trúc của hệ thống mạng, số lớp ẩn, số nơron cho mỗi lớp ẩn…
Sau khi đã định hình được mô hình, việc quan trọng tiếp theo là tiến hành huấn luyện
mạng để xác định tập trọng số tốt nhất phản ánh mối tương quan giữa biến đầu vào và
biến đầu ra. Quá trình thử nghiệm này đòi hỏi phải so sánh hiệu quả dự báo của các
mô hình khác nhau. Điều này được thực hiện trên cơ sở các tiêu chuẩn đánh giá như
MSE, MAE…
Và cuối cùng chính là mô hình được đề xuất để ứng dụng trong thực tiễn.
1.2.4.1.

Xác định biến số cho mô hình mạng thần kinh.

Việc nhận thức được những biến số nào đóng vai trò quan trọng, có khả năng ảnh
hưởng đến biến cần được dự báo là điều kiện tiên quyết trong quy trình thiết kế mô
hình mạng thần kinh nhân tạo. Những gợi ý từ lý thuyết thuyết kinh tế về vấn đề này
sẽ rất hữu ích cho quá trình lựa chọn các biến số thích hợp cho mô hình. Tuy nhiên,
vấn đề này đôi khi bị xem nhẹ, bởi lẽ, nhiều người đã quá đề cao khả năng của mô
hình mạng thần kinh trong việc phát hiện mối quan hệ phi tuyến phức tạp vốn tồn tại
giữa các biến số mà trước đây chưa được biến đến. Vấn đề này cũng liên hệ đến một
hạn chế, mà nhiều người vốn lầm tưởng là của mô hình mạng thần kinh. Đó là việc
cho rằng những mô hình này hầu như không có sự liên kết với các lý thuyết kinh tế.
Điều này xuất phát từ một thực tế là, mô hình mạng thần kinh nhân tạo có khả năng
linh hoạt trong việc mô hình hóa mối tương quan giữa các biến số đầu vào với biến
số đầu ra, tuy nhiên lại không thể chỉ ra một cách chính xác tác động của biến phụ
thuộc lên biến độc lập là như thế nào. Thế nhưng, cần phải lưu ý rằng, các lý thuyết

kinh tế chỉ có nhiệm vụ chỉ ra khả năng tác động lẫn nhau của các biến số chứ không
đưa ra cách thức, trong trường hợp này được hiểu là dạng hàm số, của quá trình liên
kết này (Steven, 2007).
Footer Page 24 of 126.


Header Page 25 of 126.

- 18 -

Quay trở lại vấn đề lựa chọn biến số cho mô hình, một trong những điều cần lưu ý là
cân nhắc việc lựa chọn giữa các biến kỹ thuật với biến cơ bản.Các đầu vào kỹ thuật
được hiểu là các giá trị trễ của biến phụ thuộc (ví dụ như biến phụ thuộc đang ở thời
điểm t sẽ được sử dụng làm đầu vào tại thời điểm t+1) hay các chỉ báo được tính toán
từ các giá trị trễ (ví dụ như giá trị “trung bình di động giản đơn” trong t ngày). Trong
khi đó, các yếu tố đầu vào cơ bản chính là các biến kinh tế được cho là có ảnh hưởng
đến các biến phụ thuộc (ví dụ như CPI, giá trị sản lượng công nghiệp và chi tiêu
Chính phủ…sẽ có khả năng ảnh hưởng đến tăng trưởng GDP). Mô hình mạng thần
kinh đơn giản nhất thường sử dụng các giá trị trễ của các biến phụ thuộc hay hiệu số
của các biến phụ thuộc giữa hai thời điểm t và t-1 làm đầu vào. Một lối tiếp cận phổ
biến hơn là tính toán các chỉ số kỹ thuật khác nhau của giá cả trong quá khứ (và đôi
khi dựa vào khối lượng giao dịch trên thị trường giao ngay hoặc giao sau đối với
trường hợp giá của các tài sản tài chính).
Mặt khác, việc sử dụng bộ dữ liệu theo ngày, theo tuần hoặc theo năm phụ thuộc
phần nhiều vào mục tiêu của vấn đề đang nghiên cứu. Các kết quả thực nghiệm đã
chứng minh rằng việc sử dụng chuỗi dữ liệu của các khung thời gian ngắn hơn sẽ
không có giá trị trong việc nâng cao độ chính xác của kết quả dự báo. Đối với các dự
báo kinh tế về GDP, tỷ lệ thất nghiệp, hay các chỉ số kinh tế vĩ mô khác thì chuỗi dữ
liệu theo tháng hay theo quý sẽ là một sự lựa chọn thích hợp.
1.2.4.2.


Thu thập và xử lý dữ liệu.

Sau khi xác định các biến số được cho là phù hợp với mô hình, bước tiếp theo sẽ là
thu thập và xử lý dữ liệu. Chi phí của quá trình thu thập và tính sẵn có của dữ liệu là
hai vấn đền cần được quan tâm tại thời điểm này. Thông thường, các dữ liệu kỹ thuật
sẽ dễ dàng tiếp cận hơn với so với các thông tin cơ bản do phụ thuộc vào chính sách
quản lý thông tin vĩ mô của Chính phủ quốc gia đó.
Một vấn đề khác trong quá trình thu thập chuỗi dữ liệu là khả năng xuất hiện các
quan sát bị thiếu (ví dụ khả năng mất đi quan sát về giá đóng cửa của chỉ số chứng
khoán ngày t giữa hai ngày t-1 và t+1). Các quan sát bị thiếu này thường được giải
quyết bằng nhiều cách khác nhau. Phương án thứ nhất là tất cả các quan sát bị thiếu
sẽ được bỏ qua, hai là gán cho các quan sát bị thiếu đó giá trị bằng không hoặc lấy
trung bình của các quan sát gần nhất.
Footer Page 25 of 126.


×