Chuyên đề thực tập tốt nghiệp
Phạm Hoàng Lân
Lời mở đầu.
Khi xã hội ngày càng phát triển thì nhu cầu của con ngời về nghỉ ngơi,
vui chơi, giải trí ngày càng cao và du lịch đã trở thành ngành dịch vụ cung
cấp đầy đủ các nhu cầu đó cho con ngời. Xuất phát từ yêu cầu đó mà ngành
du lịch ra đời và ngày càng trở thành một nhu cầu thiết yếu đối với đời sống
con ngời.Từ khi ra đời, ngành du lịch không chỉ là ngành phục vụ mà nó còn
trở thành ngành kinh tế mũi nhọn.
Cũng nh bao quốc gia khác trên thế giới, Du lịch Việt Nam cũng trở
thành ngành kinh tế mũi nhọn của nền kinh tế. Từ khi chuyển đổi nền kinh tế
từ kế hoạch hoá tập trung sang nền kinh tế thị trờng có sự điều tiết của nhà n-
ớc theo định hớng xã hội chủ nghĩa, du lịch phát triển ngày càng mạnh mẽ
không chỉ góp phần phát triển kinh tế xã hội mà còn đáp ứng đợc yêu cầu cho
giao lu mở rộng quan hệ quốc tế. Chính vì vậy mà ngời ta còn coi du lịch là
một trong những biện pháp nhằm tăng cờng tình đoàn kết quốc tế, hiểu biết
lẫn nhau giữa các dân tộc.
Du lịch Việt Nam hình thành và phát triển đã một thời gian khá dài nh-
ng cha phát huy đợc hết khả năng vốn có của nó do ảnh hởng của rất nhiều
các nhân tố khách quan. Chiến tranh tàn phá kéo theo lệnh cấm vận của thế
lực đế quốc, khủng hoảng kinh tế, nạn dịch bệnh cùng nhiều nguyên nhân
khách quan và chủ quan khác đã kìm hãm sự phát triển của du lịch Việt
Nam.
Du lịch Việt Nam chỉ thực sự phát triển mạnh trong những năm gần
đây và tơng xứng với tiềm năng vốn có của đất nớc. Cùng với quá trình phát
triển không ngừng của thế giới về kinh tế và xã hội, Đảng và Nhà nớc ta đã
có những chính sách phát triển đúng đắn và phù hợp để phát triển du lịch, đa
du lịch trở thành ngành kinh tế mũi nhọn của đất nớc.
Cùng với quá trình đi lên của du lịch cả nớc, Thủ đô Hà nội cũng đã có
những bớc tiến quan trọng đóng góp không nhỏ vào kinh tế đất nớc. Với
những tiềm năng tài nguyên nhân văn tài nguyên thiên nhiên du lịch dồi dào
Lớp Thống kê 42
1
Chuyên đề thực tập tốt nghiệp
Phạm Hoàng Lân
Hà nội đã đợc Đảng và Nhà nớc quan tâm đề ra nhiều chính sách thuận lợi
cho phát triển du lịch. Chính vì vậy mà du lịch Hà nội trong mấy năm gần
đây đã gặt hái đợc những thành quả nhất định, số lợng khách đến thăm quan
du lịch ngày càng tăng, doanh thu du lịch không ngừng tăng đóng góp đáng
kể vào GDP của cả nớc.
Để đánh giá những thành tựu mà ngành du lịch Hà Nội đã đóng góp
vào qua trình phát triển chung của nền kinh tế đất nớc, chúng ta cần phải đi
sâu nghiên cứu quy mô, nhu cầu của thị trờng, tốc độ tăng của du lịch nhằm
xây dựng chiến lợc phát triển, định hớng chính sách hợp lý để đáp ứng yêu
cầu của khách, thu hút ngày càng nhiều du khách đến Hà Nội. Chuyên đề :
Vận dụng phơng pháp dãy số thời gian nghiên cứu biến động khách du
lịch đến Hà Nội giai đoạn 1997-2003 và dự đoán năm 2004-2005 đáp ứng
đợc phần nào việc đánh giá đợc những thành tựu, sự phát triển của du lịch Hà
Nội và sự phát triển của du lịch Hà Nội trong những năm tiếp theo.
Nội dung của chuyên đề bao gồm:
+ Chơng I: Lý luận chung về phơng pháp dãy số thời gian.
+ Chơng II: Tổng quan về hoạt động du lịch Hà nội trong những
năm gần đây và việc vận dụng phơng pháp dãy số thời gian nghiên cứu
biến động khách du lịch Hà Nội.
+ Chơng III: Vận dụng phơng pháp dãy số thời gian nghiên cứu biến
động lợng khách du lịch đến Hà Nội giai đoạn 1997-2003 và dự đoán cho
giai đoạn 2004-2005.
Trong thời gian nghiên cứu và viết chuyên đề này em đã đợc sự hớng
dẫn nhiệt tình của các cô các thầy Khoa Thống kê, đặc biệt là TS. Trần Kim
Thu ngời trực tiếp hớng dẫn, chỉ bảo. Ngoài sự giúp đỡ của Khoa Thống kê,
em còn đợc các chú, các anh chị công tác tại Phòng Thơng mại-Cục Thống
kê Hà Nội tạo điều kiện giúp đỡ em đợc tiếp xúc với thực tế công việc và
nguồn số liệu cho chuyên đề này trong thời gian thực tập để em hoàn thành
chuyên đề này.
Lớp Thống kê 42
2
Chuyên đề thực tập tốt nghiệp
Phạm Hoàng Lân
Em xin chân thành cảm ơn sự nhiệt tình giúp đỡ chỉ bảo của TS.Trần
Kim Thu và các chú, các anh chị phòng Thơng mại đã giúp đỡ em trong quá
trình nghiên cứu hoàn thành chuyên đề và em mong đợc lợng thứ và chỉ bảo
của thầy cô cùng các chú, các anh chị phòng Thơng mại cho những điều còn
sai sót, hạn chế em mắc phải trong chuyên đề này.
Lớp Thống kê 42
3
Chuyên đề thực tập tốt nghiệp
Phạm Hoàng Lân
Chơng I:
Lý Luận chung về phơng pháp dãy số thời gian .
I. Những vấn đề chung về phơng pháp dãy số thời gian.
1. Khái niệm chung về dãy số thời gian.
Mặt lợng của mọi sự vật hiện tợng thờng xuyên có sự biến động qua thời
gian. Trong thống kê, để nghiên cứu sự biến động này, ngời ta thờng dựa vào
dãy số thời gian.
Dãy số thời gian là dãy các trị số của chỉ tiêu thống kê đợc sắp xếp theo
thời gian.
Qua dãy số thời gian có thể nghiên cứu các đặc điểm về sự biến động
của hiện tợng, từ đó giúp ta vạch rõ xu hớng và tính quy luật của sự phát
triển, đồng thời để đự đoán các mức độ của hiện tơng trong tơng lai.
Mỗi dãy số thời gian đợc cấu tạo bởi hai thành phần là thời gian và chỉ
tiêu về hiện tợng đợc nghiên cứu. Thời gian có thể là ngày, tuần, tháng, qúy,
năm. Độ dài giữa hai thời gian liền nhau đợc gọi là khoảng cách thời gian.
Chỉ tiêu về hiện tợng đợc nghiên cứu có thể là số tuyệt đối, số tơng đối, số
bình quân. Trị số của chỉ tiêu gọi là mức độ của dãy số.
Căn cứ vào đặc điểm tồn tại về quy mô của hiện tợng qua thời gian có
thể phân biệt dãy số thời kỳ và dãy số thời điểm. Dãy số thời kỳ biểu hiện
quy mô (khối lợng) của hiện tợng trong từng khoảng thời gian nhất định.
Trong dãy số thời kỳ các mức độ là những số tuyệt đối thời kỳ, do đó độ dài
của khoảng cách thời gian ảnh hởng trực tiếp đến trị số của chỉ tiêu và có thể
cộng các trị số của chỉ tiêu để phản ánh quy mô của hiện tợng trong những
khoảng thời gian dài hơn.
Dãy số thời điểm biểu hiện quy mô (khối lợng) của hiện tợng tại những
thời điểm nhất định. Mức độ của hiện tợng ở thời điểm sau thờng bao gồm
toàn bộ hoặc một bộ phận mức độ mức độ của hiện tợng ở thời điểm trớc đó.
Vì vậy việc cộng các trị số của chỉ tiêu không phản ánh quy mô của hiện t-
ợng.
Lớp Thống kê 42
4
Chuyên đề thực tập tốt nghiệp
Phạm Hoàng Lân
Yêu cầu cơ bản khi xây dựng một dãy số thời gian là phải đảm bảo tính
chất có thể so sánh đợc giữa các mức độ trong dãy số. Muốn vậy thì nội dung
và phơng pháp tính toán chỉ tiêu qua thời gian phải thống nhất, phạm vi hiện
tợng nghiên cứu trớc sau phải nhất trí, các khoảng cách thời gian trong dãy số
nên bằng nhau (nhất là đối với dãy số thời kỳ).
Trong thực tế do những nguyên nhân khác nhau các yêu cầu trên có
thể bị vi phạm , khi đó đòi hỏi phải có sự chỉnh lý thích hợp để tiến hành
phân tích.
2. Các chỉ tiêu phân tích dãy số thời gian.
Để phản ánh dặc điểm biến động qua thời gian của hiện tợng đợc
nghiên cứu ngời ta thờng sử dụng các chỉ tiêu sau:
2.1 Mức độ bình quân theo thời gian:
Chỉ tiêu này phản ánh mức độ đại biểu cho tất cả các mức độ tuyệt đối
trong một dãy số thời gian. Việc tính chỉ tiêu này phải phụ thuộc vào dãy số
thời gian, đó là dãy số thời điểm hay dãy số thời kỳ.
Đối với dãy số thời kỳ, mức độ bình quân theo thời gian đợc tính theo
công thức sau.
y
=
n
yyy
n
+++ ....
21
=
n
y
n
i
i
=
1
Trong đó:
i
y
(i =
n,1
) các mức độ của dãy số thời kỳ.
n : số lợng các mức độ trong dãy số.
Đối với dãy số thời điểm có khoảng cách thời gian bằng nhau, chúng ta áp
dụng công thức:
y
=
1
2
....
2
2
1
+++
n
y
y
y
n
Trong đó:
i
y
(i =
n,1
) các mức độ của dãy số thời điểm có khoảng
cách thời gian bằng nhau
Đối với dãy số thời điểm có khoảng cách thời gian bằng nhau công thức áp
dụng là:
Lớp Thống kê 42
5
Chuyên đề thực tập tốt nghiệp
Phạm Hoàng Lân
y
=
n
nn
ttt
tytyty
+++
+++
...
....
21
2211
=
=
=
n
i
i
n
i
ii
t
ty
1
1
Trong đó:
i
y
(i =
n,1
) các mức độ của dãy số thời điểm có khoảng
cách thời gin không bằng nhau.
i
t
(i =
n,1
) độ dài thời gian có mức độ
2.2 Lợng tăng (giảm) tuyệt đối:
Chỉ tiêu này phản ánh sự thay đổi về trị số tyuệt đối của chỉ tiêu trong
dãy số giữa hai thời điểm nghiên cứu. Nếu mức độ của hiện tợng tăng thì trị
số của chỉ tiêu mang dấu (+) và ngợc lại mang dấu (-).
Tùy theo mục đích nghiên cứu, chúng ta có lợng tăng (giảm) tuyệt đối
liên hoàn, định gốc hay bình quân.
Lợng tăng (giảm) tuyệt đối liên hoàn phản ánh mức chênh lệch tuyệt đối
giữa mức độ kỳ nghiên cứu (
i
y
) và mức độ kỳ trớc đó (
1
i
y
)
Công thức:
i
=
i
y
-
1
i
y
(i =
n,2
)
Trong đó:
i
Lợng tăng (giảm) tuyệt đối liên hoàn.
n : Số lợng mức độ trong dãy số.
Lợng tăng (giảm) tuyệt đối định gốc là mức chênh lệch tuyệt đối giữa mức dộ
kỳ nghiên cứu (
i
y
) và mức độ của một kỳ đợc chọn làm kỳ gốc, thông thờng
mức độ kỳ gốc là mức độ đầu tiên trong dãy số (
i
y
). Chỉ tiêu này phản ánh
mức tăng giảm tuyệt đối trong những khoảng thời gian dài.
Gọi
i
là lợng tăng giảm tuyệt đối định gốc,ta có:
i
=
i
y
-
1
y
(i =
n,2
)
Giữa lợng tăng (giảm) tuyệt đối liên hoàn và lợng tăng (giảm) tuyệt đối
định gốc có mối liên hệ đợc xác dịnh theo công thức sau:
i
=
i
(i =
n,2
)
Công thức này cho thấy lợng tăng (giảm) tuyệt đối định gốc bằng tổng
đại số các lợng tăng (giảm) tuyệt đối liên hoàn.
Lớp Thống kê 42
6
Chuyên đề thực tập tốt nghiệp
Phạm Hoàng Lân
Công thức:
n
=
=
n
i
i
2
Lợng tăng (giảm) tuyệt đối bình quân là mức bình quân công của các l-
ợng tăng (giảm) tuyệt đối liên hoàn.
Nếu ký hiệu
là lợng tăng giảm tuyệt đối bình quân, ta có công thức:
=
1
2
=
n
n
i
i
=
1
n
n
=
1
1
n
yy
n
Lợng tăng (giảm) tuyệt đối bình quân không có nghĩa khi các mức độ
của dãy không có xu hớng (cùng tăng hoặc cùng giảm) vì hai xu hớng trái
ngợc nhau tiêu sẽ tiêu diệt lẫn nhau làm sai lệch bản chất của hiện tợng.
2.3 Tốc độ phát triển.
Tốc độ phát triển là số tơng đối phản ánh tốc độ và xu hớng phát triển
của hiện tợng theo thời gian.
Có các loại tốc độ phát triển sau:
a. Tốc độ phát triển định gốc (
i
T
).
Phản ánh sự phát triển của hiện tợng trong những khoảng thời gian dài.
Chỉ tiêu này đợc xác định bằng cách lấy mức độ kỳ nghiên cứu (
i
y
) chia cho
mức độ của một kỳ đợc chọn làm kỳ gốc, thờng là mức độ đầu tiên trong dãy
số (
1
y
).
Công thức:
i
T
=
1
y
y
i
(i =
n,2
)
Tốc độ phát triển định gốc đợc tính theo số lần hay %
b. Tốc độ phát triển liên hoàn.
Tốc độ phát triển liên hoàn phản (
i
t
) ánh sự phát triển của hiện tợng
giữa hai thời gian liền nhau.
Công thức:
i
t
=
1
i
i
y
y
(i =
n,2
)
i
t
đợc tính theo số lần hay %.
Lớp Thống kê 42
7
Chuyên đề thực tập tốt nghiệp
Phạm Hoàng Lân
Giữa tốc độ phát triển liên hoàn và tốc độ phát triển định gốc có mối
liên hệ sau:
- Thứ nhất, tích các tốc độ phát triển liên hoàn bằng tốc độ phát triển
định gốc.
ii
Tt
=
(i =
n,2
)
Thứ hai, thơng của hai tốc độ phát triển định gốc liền nhau bằng tốc độ
phát triển liên hoàn giữa hai thời gian liền đó.
i
t
=
1
i
i
T
T
(i =
n,2
)
c. Tốc độ phát triển bình quân.
Tốc độ phát triển bình quân là số bình quân nhân của các tốc độ phát
triển liên hoàn, phản ánh tốc độ phát triển đại diện cho các tốc độ phát triển
liên hoàn trong một thời kỳ nào đó.
Gọi
t
là tốc độ phát triển bình quân ta có công thức:
t
=
1
2
1
32
....
=
=
n
n
i
i
n
n
tttt
hay
t
=
1
1
1
=
n
n
n
n
y
y
T
Với tốc độ phát triển bình quân chỉ sử dụng khi dãy số có cùng xu hớng.
Lớp Thống kê 42
8
Chuyên đề thực tập tốt nghiệp
Phạm Hoàng Lân
2.4 Tốc độ tăng (giảm).
Chỉ tiêu này phản ánh mức độ của hiện tợng nghiên cứu giữa hai thời
gian đã tăng (+) hoặc giảm (-), bao nhiêu lần (hoặc bao nhiêu phần trăm). T-
ơng ứng với mỗi tốc độ phát triển, chúng ta cố các mức độ tăng giảm sau:
a. Tốc độ tăng giảm liên hoàn.
Phản ánh sự biến động tăng (giảm) giữa hai thời kỳ liền nhau, là tỷ số
giữa lợng tăng (giảm) liên hoàn kỳ nghiên cứu (
i
)với mức độ kỳ liền trớc
trong dãy số thời gian (
1
i
y
).
Gọi
i
a
là tốc độ tăng (giảm) liên hoàn ta có công thức:
1
1
1
==
i
ii
i
i
i
y
yy
y
a
(i =
n,2
)
Hay:
i
a
=
1
i
t
( nếu tính theo đơn vị lần)
i
a
=
100
i
t
(nếu tính theo đơn vị %)
b. Tốc độ tăng (giảm) định gốc.
Tốc độ tăng giảm định gốc là tỷ số giữa lợng tăng (giảm) định gốc kỳ
nghiên cứu (
i
) với mức độ kỳ gốc, thờng là mức độ đầu tiên trong dãy số (
i
y
).
Công thức:
%)100(1
1
1
1
=
=
=
i
ii
i
T
y
yy
y
A
Trong đó:
i
A
Tốc độ tăng (giảm) định gốc có thể đợc tính theo số
lần hay %
c. Tốc độ tăng (giảm) bình quân.
Tốc độ tăng (giảm) bình quân là số tơng đối phản ánh tốc độ tăng
(giảm) đại diện cho các tốc độ tăng (giảm) liên hoàn trong cả thời kỳ nghiên
cứu.
Nếu ký hiệu
a
là tốc độ tăng giảm bình quân ta có:
a
=
t
-1 (nếu tính theo số lần)
a
=
100
t
(nếu tính theo%)
Do tốc độ tăng (giảm) bình quân đợc tính theo tốc độ phát triển bình
quân nên nó có hạn chế khi áp dụng giống tốc độ phát triển bình quân
Lớp Thống kê 42
9
Chuyên đề thực tập tốt nghiệp
Phạm Hoàng Lân
2.5 Giá trị tuyệt đối của 1 % tăng (giảm).
Chỉ tiêu này phản ánh cứ 1% tăng (giảm) của tốc độ tăng (giảm) liên
hoàn thì tơng ứng với một trị số tuyệt đối là bao nhiêu.
Giá trị tuyệt đối của 1% tăng giảm đợc xác định theo công thức:
i
i
i
a
g
=
(i =
n,2
)
Trong đó:
i
g
Giá trị tuyệt đối của 1% tăng (giảm).
i
a
tốc độ tăng (giảm) liên hoàn tính theo đơn vị %
i
g
còn có thể đợc tính theo công thức sau:
100
1
=
i
i
y
g
(i =
n,2
)
Trên thực tế thờng không sử dụng giá trị tuyệt đối của 1% tăng giảm
định gốc vì nó luôn là một hằng số.
3. Một số phơng pháp biểu hiện xu hớng biến động cơ bản của hiện tợng
Mọi sự vật hiện tợng luôn luôn có sự vận động và biến đổi theo thời
gian. Sự biến động của hiện tợng qua thời gian chịu sự tác động của nhiều
nhân tố. Ngòai các nhân tố chủ yếu, cơ bản quyết định xu hớng biến động
của hiện tợng, còn có các nhân tố ngẫu nhiên gây ra những sai lệch khỏi xu
hớng. Xu hớng thờng đợc hiểu là chiều hớng tiến triển chung nào đó, một sự
tiến triển kéo dài theo thời gian, xác định tính quy luật, biến động của hiện t-
ợng theo thời gian.
Việc xác định xu hớng biến động cơ bản của hiện tợng có ý nghĩa
quan trọng trong nghiên cứu thống kê. vì vậy cần sử dụng những phơng pháp
thích hợp, trong một chừng mực nhất định, loại bỏ tác động của những nhân
tố ngẫu nhiên để nêu lên xu hớng và tính quy luật về sự biến động của hiện t-
ợng
3.1. Phơng pháp mở rộng khoảng cách thời gian.
Phơng pháp này đợc sử dụng khi một dãy số thời kỳ có khoảng cách
thời gian tơng đối ngắn và có nhiều mức độ mà qua đó cha phản ánh đợc xu
hớng biến động của hiện tợng.
Lớp Thống kê 42
10
Chuyên đề thực tập tốt nghiệp
Phạm Hoàng Lân
Do khoảng cách thời gian đợc mở rộng ( chẳng hạn từ tháng sang
qúy) nên trong những mức độ của dãy số mới thì sự tác động của các nhân tố
ngẫu nhiên (với chiều hớng khác nhau) phần nào đã đợc bù trừ (triệt tiêu) Và
do đó cho ta thấy rõ xu hớng biến động.
Tuy nhiên phơng pháp mở rộng khoảng cách thời gian còn có một số
nhợc điểm nhất định.
+ Phơng pháp này chỉ áp dụng đối với dãy số thời kỳ vì nếu áp dụng
cho dãy số thời điểm thì các mức độ trên vô nghĩa
+ Chỉ nên áp dụng cho dãy số tơng đối dài và cha bộc lộ rõ xu hớng
biến động của hiện tợng vì sau khi mở rộng khoảng cách thời gian, số lợng
các mức độ trong dãy số giảm đi rất nhiều.
3.2. Phơng pháp hồi quy trong dãy số thời gian.
Hồi quy là phơng pháp của toán học đợc vận dụng trong thống kê để
biểu hiện xu hớng biến động cơ bản của hiện tợng theo thời gian. Những biến
động này có nhiều dao động ngẫu nhiên và mức độ tăng giảm thì thất thờng.
Nội dung của phơng pháp hồi quy trong dãy số thời gian là căn cứ vào
các đặc điểm biến động trong dãy số, dùng phơng trình toán học xác định
trên đồ thị một đờng xu thế lý thuyết thay cho đờng gấp khúc thực tế để biểu
hiện xu thế biến động cơ bản của hiện tợng. Đờng này đợc xác định bằng một
hàm số gọi là hàm xu thế. Có nhiều dạng hàm xu thế tùy thuộc vào hiện tợng
kinh tế xã hội cần nghiên cứu và đặc điểm biến động của nó.
Phơng pháp chọn mô hình hồi quy bao gồm dùng đồ thị, dùng sai
phân, dùng phơng pháp bình phơng nhỏ nhất hay phơng pháp điểm chọn
tùy thuộc vào đặc điểm số liệu và điều kiện nghiên cứu.
Tóm lại hàm xu thế là hàm đặc trng cho xu hớng biến động cơ bản của
hiện tợng. Từ đó, qua việc xây dựng hàm xu thế, chúng ta có thể dự đoán đợc
các mức độ có thể có trong tơng lai.
Hàm xu thế tổng quát có dạng:
),...,,(
1 not
aaatfy
=
Trong đó:
Lớp Thống kê 42
11
Chuyên đề thực tập tốt nghiệp
Phạm Hoàng Lân
t
y
: Mức độ lý thuyết
a
o
, a
1
, ,a
n
: Các tham số
t: Thứ tự thời gian.
Để lựa chọn đúng đắn dạng phơng trình hồi quy đòi hỏi phải dựa vào
sự phân tích đặc điểm biến động của hiện tợng qua thời gian, đồng thời kết
hợp với một số phơng pháp đơn giản khác (Dựa vào đồ thị, dựa vào độ tăng
giảm tuyệt đối, tốc độ phát triển ).
Các tham số a
i
(i=1,2,3, n) th ờng đợc xác định bằng phơng pháp bình
phơng nhỏ nhất:
min)(
2
=
tt
yy
Do sự biến động của hiện tợng là vô cùng đa dạng nên cần có các hàm
xu thế tơng ứng sao cho sự mô tả là gần đúng nhất so với xu hớng biến động
thực tế của hiện tợng.
Một số hàm xu thế thờng gặp là:
a. Hàm xu thế tuyến tính:
taay
ot
*
1
+=
Phơng trình đợc thẳng đợc sử dụng khi các lợng tăng hoặc giảm tuyệt
đối liên hoàn
i
( còn gọi là sai phân bậc 1) xấp xỉ nhau.
áp dụng phơng pháp bình phơng nhỏ nhất sẽ có hệ phơng trình sau đây
để xác định tham số a
o
, a
1
:
+=
+=
2
1
1
tataty
tanay
o
o
b. Hàm xu thế parabol bậc 2 :
2
21
tataay
ot
++=
Phơng trình parabol bậc 2 đợc sử dụng khi sai phân bậc 2 ( tức là sai
phân của sai phân bậc 1) xấp xỉ nhau.
Các tham số a
o
,a
1
,a
2
đợc xác định bởi hệ phơng trình sau:
Lớp Thống kê 42
12
Chuyên đề thực tập tốt nghiệp
Phạm Hoàng Lân
++=
++=
++=
4
2
3
1
22
3
3
2
2
2
21
tatatayt
tatataty
tatanay
o
o
o
c. Ph ơng trình hàm mũ:
t
ot
aay
1
*
=
Phơng trình hàm mũ đợc sử dụng khi các tốc độ phát triển liên hoàn xấp
xỉ bằng nhau.
Các tham số a
o
,a
1
đợc xác định bằng phơng trình sau:
+=
+=
2
1
1
lglglg
lglglg
tatayt
taany
o
o
3.3. Phơng pháp dãy số trung bình trợt ( di động)
Số trung bình trợt ( còn gọi là số trung bình di động) là số trung bình
cộng của một nhóm nhất định các mức độ của dãy số đợc tính bằng cách lần
lợt loại dần các mức độ đầu, đồng thời thêm vào các mức độ tiếp theo sao cho
tổng số lợng các mức độ tham gia tính số trung bình không thay đổi.
Giả sử có dãy số thời gian : y
1
,y
2
,y
3
,...,y
n-2,
,y
n-1
,y
n
.
Nếu tính trung bình trợt cho nhóm 3 mức độ ta sẽ có :
3
321
2
yyy
y
++
=
3
432
3
yyy
y
++
=
3
12
1
nnn
n
yyy
y
++
=
Từ đó ta có một dãy số mới gồm các số trung bình trợt
132
,...,,
n
yyy
.
Việc lựa chọn nhóm bao nhiêu mức độ để tính trung bình trợt đòi hỏi
phải dựa vào đặc điểm biến động của hiện tợng và số lợng các mức độ của
dãy số thời gian. Nếu sự biến động của hiện tợng tơng đối đều đặn nhau và
Lớp Thống kê 42
13
Chuyên đề thực tập tốt nghiệp
Phạm Hoàng Lân
số lợng mức độ không nhiều thì có thể tính trung bình trợt từ 3 mức độ. Nếu
sự biến động của hiện tợng lớn và dãy số có nhiều mức độ thì có thể tính
trung bình trợt từ 5 hoặc 7 mức độ. Trung bình trợt càng đợc tính từ nhiều
mức độ thì càng có tác dụng san bằng ảnh hởng của các nhân tố ngẫu nhiên.
Nhng mặt khác lại làm giảm số lợng các mức độ của dãy trung bình trợt.
3.4 Phơng pháp biểu hiện biến động thời vụ.
Sự biến động của một số hiện tợng kinh tế xã hội thờng có tính thời vụ,
nghĩa là hàng năm, trong từng thời gian nhất định sự biến động lặp đi lặp lại.
Sự biến động thời vụ làm cho hoạt động của một số ngành khi thì căng
thẳng , khẩn trơng, lúc thì nhàn rỗi , bị thu hẹp lại.
Nghiên cứu biến động thời vụ nhằm đề ra những chủ trơng biện pháp
phù hợp, kịp thời, hạn chế những ảnh hởng của biến động thời vụ đối với sản
xuất và sinh hoạt của xã hội.
Nhiệm vụ của nghiên cứu thống kê là dựa vào số liệu của nhiều năm
(ít nhất là 3 năm) để xác định tính chất và mức độ của biến động thời vụ. Ph-
ơng pháp thờng đợc sử dụng là tính các chỉ số thời vụ. Trờng hợp biến động
thời vụ qua những thời gian nhất định của các năm tơng đối ổn định, không
có hiện tợng tăng hoặc giảm rõ rệt, thì chỉ số thời vụ đợc tính theo công thức
sau đây:
100*
o
i
i
y
y
=
Trong đó:
I
i
: Chỉ số thời vụ của thời gian t
i
y
: Số trung bình các mức độ của thời gian cùng tên
o
y
: Số trung bình của tất cả các mức độ trong dãy số
Trờng hợp biến động thời vụ qua những thời gian nhất định của các
năm có sự tăng hoặc giảm rõ rệt thì chỉ số thời vụ đựơc tính theo công thức
sau đây:
100*
1
n
y
y
n
j
ij
ij
i
=
=
Lớp Thống kê 42
14
Chuyên đề thực tập tốt nghiệp
Phạm Hoàng Lân
Trong đó:
ij
y
: Mức độ thực tế ở thời gian i của năm j
ij
y
: Mức độ tính toán ( có thể là số trung bình trợt hoặc dựa
vào phơng trình hồi quy ở thời gian i của năm thứ j )
3.5 Phơng pháp phân tích thành phần của dãy số thời gian.
Thông thờng dãy số thời gian đợc chia thành 3 thành phần cơ bản để
tiện cho việc nghiên cứu.
+ Thành phần xu thế (f
t
) Thành phần này phản ánh xu hớng biến động
cơ bản của hiện tợng kéo dài theo thời gian
+ Thành phần biến động chu kỳ, mùa vụ (s
t
) nói lên sự biến động lặp
đi lặp lại trong khoảng thời gian nhất định trong năm.
- Thành phần biến động ngẫu nhiên(
t
) phản ánh ảnh hởng của các
nhân tố ngẫu nhiên lên sự biến động của hiện tợng thời gian.
Ba thành phần có thể đợc kết hợp với nhau theo hai dạng cơ bản, tùy mối
quan hệ giữa chúng:
+ Dạng cộng, nói lên mối quan hệ tổng giữa chúng. Dạng này phù hợp
với sự thaqy đổi mùa vụ có biến động nhỏ hoặc không đổi.
tttt
sfy
++=
+ Dạng nhân tơng ứng với mối quan hệ tích. Dạng nhân phù hợp với
biến động mùa vụ có mức độ biến đổi tăng dần. Khi đó:
y
t
=f
t
*s
t
+
t
Để phân tích các thành phần của dãy số thời gian ngời ta dùng bảng
BUYS BALOT
Giả sử hàm xu thế có dạng hàm tuyến tính: f
t
=a+bt
Đặt
tt
CS
=
(i=
m,1
)
Với mối quan hệ tổng ta có:
ttt
Cbtay
+++=
Thông thờng,thành phần biến động ngẫu nhiên
t
là nhỏ và ta có thể
coi nó bằng 0 để thuận tiện cho việc nghiên cứu. Khi đó:
tt
Cbtay
++=
Lớp Thống kê 42
15
Chuyên đề thực tập tốt nghiệp
Phạm Hoàng Lân
Các tham số a, b và thành phần biến động mùa vụ, chu kỳ C
i
đợc tính
theo các công thức sau:
+
=
+
=
= ==
n
j
m
i
ij
n
j
j
y
m
n
yj
nmn
T
m
n
m
S
nmn
b
1 11
22
2
1
*
)1(
12
2
1
)1(
12
2
1
2
1
2
1
1 1
+
=
+
=
=
= =
mn
b
mn
y
mn
b
mn
Tmn
bya
n
j
m
i
ij
+
=
+
=
2
1
2
1 m
ibyy
m
ib
mn
T
n
T
C
i
i
+
==
= ==
2
1
1 11
m
ib
mn
y
n
y
n
j
m
i
ij
n
j
ij
Trong đó:
=
=
n
j
iji
yT
1
( )
mi ,1
=
: Tổng lợng biến các kỳ cùng tên i qua các năm
=
=
m
i
ijj
yT
1
( )
nj ,1
=
: Tổng lợng biến các kỳ trong năm j
= = ==
===
n
j
n
j
m
i
ijj
m
i
i
yTTT
1 1 11
: Tổng lợng biến các kỳ của các năm
=
==
m
i
ij
n
j
j
yjjTS
11
tổng các tích số giữa tổng lợng biến của các kỳ
trong năm j với thứ tự năm tơng ứng.
n
y
n
T
y
m
i
ij
i
i
=
==
1
( )
mi ,1
=
bình quân các lợng biến của các kỳ cùng tên i qua
các năm.
m
y
m
T
y
m
j
ij
j
j
=
==
1
( )
ni ,1
=
bình quân các lợng biến theo năm.
mn
y
mn
T
y
n
j
m
i
ij
j
= =
==
1 1
bình quân tất cả các lợng biến của các kỳ của các năm.
Lớp Thống kê 42
16
Chuyên đề thực tập tốt nghiệp
Phạm Hoàng Lân
Với : i:
( )
mi ,1
=
số kỳ trong năm (tháng, qúy, )
j:
( )
ni ,1
=
số năm trong dãy số.
Kỳ(i)
Năm(j)
1 . .. i . .. M
=
=
m
i
ijj
yT
1
m
T
y
j
j
=
j
Tj *
1
11
y
.. .
i
y
1
.. .
m
y
1
1
T
1
y
1
*1 T
.. . .. . .. . .. . .. . .. . .. . .. .
j
1j
y
ij
y
jm
y
j
T
j
y
j
Tj *
.. . .. . .. . .. . .. . .. . .. . .. . .. .
N
1n
y
.. .
ni
y
.. .
nm
y
n
T
n
y
n
Tn *
=
=
n
j
iji
yT
1
1
T
.. .
i
T
.. .
m
T
= =
=
n
j
m
i
ij
yT
1 1
=
=
n
j
j
TjS
1
*
n
T
y
i
i
=
1
y
...
i
y
.. .
m
y
mn
T
y
=
4. Tơng quan trong dãy số thời gian.
4.1 Tự hồi quy tơng quan.
Trong nhiều dẫy số thời gian, mức độ ở một thời gian nào đó có sự phụ
thuộc vào các mức độ ở các thời gian trớc đó. Sự phụ thuộc này gọi là tự tơng
quan.
Việc nghiên cứu tự hồi quy và tự tơng quan cho phép xác định những đặc
điểm của quá trình biến động qua thời gian phân tích mối liên hệ giữa các
dẫy số thời gian và đặc biệt đợc sử dụng trong một số phơng pháp dự đoán
thống kê.
Nghiên cứu tự hồi quy và tự tơng quan giải quyết hai nhiệm vụ chủ yếu
sau đây:
+ Thứ nhất, tìm phơng trình phản ứng sự phụ thuộc giữa các mức độ trong
dẫy số thời gian gọi là phơnh trình tự hồi quy .
Phơng trình tự hồi quy tổng quát có dạng:
Lớp Thống kê 42
17
Chuyên đề thực tập tốt nghiệp
Phạm Hoàng Lân
ktt
yaay
+=
10
k=1 phơng trình tự hồi quy bậc 1:
110
+=
tt
YaaY
k=2 phơng trình tự hồi quy bậc 2:
210
+=
tt
YaaY
+ Thứ hai, đánh giá mức độ chặt chẽ của sự phụ thuộc bằng hệ số tự t-
ơng quoan :
t
kt
ktt
y
y
yy
kttktt
k
a
YYYY
r
=
=
1
Các tham số của phơng trình tự hồi quy, hệ số tơng quan đợc tính theo
phơng pháp đã trình bầy ở chơng Hồi quy tơng quan
4.2 Tơng quan giữa các dãy số thời gian.
Mối liên hệ giữa các hiện tợng không những đợc biểu hiện qua không gian
mà còn đợc biểu hiện qua thời gian.
Để xác định đúng đắn mối liên hệ tơng quan giữa các hiện tợng đợc
biểu hiện qua các dẫy số thời gian, đòi hỏi trong từng dẫy số thowif gian
không tồn tại tự tơng quan. Nhng trong thực tế, tự tơng quan là một hiện tợng
thờng gặp. Để phần nào loại bỏ ảnh hởng của tự tơng quan có thể sử dụng
một số phơng pháp đơn giản và thuờng đợc sử dụng là nghiên cứu tơng quan
giữa các độ lệch.
Giả sử có hai dãy số thời gian là :
t
X
và
t
Y
với su thế từng dẫy là
t
X
và
t
Y
. Các độ lệch là :
ttx
XXd
t
=
tty
YYd
t
=
Trong đó :
t
x
d
: Độ lệch chuẩn giữa mức độ thực tế và mức độ lý
thuyết của dẫn
t
X
t
y
d
: Độ lệch chuẩn giữa mức độ thực tế và mức độ lý
thuyết của dẫy
t
Y
Hệ số tơng quan giữa các độ lệch đợc tính theo công thức :
Lớp Thống kê 42
18
Chuyên đề thực tập tốt nghiệp
Phạm Hoàng Lân
=
22
.
.
tt
tt
yx
yx
dd
dd
r
r càng gần 1 thì sự tơng quan giữa hai dẫy số càng chặt chẽ.
r mang dấu (-) thì đây là mối liên hệ tơng quan thuận,
r mang dấu (+) thì đây là mối liên hệ tơng quan nghịch .
Ngoài ra, để khắc phục ảnh hơng của sự tơng quan, ngời ta thờng đ-
a yếu tố thời gian vào phơng trìng hồi quy :
XaaY
x 10
+=
Sau khi đa yếu tố thời gian t vào phơng trình hồi quy trên ta có :
taXaaY
x 210
++=
Các tham số đợc xác định bằng phơng pháp bình phơng nhỏ nhất : Nh
trên đã trình bầy.
Lớp Thống kê 42
19
Chuyên đề thực tập tốt nghiệp
Phạm Hoàng Lân
II. Một số phơng pháp dự đoán thống kê ngắn
hạn trên cơ sở dãy số thời gian.
1. Khái niệm
- Dự đoán thống kê ngắn hạn là việc dự đoán quá trình tiếp theo của
hiện tợng trong những khoảng thời gian tơng đối ngắn, nối tiếp với hiện tại
bằng việc sử dụng những thông tin thống kê và áp dụng các phơng pháp thích
hợp .
- Dự đoán thống kê ngắn hạn có thể đợc thực hiện với khoảng thời gian
(còn gọi là tầm dự đoán ) ngày, tuần, tháng, qúy, năm. Kết quả của dự đoán
thống kê ngắn hạn là căn cứ để tiến hành điều chỉnh kịp thời các hoạt động
soản xuất kinh doanh, là cơ sở để đa ra các quyết định kịp thời và hữu hiệu.
- Trong việc sử dụng dẫy số thời gian để tiến hành dự đoán thống kê
ngắn hạn thì ngoài yêu cầu cơ bản là tài liệu phải chính xác, phải đảm bảo
tính chất có thể so sánh đợc giữa các mức độ trong dãy số thì còn một vấn đề
nữa cần quan tâm là số lợng các mức độ của đẫy số là bao nhiêu
- Nếu một dãy số thời gan có quá nhiều các mức độ đợc sử dụng sẽ
làm cho mô hình dự đoán không phản ánh đợc đầy đủ sự thay đổi của các
nhân tố mới đối với sự biến động của hiện tợng. Ngợc lại, nếu chỉ sử dụng
một số ít các mức độ ở những thời gian cuối thì không chú ý đến tính chất t-
ơng đối ổn định của các nhân tố cơ bản tác động đến hiện tợng. Do đó cần
phải phân tích đặc điểm biến động của hiện tợng để xác định số lợng các mức
độ của dẫy số thời gian dùng để dự đoán thống kê ngắn hạn .
2. Một số phơng pháp dự đoán thống kê ngắn hạn
2.1 . Ngoại suy bằng các mức độ bình quân :
Phơng pháp này đợc sử dụng khi dẫy số thời gian không dài và không
phải xây dựng với các dự doán khoảng. Vì vậy, độ chính xác theo phơng
pháp này không cao. Tuy nhiên, phơng pháp đơn giản tính nhanh nên vẫn đợc
dùng.
Có các loại ngoại suy theo các mức độ bình quân theo thời gian:
Lớp Thống kê 42
20
Chuyên đề thực tập tốt nghiệp
Phạm Hoàng Lân
a. Ngoại suy bằng mức độ bình quân theo thời gian:
Phơng pháp này đợc sử dụng khi các mức độ trong giãy số thời gian
không có xu hớng biến động rõ rệt(biến động không đáng kể).
Mô hình dự đoán
yy
Ln
=
+
Với:
n
y
y
n
i
i
=
=
1
Trong đó:
y
: mức độ bình quân theo thời gian
n: Số mức độ trong dãy số
L: Tầm xa của dự đoán
Ln
y
+
: Mức độ dự đoán ở thời gian (n+L)
b. Ngoại suy bằng l ợng tăng (giảm) tuyệt đối bình quân:
Phơng pháp này đợc áp dụng trong trờng hợp dãy số thời gian có các l-
ơng tăng (giảm) tuyệt đối liên hoàn sấp xỉ nhau. Ngiã là các mức độ trong
dãy số tăng cấp số cộng theo thời gian.
Mô hình dự đoán:
Lyy
nLn
.
+=
+
Với
111
11
=
=
=
=
nn
yy
n
nn
n
i
i
Trong đó:
:
n
y
Mức độ cuối cùng của dãy số thời gian.
),1(
niy
i
=
: Lợng tăng (giảm) tuyệt đối liên hoàn
c. Ngoại suy bằng tốc độ phát triển bình quân:
Đây là phơng pháp đợc áp dụng khi dãy số thời gian có các tốc độ phát
triển liên hoàn sấp xỉ nhau. Ngiã là, các mức độ tăng cấp số nhân theo thời
gian.
Lớp Thống kê 42
21
Chuyên đề thực tập tốt nghiệp
Phạm Hoàng Lân
Với t là tốc độ phát triển bình quân, ta có mô hình dự đoán theo năm:
L
nLn
tyy ).(
=
+
Nếu dự đoán cho những khoảng thời gian dới một năm(tháng , qúy ,
mùa...) thì:
Lnj
s
t
yy
t
j
iij
+=
=
1
)(
.
Trong đó:
ij
y
: Mức độ dự đoán ở kỳ thứ i (i=1,m) của năm j.
i
Y
: Tổng các mức độ của các kỳ cùng tên i.
=
=
n
j
iji
yY
1
(i=1,m)
ij
y
: Mức độ thực tế kỳ thứ i của năm j
12
)(...)(1
++++=
n
t
tttS
2.2 Ngoại suy bằn số bình quân trợt:
Gọi M là dãy số bình quân trợt:
nki
MM
i
,
=
=
Đối với phơng pháp này, ngời ta có thể tiến hành dự đoán điểm hay dự
đoán khoảng.
+ Đối với dự đoán điểm, mô hình dự đoán có dạng
nLn
My
=
+
Trong đó:
n
M
: Số bình quân trợt thứ n
:
ln
y
+
Mức độ dự đoán năm thứ n+l
+ Mô hình dự đoán khoảng có dạng
k
Styy
k
Sty
nnn
1
1.
.
1
1.
.
111
+++
+++
Trong đó:
t
: Giá trị trong bảng tiêu chuẩn T- Student với bậc tự do
(k-1) và xác xuất tin cậy (1-)
Lớp Thống kê 42
22
Chuyên đề thực tập tốt nghiệp
Phạm Hoàng Lân
S
: Sai số bình quân trợt:
kn
Myi
S
n
ki
ii
=
=
=
2
)(
2.3 Ngoại suy hàm xu thế
Ngoại suy hàm xu thế là phơng pháp dự đoán thông dụng, đợc xây
dựng trên cơ sở biến động của hiện tợng trong tơng lai tiếp tục xu hớng biến
động đã hình thành trong quá khứ và hiện tại. Phơng pháp này đợc vận dụng
để dự đoán các hiện tợng kinh tế - xã hội không quá phức tạp.
Cũng ng phơng pháp ngoại suy bằng số bình quân trợt, ngoại suy hàm
xu thế có thể đợc tiến hành dự đoán điểm và dự đoán khoảng.
Mô hình dự đoán điểm:
)(
ntfy
Ln
+=
+
)( Ltf
+
là giá trị xu thế tại thời điểm (t+L)
Mô hình dự đoán khoảng
pLnpLn
StyySty
Ln
.
.
+<<
++
+
Trong đó :
p
S
: Sai số của dự đoán
)1(
)12(3
1
1.
2
2
+
++=
nn
Ln
n
SS
ep
:
e
S
Sai số của mô hình
pn
yy
S
tt
e
=
2
)(
p: số tham số trong mô hình
Hàm xu thế có chất lợng cao khi sai số mô hình nhỏ nhất và hệ số tơng
quan cao nhất(xáp xỉ).
2.4 Ngoại suy theo chỉ số thời vụ
Phơng pháp này đợc vận dụng khi các mức độ của dãy số thời gian
biến động theo chu kỳ, mùa vụ:
a. Đối với dãy số thời gian có các mật độ t ơng đối ổn định
Lớp Thống kê 42
23
Chuyên đề thực tập tốt nghiệp
Phạm Hoàng Lân
)(0
.
iTVii
Iyyy
==
Trong đó :
i
y
: Mức độ dự đoán kỳ thứ i.
y
: Mức độ bình quân kỳ thứ i.
0
y
: Mức độ bình quân của tất cả các mức độ trong dãy số
:
)(iTV
I
Chỉ số thời vụ của kỳ thứ i
Phơng pháp dự đoán này cho chúng ta kết quả dự đoán giống nhau ở
các năm dự đoán khác nhau.
b. Đối với dãy số thời gian có ph ơng pháp biến động rõ rệt, chúng ta
vận dụng mô hình dự đoán:
)(
)(
.
iTV
Lt
Ln
i
Iyy
+
+
=
Trong đó:
:
i
Ln
y
+
Mức độ dự đoán kỳ thứ i của năm (n+L)
Lt
y
+
: Giá trị hàm xu thế tại thời điểm (t+L)
Mô hình dự đoán này có hạn chế là chỉ vận dụng dự đoán khi các mùa
vụ có chung tốc độ phát triển và xu hớng tăng( giảm ).
2.5. Ngoại suy theo bảng BUYS- BALOT:
Nhờ việc phân tích các thành phần của dãy số thời gian, chúng ta xây
dựng đợc một mô hình khá chuẩn. Từ mô hình này, chúng ta có thể dự đoán
các mức độ cho tơng lai:
LtiLt
CLtbay
++
++++=
)(
Tuy nhiên, các thành phần ảnh hởng của nhân tố ngẫu nhiên
khó
xác định. Hơn nữa, ảnh hởng này không lớn nên với việc loại bỏ nhân tố này,
mô hình trở nên đơn giản hơn:
iLt
CLtbay
+++=
+
)(
Kết quả dự đoán phản ánh khá chính xác cả quy luật biến động chung
lẫn biến động mùa. Tuy nhiên, mô hình dự đoán này có hạn chế là chỉ vận
dụng để dự đoán khi các mùa có chung xu hớng biến động. Nghĩa là, các
mùa vụ phải cùng tăng (giảm) và cùng tốc độ phát triển.
Lớp Thống kê 42
24
Chuyên đề thực tập tốt nghiệp
Phạm Hoàng Lân
2.6 Phơng pháp san bằng mũ:
Hầu hết các mô hình dự đoán kể trên đều chó chung một nhợc điểm là
đánh giá vai trò của các mức độ trong dãy số thời gian nh nhau. Nghĩa là, các
mức độ đều dãy số ảnh hởng đến mức độ dự đoán tơng đơng các mức độ cuối
dãy số. Việc này làm mô hình kém nhạy bén với những biến động mới của
hiện tợng.
Để khắc phục nhợc điểm này, ngời ta xây dựng mô hình dự đoán theo
phơng pháp san bằng mũ. Phơng pháp dự đoán này dựa trên cơ sở các mức độ
của dãy số thời gian phải đợc xem xét một cách nh nhau. Các mức độ càng
mới ( càng cuối dãy số) càng cần đợc chú ý nhiều hơn. Nhờ vậy, mô hình dự
đoán có khả năng thích nghi với những sự biến động mới nhất của hiện tợng
trong dãy số thời gian.
Gọi y
t
: Mức độ thực tế tại thời gian t
t
y
: Mức độ lý thuyết tại thời gian t
ta có mức độ lý thuyết dự đoán tại thời gian tiếp theo ( t+1) là:
i
tt
yyy )1(
1
+=
+
Đặt:
)1(
=
, ta có:
i
tt
yyy
+=
+
1
Trong đó:
,
là các tham số san bằng nằm trong khoảng [0;1].
Nh vậy, mức độ dự đoán
1
+
t
y
là trung bình cộng gia quyền của các mức
độ thực tế y
t
và mức độ dự đoán
t
y
.
Sau các phép biến đổi, chúng ta xây dựng đợc công thức tổng quát:
=
+
+=
1
0
011
n
i
n
t
i
t
yyy
trong đó: y
0
: Mức độ đợc chọn làm điều kiện ban đầu.
Dự đoán bằng phơng pháp san bằng mũ chịu ảnh hởng mạnh nhất của
mức độ mới nhất và giảm dần đối với các mức độ ở càng cuối dãy số. Do có
sự tự điều chỉnh khi có thông tin mới nhất nên mức độ dự đoán luôn luôn sát
thực.
Lớp Thống kê 42
25