Tải bản đầy đủ (.doc) (38 trang)

Tiểu luận môn lý thuyết thống kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (279.59 KB, 38 trang )

Đề án môn học Lý thuyết thống kê

Li m u

Hin nay, sự phát triển kinh tế của đất nước đang được Đảng và Nhà
nước ta đặc biệt quan tâm. Làm thế nào để biết được trong những năm qua
đất nước ta có phát triển hay khơng và phát triển với tốc độ như thế nào,
những nhân tố nào có tác động đến sự phát triển… Từ đó có hướng điều
chỉnh phù hợp. Đó chính là một trong những nhiệm vụ quan trọng của
Thống Kê.
Thông qua việc phát hiện, phản ánh những quy luật về lượng của hiện
tượng, các con số Thống kê giúp cho việc kiểm tra, giám sát, đánh giá các
chương trình kế hoạch và định hướng sự phát triển kinh tế – xã hội trong
tương lai.Do vai trò quan trọng của Thống kê, nên V.I.Lê nin đã khẳng
định rằng “Thống kê kinh tế xã hội là một trong những công cụ mạnh mẽ
nhất để nhận thức xã hội”
Phương pháp nghiên cứu của Thống kê là phương pháp đặc thù mà các
mơn khoa học khác khơng có được như : Phân tích hồi quy-tương quan,
Phân tích dãy số thời gian, chỉ số, dự đoán thống kê …
Đề tài này sẽ sử dụng một trong những phương pháp đó của Thống kê
để nghiên cứu mối quan hệ của GDP với các nhân tố có ảnh hưởng đến nó.
Vì GDP là một trong những chỉ tiêu quan trọng để đánh giá sự phát triển
kinh tế. Cần phải biết những nhân tố nào có mối quan hệ chặt chẽ và tác
động tốt làm tăng GDP, nhân tố nào có tác động khơng tốt làm hạn chế tốc
độ tăng GDP. Qua đó giúp Nhà nước ta có cơ sở để thực hiện phát triển
kinh tế một cách hợp lý và hiệu quả.

GVHD: Th.S Bùi Huy Thảo

1


SV: Nguyễn Thị Khuyên


Đề án môn học Lý thuyết thống kê

PHN I :

Lí LUẬN CHUNG VỀ PHƯƠNG PHÁP PHÂN TÍCH
HỒI QUY VÀ TƯƠNG QUAN
A. Khái quát chung về thống kê học.
Thống kê học ra đời, phát triển từ nhu cầu thực tiễn của Xã hội và là
một trong những môn khoa học xã hội có lịch sử lâu dài nhất. Đó là q
trình phát triển không ngừng từ đơn giản đến phức tạp, được đúc rút thành
lý luận khoa học và ngày nay đã trở thành một môn khoa học độc lập.
Ngày nay, Thống kê được coi là một trong những công cụ quản lý vĩ
mơ quan trọng, có vai trị cung cấp các thơng tin Thống kê trung thực,
khách quan, chính xác, đầy đủ, kịp thời phục vụ các cơ quan nhà nước
trong việc đánh giá, dự báo tình hình, hoạch định chiến lược, chính sách,
xây dựng kế hoạch phát triển kinh tế – xã hội ngắn hạn và dài hạn. Đồng
thời các con số thống kê cũng là những cơ sở quan trọng nhất để kiểm
điểm, đánh giá tình hình thực hiện các kế hoạch, chiến lược và các chính
sách đó. Trên giác độ quản lý vi mô, Thống kê không những có vai trị đáp
GVHD: Th.S Bïi Huy Th¶o

2

SV: Ngun Thị Khuyên


Đề án môn học Lý thuyết thống kê

ng nhu cu thông tin thống kê của các tổ chức, cá nhân trong xã hội, mà
còn phải xây dựng, cung cấp các phương pháp phân tích đánh giá về mặt lượng
các hoạt động kinh tế – xã hội của các tổ chức, đơn vị.
Đối tuợng nghiên cứu của thống kê học là mặt lượng trong sự liên hệ
mật thiết với mặt chất của các hiện tượng số lớn, trong điều kiện thời gian
và địa điểm cụ thể. Đối tượng nghiên cứu của thống kê học bao giờ cũng
tồn tại trong điều kiện thời gian và địa điểm cụ thể. Trong điều kiện lịch sử
khác nhau, các đặc điểm về chất và biểu hiện về lượng của hiện tượng cũng
khác nhau, nhất là với các hiện tượng kinh tế – xã hội.
B. Một số vấn đề chung của phân tích hồi quy và tương quan.
I.

Nhiệm vụ của phân tích hồi quy và tương quan.

1.Liên hệ hàm số và liên hệ tương quan.
Chủ nghĩa duy vật biện chứng khẳng định : Các hiện tượng tồn tại trong
mối liên hệ phụ thuộc lẫn nhau. Phương pháp phân tích hồi quy và
tương quan là một trong những phương pháp thường được sử dụng trong
thống kê để nghiên cứu mối liên hệ phụ thuộc đó.
Khi nghiên cứu mối liên hệ phụ thuộc, nếu xét theo mức độ chặt chẽ
của mối liên hệ có thể phân thành 2 loại : Liên hệ hàm số và liên hệ tương quan.
a. Liên hệ hàm số: là mối liên hệ hoàn toàn chặt chẽ giữa tiêu thức
nguyên nhân – x và tiêu thức kết quả - y.
Dạng tổng quát của liên hệ hàm số:
y= f(x)
tức là: cứ mỗi giá trị của tiêu thức nguyên nhân sẽ có 1 giá trị tương
ứng của tiêu thức kết quả.
Mối liên hệ này có thể thấy được khơng những ở tồn bộ tổng thể mà
trên cả từng đơn vị cá biệt.


GVHD: Th.S Bïi Huy Th¶o

3

SV: Nguyễn Thị Khuyên


Đề án môn học Lý thuyết thống kê
b. Liờn h tương quan: Là mối liên hệ khơng hồn tồn chặt chẽ giữa
tiêu thức nguyên nhân và tiêu thức kết quả. Cứ mỗi giá trị của tiêu thức
nguyên nhân sẽ có nhiều giá trị tương ứng của tiêu thức kết quả.
Ví dụ: Mối liên hệ giữa số lượng sản phẩm và giá thành đơn vị sản
phẩm. Không phải khi khối lượng sản phẩm tăng lên thì giá thành đơn vị
sản phẩm sẽ giẳm theo một tỉ lệ tương ứng. Cũng như mối liên hệ giữa số
lượng phân bón và năng suất cây trồng, mối liên hệ giữa vốn đầu tư và kết
qủa sản xuất… Các mối liên hệ này là các mối liên hệ khơng hồn tồn
chặt chẽ, khơng được biểu hiện một cách rõ ràng trên từng đơn vị cá biệt.
Do đó, để phản ánh mối liên hệ tương quan thì phải nghiên cứu hiện tượng
số lớn – tức là thu thập tài liệu về tiêu thức nguyên nhân và tiêu thức kết
quả của nhiều đơn vị.
Liên hệ tương quan thường gặp khi nghiên cứu các hiện tượng kinh tế – xã hội.
Nhiệm vụ của phân tích hồi quy và tương quan.
Phân tích hồi quy và tương quan giải quyết 2 nhiệm vụ cơ bản sau:
a. Xác định mơ hình hồi quy phản ánh mối liên hệ.
Căn cứ vào nhiệm vụ nghiên cứu cụ thể để chọn ra 1,2,3…tiêu thức
nguyên nhân và một tiêu thức kết quả.
Các tiêu thức nguyên nhân được chọn là các tiêu thức có ảnh hưởng lớn
đến tiêu thức kết quả. Để giải quyết vấn đề này địi hỏi phải có sự phân tích
một cách sâu sắc bản chất của mối liên hệ trong điều kiện lịch sử cụ thể.
Đây là vấn đề trước tiên quyết định sự thành công của nghiên cứu hồi quy

tương quan.
Từ đó có thể xây dựng mơ hình hồi quy giữa một tiêu thức nguyên
nhân và một tiêu thức kết quả và được gọi là mơ hình hồi quy đơn. Mơ hình
hồi quy đơn có thể là mơ hình tuyến tính(mơ hình đường thẳng) hoặc mơ
hình phi tuyến tính(mơ hình đường cong). Việc xác định dạng cụ thể mô

GVHD: Th.S Bïi Huy Thảo

4

SV: Nguyễn Thị Khuyên


Đề án môn học Lý thuyết thống kê
hỡnh hi quy đơn có thể dựa vào đồ thị kết hợp với kinh nghiệm nghiên
cứu.
Hoặc có thể xây dựng mơ hình hồi quy giữa 2,3,… tiêu thức nguyên
nhân và 1 tiêu thức kết qủa. Mơ hình này thường được xây dựng dưới dạng
tuyến tính và được gọi là mơ hình hồi quy tuyến tính bội.
b. Đánh giá mức độ chặt chẽ của mổi liên hệ tương quan.
Việc đánh giá mức độ chặt chẽ của mối liên hệ tương quan được thực
hiện thông qua việc tính tốn các hệ số tương quan, tỉ số tương quan, hệ số
tương quan bội, hệ số tương quan riêng phần. Dựa vào kết quả tính tốn có
thể kết luận về mức độ chặt chẽ của mối liên hệ, giúp cho việc nhận thức
hiện tượng được sâu sắc, từ đó đề ra những giải pháp cụ thể.
c. ý nghĩa phân tích hồi quy và tương quan.
Phương pháp phân tích hồi quy và tương quan là phương pháp thường
được sử dụng trong thống kê để nghiên cứu mối liên hệ giữa các hiện
tượng, như mối liên hệ giữa các yếu tố đầu vào của quá trình sản xuất với
kết quả sản xuất, mối liên hệ giữa thu nhập và tiêu dung, mối liên hệ giữa

phát triển kinh tế và phát triển xã hội.
Phương pháp phân tích hồi quy và tương quan còn được vận dụng trong
một số phương pháp nghiên cứu thống kê khác như phân tích dãy số thời
gian, dự đoán thống kê…
II. HỒI QUY VÀ TƯƠNG QUAN TUYẾN TÍNH GIỮA HAI TIÊU
THỨC SỐ LƯỢNG . (Hồi quy và tương quan tuyến tính đơn)
2.1. Mơ hình hồi quy tuyến tính giữa hai tiêu thức số lượng
Ví dụ: Có tài liệu về số lao động và giá trị sản xuất (GO) của 10 doanh
nghiệp công nghiệp như sau:

GVHD: Th.S Bùi Huy Thảo

5

SV: Nguyễn Thị Khuyên


Đề án môn học Lý thuyết thống kê

Laong

GO (T ng)

(Ngi)
60

9.25

78


8.73

90

10.26

115

13.64

126

10.93

169

14.31

198

22.10

226

19.17

250

25.20


300

27.50

GVHD: Th.S Bùi Huy Thảo

6

SV: Nguyễn Thị Khuyên


Đề án môn học Lý thuyết thống kê
Trong mi liờn hệ giữa số lượng lao động và giá trị sản xuất thì số
lượng lao động là tiêu thức nguyên nhân –ký hiệu là x, giá trị sản xuất là
tiêu thức kết quả -ký hiệu là y.
Tài liệu trên cho thấy : Nhìn chung, cùng với sự tăng lên của số
lượng lao động thì giá trị sản xuất cũng tăng lên , nhưng cũng có trường
hợp khơng hẳn như vậy – như doanh nghiệp thứ hai so với doanh nghiệp
thứ nhất: Số lao động nhiều hơn nhưng giá trị sản xuất lại thấp hơn.Điều
này chứng tỏ giữa số lượng lao động và giá trị sản xuất có mối liên hệ
khơng hồn tồn chặt chẽ –tức là liên hệ tương quan.
Có thể dùng đồ thị để biểu hiện mối liên hệ trên với trục hoành là
số lao động (x), trục tung là giá trị sản xuất (y) như sau:

y

. .
..
0


x

Trên đồ thị có mười chấm, mỗi chấm biểu hiện số lao động và giá trị
sản xuất của từng doanh nghiệp. Các chấm trên đồ thị tạo thành một băng
đường thẳng, từ đó có thể xây dựng mơ hình hồi quy tuyến tính như sau:
 x = b0 + b1 x
Υ

GVHD: Th.S Bïi Huy Thảo

(1)
7

SV: Nguyễn Thị Khuyên


Đề án môn học Lý thuyết thống kê
Trong ú:
x là giá trị của tiêu thức kết quả được tính từ mơ hình hồi quy;
Υ

b0 là hệ số tự do, phản ánh ánh hưởng của các tiêu thức nguyên nhân
khác ngoài tiêu thức nguyên nhân x được nghiên cứu.
b1 là hệ số góc (phản ánh độ dốc của đường hồi quy) : Khi tiêu thức
nguyên nhân x tăng lên 1 đơn vị thì tiêu thức kết quả y sẽ tăng (nếu
b1>0);hoặc giảm (nếu b1<0) bình quân là b1 đơn vị.
Các hệ số b0 và b1 được xác định bằng phương pháp bình phương nhỏ nhất:
 (Y- Υˆ )2 = Min

Từ đó, ta có hệ phương trình sau:


y

= nb0 + b1  x

 xy = b0  x

+ b1  x 2

Giải hệ phương trình trên ta tìm được b 0 và b1. Thay vào (1) ta
được mơ hình hồi quy phản ánh mối quan hệ giữa số lao động và giá trị sản
xuất của các doanh nghiệp được nghiên cứu.
Sau khi xác định được mơ hình hồi quy ta cần phải kiểm định xem
có phù hợp với tổng thể chung hay khơng.Vì thơng thường nghiên cứu mơ
hình hồi quy dựa vào mẫu ngẫu nhiên.
Mơ hình hồi quy của tổng thể chung:
E(Y/xi) = β 0 + β 1xi
* Cách 1: Kiểm định β 0, β 1.
* Cách 2: Kiểm định sự phù hợp của mơ hình hồi quy.
Giả thuyết H0: mơ hình khơng phù hợp ( β 1=0)
H1: mơ hình phù hợp ( β 1 # 0)
Tiêu chuẩn kiểm định: giả sử H0 đúng ta có tiêu chuẩn kiểm định:
GVHD: Th.S Bùi Huy Thảo

8

SV: Nguyễn Thị Khuyên


Đề án môn học Lý thuyết thống kê


F

Trong ú, SSR =

SSR / (k  1)
SSE / (n  k)

 (yˆ  y)

SSE =

2

i



(y i  y) (yˆi  y)  (y i  yˆi ) =

e

2
i

k là số lượng các hệ số có trong mơ hình hồi quy.
Với mức ý nghĩa kiểm định α ta tra bảng : Fα;df1 ;df2
df1 = k-1;

Nếu


df2 = n-k

Ftính> Fα;df1 ;df2 thì bác bỏ H0

2.2. Hệ số xác định và hệ số tương quan tuyến tính đơn.
a.Hệ số xác định. Kí hiệu: r 2.
Nó cho ta biết trong 100% của toàn bộ sự sai lệch của tiêu thức kết
quả y so với bình quân tổng của nó thì có bao nhiêu % là do tiêu thức
ngun nhân x (do mơ hình hồi quy gây lên).

(y i  y) (yˆi  y)  (y i  yˆi )
Bình phương 2 vế ta được:

 (y
GVHD: Th.S Bïi Huy Th¶o

i

 y)2  (yˆi  y)2   (y i yi )2
9

SV: Nguyễn Thị Khuyên


Đề án môn học Lý thuyết thống kê
SSY

H s xỏc định


r2=

=

SSR

+

SSE

SSR
SSE
= 1
SSY
SSY

b.Hệ số tương quan tuyến tính đơn (kí hiệu: r).
Hệ số tương quan tuyến tính được sử dụng để đánh giá mức độ chặt
chẽ của mối liên hệ tương quan tuyến tính giữa hai tiêu thức số lượng.
Có nhiều cơng thức để tính hệ số tương quan tuyến tính giữa hai tiêu
thức số lượng, trong đó hai cơng thức sau đây thường được sử dụng:
(1) r 

xy  x * y
;
xy

(2) r  r 2

Tớnh chất: r nằm trong khoảng [-1;1], tức là: -1  r 1.

Cụ thể:
- Nếu r = 1 (hoặc r = -1): Giữa x và y cú mối liờn hệ hàm số.
- Nếu r = 0: Giữa x và y khơng có mối liên hệ tương quan tuyến tính.
- Nếu r  1 (hoặc r  -1) giữa x và y cú mối liờn hệ càng chặt chẽ.
- Nếu r > 0: Giữa x và y cú mối liờn hệ thuận.
- Nếu r < 0: Giữa x và y cú mối liờn hệ nghịch.
III. HỒI QUY VÀ TƯƠNG QUAN PHI TUYẾN TÍNH GIỮA HAI
TIÊU THỨC SỐ LƯỢNG
3.1. Một vài mụ hỡnh hồi quy phi tuyến tớnh.
- Parabol: Thăm dũ bằng đồ thị với trục hoành là tiêu thức nguyên
nhân (x), trục tung là tiêu thức kết quả (y). Nếu các điểm trên đồ thị được
phân bố theo hai dạng sau đây thỡ cú thể xõy dựng mụ hỡnh hồi quy
parabol:

GVHD: Th.S Bïi Huy Th¶o

10

SV: Ngun Thị Khuyên


Đề án môn học Lý thuyết thống kê

M hnh parabol:
y x b0  b1x  b 2 x 2
Áp dụng phương pháp bỡnh phương nhỏ nhất sẽ có hệ phương trỡnh
sau đây để tỡm giỏ trị cỏc hệ số b0, b1, b2:
  y  nb0  b1  x  b 2  x 2

2

3
  xy  b0  x  b1  x  b 2  x
2
3
4
 x 2 y b
0  x  b1  x  b 2  x

- Hypebol:
Thăm dũ bằng đồ thị với trục hoành hoành là tiêu thức nguyên nhân
(x), trục tung là tiêu thức kết quả (y). Nếu các điểm trên đồ thị được phân
bố theo dạng sau đây thỡ cú thể xõy dựng mụ hỡnh hồi quy hypebol:
Mụ hỡnh hypebol:
yˆ x b0 

GVHD: Th.S Bïi Huy Th¶o

b1
x

11

SV: Ngun Thị Khuyên


Đề án môn học Lý thuyết thống kê

p dng phng pháp bỡnh phương nhỏ nhất sẽ có hệ phương trỡnh
sau đây để tỡm giỏ trị của cỏc hệ số b0, b1:
1

 y
nb0
b1 



x
1

1
 y y b0  x  b  1
1

x2
-Hàm mũ:
Thăm dũ bằng đồ thị với trục hoành hoành là tiêu thức nguyên
nhân(x),trục tung là tiêu thức kết quả (y). Nếu các điểm trên đồ thị được
phân bố theo dạng sau đây thỡ cú thể xõy dựng mụ hỡnh hàm mũ:
Mụ hỡnh hàm mũ:
ˆ x b 0 b1x
y
Áp dụng phương pháp bỡnh phương nhỏ nhất sẽ có hệ phương trỡnh
sau đây để tỡm giỏ trị của cỏc hệ số b0, b1:
  ln y  n ln b 0  ln b1  x

2
 x ln y ln b 0  x  ln b1  x
Giải hệ phương trỡnh trờn sẽ được lnb0, lnb1. Tra đối ln, sẽ được giá trị của b0 và b1.
3.2. Tỷ số tương quan (ký hiệu: )
GVHD: Th.S Bïi Huy Th¶o


12

SV: Ngun Thị Khuyên


Đề án môn học Lý thuyết thống kê
T s tng quan được sử dung để đánh giá mức độ chặt chẽ mối liên
hệ tương quan phi tuyến tính và tuyến tính giữa hai tiêu thức số lượng và
được tính theo công thức sau đây:
η  1

  y  yˆ 
  y  y

2

x

2

Tớnh chất:  nằm trong khoảng [0; 1], tức là: 0    1.
Cụ thể:
Nếu  = 1: Giữa x và y cú mối liờn hệ hàm số.
Nếu  = 0: Giữa x và y khụng cú mối liờn hệ.
Nếu   1: Giữa x và y cú mối liờn hệ càng chặt chẽ
IV. HỒI QUY VÀ TƯƠNG QUAN TUYẾN TÍNH BỘI
(HỒI QUY VÀ TƯƠNG QUAN TUYẾN TÍNH GIỮA NHIỀU TIÊU THỨC)

4.1. Mụ hỡnh hồi quy tuyến tớnh bội

Giả sử cú k tiờu thức nguyờn nhõn: x1 , x 2 , x 3 ,..., x k và tiờu thức kết
quả y, mụ hỡnh hồi quy tuyến tớnh bội sẽ cú dạng:
yˆ x1x 2...x k b0  b1x1  b 2 x 2  b3x 3  ......  b k x k

Trong đó:
b 0 : là hệ số tự do.
b1 ,b 2 ,b3 ,...,b k : là cỏc hệ số hồi quy riờng.
Áp dụng phương pháp bỡnh phương nhỏ nhất sẽ có hệ phương trỡnh
sau đây để tính b 0 , b1 ,b 2 ,b3 ,...,b k :
Hệ số hồi quy chuẩn hóa: ký hiệu beta, được sử dụng để dánh giá mức
độ ảnh hưởng của từng tiêu thức nguyên nhân x i đối với tiêu thức kết quả y
và được tính theo cơng thức sau õy:

GVHD: Th.S Bùi Huy Thảo

13

SV: Nguyễn Thị Khuyên


Đề án môn học Lý thuyết thống kê
beta i bi

xi
y

Dấu của betai là dấu của bi , phản ánh chiều hướng mối liên hệ là thuận
hay nghịch giữa tiêu thức nguyên nhân xi với tiờu thức kết quả y.
| betai | phản ánh mức độ ảnh hưởng của từng tiêu thức nguyên nhân x i
với tiờu thức kết quả y.

4.2. Hệ số tương quan bội và hệ số tương quan riêng phần
Hệ số tương quan bội (ký hiệu R) được sử dụng để đánh giá mức độ
chặt chẽ mối liên hệ tương quan tuyến tính giữa các tiêu thức nguyên nhân
x1 , x 2 , x 3 ,..., x k và tiờu thức kết quả y và được tính theo công thức sau đây:

R

  y  yˆ
1

x1x 2 ...x k

  y  y



2

2

Tớnh chất: R nằm trong khoảng [0; 1], tức là: 0  R 1.
Cụ thể:
-Nếu R = 1: Giữa x1 , x 2 , x 3 ,..., x k và y cú mối liờn hệ hàm số.
-Nếu R =0: Giữa x1 , x 2 , x 3 ,..., x k và y khơng có mối liên hệ tương quan tuyến
tính.
-Nếu R  1: Giữa x1 , x 2 , x 3 ,..., x k và y có mối liên hệ tương quan tuyến tính
càng chặt chẽ.
* Hệ số tương quan riêng phần được sử dụng để đánh giá mức độ chặt
chẽ giữa một tiêu thức nguyên nhân nào đó với tiêu thức kết quả y trong
khi các tiêu thức ngun nhân khác khơng đổi.

Ví dụ như có hai tiêu thức nguyên nhân x1 và x2 và tiờu thức kết quả y
cú thể tính các hệ số tương quan riêng phần sau đây:
- Hệ số tương quan riêng phần giữa x1 và y trong khi x2 khụng i:
GVHD: Th.S Bùi Huy Thảo

14

SV: Nguyễn Thị Khuyên


Đề án môn học Lý thuyết thống kê
ryx1 ryx 2 rx1x 2
ryx1 (x 2 ) 
1  ryx2 2 1  rx21x 2







- Hệ số tương quan riêng phần giữa x2 và y trong khi x1 không đổi:

ryx 2 (x1 ) 

ryx 2  ryx1 rx1x 2

1  r  1  r 
2
yx1


2
x1x 2

4.3. Đa cộng tuyến
Khi xõy dựng mụ hỡnh hồi quy giữa nhiều tiờu thức, về phương
diện lý thuyết phải đảm bảo các tiờu thức nguyờn nhõn x i không tương
quan với nhau.
Nếu giữa cỏc tiờu thức nguyờn nhõn x i có tương quan tuyến tính với
nhau thỡ được gọi là hiện tượng đa cộng tuyến.
Hậu quả của đa cộng tuyến là làm cho việc ước lượng các hệ số của
mô hỡnh hồi quy sẽ khụng chớnh xỏc, ảnh hưởng đến việc suy rộng các kết
quả tớnh toỏn.
Để khắc phục hiện tượng đa cộng tuyến, trong một số chương trỡnh
về thống kờ, vớ dụ như chương trỡnh SPSS, cú một số phương pháp xây
dựng mô hỡnh hồi quy sau đây:
- Phương pháp đưa vào dần (forward selection): Tiêu thức nguyên
nhân đầu tiên được xem xét để dưa vào mô hỡnh hồi quy là tiờu thức
nguyờn nhân có hệ số tương quan lớn nhất (về trị tuyệt đối) với tiờu thức
kết quả.
Để xem xét tiêu thức nguyờn nhõn này(và những tiờu thức nguyờn
nhõn khỏc)có được đưa vào mô hỡnh hồi quy hay khụng thỡ sử dụng tiờu
chuẩn là thống kờ F (được mặc định F = 3.84). Nếu tiêu thức nguyên nhân
đầu tiên được xem xét để đưa vào mơ hỡnh hồi quy thỏa món tiờu chuẩn
vào thỡ phương pháp đưa dần vào sẽ tiếp tục, nếu không, khụng cú tiờu thức
nguyờn nhân nào được đưa vào mụ hnh hi quy.
GVHD: Th.S Bùi Huy Thảo

15


SV: Nguyễn Thị Khuyªn


Đề án môn học Lý thuyết thống kê
Khi tiờu thc nguyên nhân đầu tiên đó thỏa món tiờu chuẩn vào mụ
hỡnh hồi quy thỡ tiờu thức nguyờn nhõn thứ hai được xem xét có thỏa món
tiờu chuẩn vào hay khụng là tiờu thức nguyờn nhõn cú hệ số tương quan
riêng phần lớn nhất (về trị tuyệt đối) với tiêu thức kết quả. Nếu tiêu thức
này thỏa món tiờu chuẩn vào sẽ được đưa vào mô hỡnh hồi quy. Thủ tục
này sẽ tiếp tục cho đến khi không cũn tiờu thức nguyờn nhõn nào thỏa món tiờu
chuẩn vào.
- Phương pháp loại trừ dần (Backward elimintion): Tất cả các tiêu
thức nguyên nhân được đưa vào mơ hỡnh hồi quy.
Sau đó loại trừ dần chúng bằng tiêu chuẩn loại trừ loại trừ. Tiêu chuẩn
loại trừ là giá trị F tối thiểu (được mặc định F=2.71) mà tiêu thức nguyên
nhân phải đạt được để được ở lại trong mô hỡnh hồi quy .
- Phương pháp chọn từng bước (Stepwise selection): Là sự kết hợp
giữa hai phương pháp trên và là phương pháp thường được sử dụng.
Tiêu thức nguyên nhân đầu tiên được chọn để đưa vào mô hỡnh hồi quy
giống như phương pháp đưa dần vào, nếu nó khơng thỏa món tiờu chuẩn
vào thỡ thủ tục này sẽ chấm dứt và khụng cú tiờu thức nguyờn nhõn nào
được lựa chọn. Nếu nó thỏa món tiờu chuẩn vào thỡ tiờu thức nguyờn nhõn
thứ hai được lựa chọn dựa vào hệ số tương quan riêng phần lớn nhất(về trị
tuyệt đối). Nếu tiêu thức nguyên nhân thứ hai thỏa món tiờu chuẩn vào thỡ
nú cũng sẽ đi vào mơ hỡnh hồi quy.
Sau đó, dựa vào tiêu chuẩn ra để xem xét tiêu thức nguyên nhân
thứ nhất có phải loại bỏ khỏi mô hỡnh hồi quy hay khụng. Trong bước kế
tiếp, cỏc tiờu thức nguyờn nhõn khụng ở trong mụ hỡnh hồi quy được xem
xét để đưa vào. Sau mỗi bước, các tiêu thức nguyên nhân ở trong mô hỡnh
hồi quy được xem xét để loại trừ ra cho đến khi không cũn tiờu thức

nguyờn nhõn nào thỏa món tiờu chuẩn ra thỡ kết thỳc.

GVHD: Th.S Bïi Huy Thảo

16

SV: Nguyễn Thị Khuyên


Đề án môn học Lý thuyết thống kê
Cc m hnh hồi quy được xây dựng theo các phương pháp trên có
thể khác nhau. Tùy thuộc vào mục đích và nhiệm vụ nghiên cứu cụ thể để
lựa chọn mô hỡnh thớch hợp.
V. TƯƠNG QUAN HẠNG VÀ TƯƠNG QUAN GIỮA HAI TIÊU
THỨC THUỘC TÍNH
5.1. Tương quan hạng
Tương quan hạng có thể được sử dụng trong trường hợp số lượng
đơn vị không nhiều để nghiên cứu mối liên hệ tương quan giữa hai tiêu
thức.
Đối với mỗi tiêu thức, cần phải xếp hạng từ thấp đến cao phù hợp
với biểu hiện của tiêu thức – tức là sử dụng thang đo thứ bậc. Nếu biểu hiện
tiêu thức của một số đơn vị giống nhau thỡ lấy hạng bỡnh qũn của cỏc
đơn vị đó.
Hệ số tương quan hạng rs của Spearman được sử dụng để đánh giá
mức độ chặt chẽ và tính theo cơng thức sau đây:
rs 1 

6 d i2
n  n 2  1


Trong đó:
n: số đơn vị nghiên cứu;
di: Hiệu của hai hạng của đơn vị i, với i 1,n .
Tính chất của hệ số tương quan hạng giống với tính chất của hệ số
tương quan tuyến tính giữa hai tiêu thức số lượng – tức là:  1 r 1 .
5.2. Tương quan giữa hai tiêu thức thuộc tính
Để nghiên cứu mối liên hệ tương quan giữa hai tiêu thức thuộc tính,
trước hết phải phân tổ kết hợp theo hai tiêu thức đó. Dựa vào bảng phân tổ
kết hợp để tính hệ số liên hợp. Hệ số liên hợp thường được sử dụng là hệ số
liên hợp của Cramer:
GVHD: Th.S Bïi Huy Thảo

17

SV: Nguyễn Thị Khuyên


Đề án môn học Lý thuyết thống kê
k

2
n.min d  1 ,  c  1 

Trong đó:
2

χ 

n


ij

 nˆ ij 
nˆ ij

2

với n ij là tần số thực tế;

nˆ ij = (tổng dũng x tổng cột) / n là tần số lý thuyết.
n: Số đơn vị nghiên cứu.
d: Số dũng của bảng phõn tổ kết hợp.
c: Số cột của bảng phõn tổ kết hợp.
K cú giỏ trị trong khoảng [0, 1]. Nếu K = 0 cho biết khụng cú mối liờn
hệ; nếu K = 1 cho biết mối liờn hệ hoàn toàn chặt chẽ.

GVHD: Th.S Bïi Huy Thảo

18

SV: Nguyễn Thị Khuyên


Đề án môn học Lý thuyết thống kê
PHN HAI:
NG DNG CỦA PHƯƠNG PHÁP HỒI QUY TƯƠNG QUAN
I.Một số khái niệm cơ bản
Từ phần lý luận chung nêu ở trên, dưới đây ta sẽ đi phân tích mối liên
hệ của GDP theo giá thực tế với vốn đầu tư theo giá thực tế và số lao động
bình qn bằng các mơ hình đã nêu trên.

Để hiểu rõ mục tiêu của đề tài chúng ta cần phải hiểu rõ về GDP, vốn
đầu tư và số lao động bình quân.
GDP -

Trong kinh tế học, tổng sản phẩm nội địa, tức tổng sản

lượng quốc nội hay GDP (viết tắt của Gross Domestic Product) là giỏ trị
tớnh bằng tiền của tất cả sản phẩm và dịch vụ cuối cựng được sản xuất ra
trong phạm vi lónh thổ trong một khoảng thời gian nhất định, thường là
một năm. Khi ỏp dụng cho phạm vi toàn quốc gia, nú cũn được gọi là tổng
sản phẩm quốc nội.
Đầu tư có vai trũ vụ cựng quan trọng trong phỏt triển đất nước nói
chung, trong tăng trưởng và phát triển kinh tế nói riêng ở nước ta.
Trong những năm gần đây tỷ lệ vốn đầu tư so với tổng sản phẩm trong
nước (GDP) luôn ở mức tương đối cao. Hằng năm, Thủ tướng Chính
phủ gặp các nhà doanh nghiệp để giải quyết những vướng mắc trong
hoạt động đầu tư nhằm tạo ra một mơi trường thơng thống, tạo niềm
tin cho các nhà đầu tư.
Số lao động bình quân là lượng lao động tham gia vào quá trinh sản
xuất của nền kinh tế.Số lượng lao động cũng có vai trị quan trọng trong
phát triển kinh tế của nước ta.
Vì vậy cần phải phân tích xem mối quan hệ giữa GDP theo giá thực
tế , vốn đầu tư theo giá thực tế và số lao động bình quân trong khu khu vực
nhà nước phân theo ngành kinh tế có chặt chẽ hay khụng, lm c iu
GVHD: Th.S Bùi Huy Thảo

19

SV: Nguyễn Thị Khuyªn



Đề án môn học Lý thuyết thống kê
ú ta ỏp dụng mơ hình hồi quy tương quan đơn,và mơ hình hồi quy tương
quan bội để phân tích mối liên hệ đó.Ta có số liệu của GDP theo giá thực
tế,vốn đầu tư theo giá thực tế và số lao động bình quân trong khu vực nhà
nước phân theo ngành kinh tế từ năm 1995 đến năm 2007 như sau:

Năm
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
1
2006
2007

Số
bảng được
trong Niên
thống kê
đó : Y là
theo
tế


giá
1995 –
X

đầu tư theo

Y
228892
272036
313623
361017
399942
441646
481259
535762
613443
715307
839211
l à
974266
1144015

X1
72447
87394
108370
117134
131171
151183

170496
200145
239246
290927
343135
404712
521700

X2
1772.1
1837.9
1907.8
1979.0
2011.1
2058.9
2104.6
2181.4
2470.0
2430.0
2425.5
2376.0
2401.7

liệu ở
lấy
giám
2007
Trong
GDP
thực

2007.
giá

thực tế 1995 – 2007.
X2 là số lao động bình quân trong khu vực nhà nước phân theo
.

ngành kinh tế 1995 – 2007.

II.Vận dụng một số mơ hình hồi quy tương quan.
1.Hồi quy và tương quan đơn.
1.1.Vận dụng mơ hình hồi quy và tương quan tuyến tính đơn.
a. Nghiên cứu mối liên hệ giữa GDP với vốn đầu tư theo giá thực tế.
Khi đó: GDP – y là tiêu thức kết quả.
Vốn đầu tư – x là tiêu thức nguyên nhân.
Mối liên hệ giữa y và x được thể hiện bởi đồ th sau:

GVHD: Th.S Bùi Huy Thảo

20

SV: Nguyễn Thị Khuyên



×