Bài tập Phân tích định lượng MBA-08
1
TRƯỜNG Đ ẠI HỌC MỞ TP.HCM
LỚP CAO HỌC QUẢN TRỊ KINH DOANH KHÓA 8
TIỂU LUẬN MÔN HỌC:
PHÂN TÍCH ĐỊNH LƯỢNG
ĐỀ TÀI TIỂU LUẬN:
NHÓM THỰC HIỆN:
Đào Hùng Anh.
Võ Phương Hồng Cúc.
Lê Trọng Đoan
Cao Văn Tuấn.
TP. Hồ Chí Minh, tháng 2 năm 2009
Bài tập Phân tích định lượng MBA-08
2
ĐẠI HỌC MỞ TP. HỐ CHÍ MINH CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập – Tự do – Hạnh phúc
ĐỀ KIỂM TRA
MÔN: PHÂN TÍCH ĐỊNH LƯỢNG
LỚP: MBA8
Ghi chú: Sinh viên làm bài theo nhóm
Yêu cầu:
Sử dụng dữ liệu trong file World 95 Tieng Viet.sav đính kèm, bạn hãy tự xây dựng cho mình một mô
hình hồi quy giải thích sự khác biệt về tuổi thọ phụ nữ giữa các quốc gia trên thế giới.
Bạn được tự do lựa chọn các biến giải thích để đưa vào m ô hình cũng như tự quyết định dạng thức
của các liên hệ giữa biến giải thích và biến kết quả.
Hãy mô tả chi tiết quá trình xây dựng mô hình của bạn và tăng tính thuyết phục của mô hình này bằng
các công cụ chẩn đoán và đánh giá mô hình. Giải thích ý nghĩa các kết quả của mô hình rút ra.
Sản phẩm nộp:
1. Bài làm dạng file Word (có ghi tên các thành viên của nhóm ở trang đầu)
2. File output SP SS
Cả 2 file được đặt tên như sau MBA8_KT_nhomX (X là số thứ tự nhóm)
Hình thức:
File Word định dạng khổ giấy A4 (canh lề 2cm mỗi phía),
font chữ Time New Roman, cỡ 12 points
Cách đoạn (Spacin g before) 6 points, giãn dòng (line spacing) 1.2
Chúc thành công!
Bài tập Phân tích định lượng MBA-08
3
Lời nói đầu:
Phân tích định lượng là môn học nhằm trang bị kiến thức và phương pháp trong việc xây dựng m ô
hình, thu thập thông tin về thị trường và đời sốn g xã hội, phân tích số liệu, đánh giá số liệu nhằm khái
quát hóa các vấn đề nghiên cứu trong mô hình đã xây dựng. Đằng sau những kiến thức đó cần có kiến
thức về thống kê toánvà các kỹ năng sử dụng các loại phần mềm chuyên n ghiệp cho bộ môn này như
SPSS, E VIEWS hay Excel. Qua đó ta thấy đây là một lĩnh vực rộng lớn cần có sự trau dồi và tích lũy
kiến thức lâu dài cũng như sự yêu nghề để đạt được sự hiểu biết tường tận và thực hiện tốt công việc
này.
Trong hệ thống kiến thức rộng lớn đó kỹ thuật hồi quy tuyến tính là một kỹ thuật hay mô hình quan
trọng để tìm ra sự tương quan của các biến nguyên nhân và kết quả để ta có thể hình dung tương đối
mối liên kết đó, giúp ta có thể ứng dụng mô hình trong thực tế đời sống xã hội hay kinh tế. Trong tiểu
luận chúng ta đi nghiên cứu t uổi thọ của phụ nữ khác nhau như thế nào trên thế giới thông qua các
biến nguyên nhân như GDP, học vấn hay số lượng sinh sản… sau đó đánh giá mô hình thông qua các
chỉ số liên k ết, các chỉ số v ề sự chính xác và tương quan của các biến nghiên cứu.
Nhóm xin chân thành biết ơn và cảm tạ thầy Hoàng Trọng, đã hết lòng truyền thụ kiến thức và chia sẻ
những kinh nghiệm quý báu trong quá trình hướng dẫn lớp MBA-08 môn học phân tích định lượng.
Kính chúc thầy nhiều sức khỏe để tiếp tục truyền thụ sự hiểu biết cho các khóa đàn em mai sau.
Bài tập Phân tích định lượng MBA-08
4
MỤC LỤC
I. Lý thuyết về hồi quy tuyến tính.
1. Hệ số tương quan đơn.
2. Xây dựng ph ươn g trình hồi quy tuyến tính.
3. Đánh giá sự phù hợp của mô hình.
4. Kiểm định giả thuyết về độ phù hợp của mô hình và ý nghĩa của hệ số hồi quy.
5. Hồi quy bội, những vấn đề cần quan tâm khi thực hiện.
II. Ứng dụng Hồi quy tuyến tính vào để xây dựn g một m ô hình hồi quy giải thích sự khác biệt về tuổi
thọ phụ nữ giữa các quốc gia trên thế giới.
1. Xác định biến nguyên nhân và kết quả.
2. Xây dựng mô hình hồi quy t uyến tính.
3. Đánh giá sự phù hợp và kiểm định mô hình.
4. Mô hình đa biến, chọn lựa biến nguyên nhân, xây dựng và đánh giá.
Kết luận
Bài tập Phân tích định lượng MBA-08
5
I.Lý thuyết tổng quát về hồi quy đơn biến.
1. Hệ số tương quan.( correlation coefficient)
- Hệ số tương quan r nhằm nói lên sự liên kết chặt chẽ giữa hai biến nào đó.
- Hệ số tương quan cho mẫu là ước lượng của hệ số tương quan r để đo lường mối liên kết tuyến chặt
chẽ giữa các biến của mẫu.
- Hệ số này không có đơn vị.
- Hệ số này có giá trị biến thiên từ -1 đến 1.
- Khi có giá trị âm hệ hai biến có tương quan nghịch biến.
- Khi có giá trị dương hệ hai biến có tương quan đồng biến.
- Khi gía trị này bằng khôn g thì hai biến khôn g có liên kết.
- Công thức tính toán hệ số tương quan mẫu:
Trong đó:
r: hệ số tương quan, X : gía trị hệ số nguyên nhân, Y: giá trị hệ số kết quả, X: hệ số trung bình biến
nguyên nhân, Y: giá trị trung bình biến kết quả, n: độ lớn mẫu.
- Giá trị r giữa hai biến có thể là rất thấp nhưng chưa hẳn hai biến đó hoàn toàn không có mối liên hệ,
có thể nó lại có dạng liên quan khác như liên hệ phi tuyến.
- Giá trị r có thể là rất cao có khi gần bằng 1 nhưng thực tế không có sự liên quan nào, người ta gọi là
sự tương quan giả, ví dụ như người ta nghiên cứu số lượng trẻ sơ sinh phụ thuộc vào dân số của thành
phố HCM có sự tương quan rất cao vào năm 200x nhưng thực tế hai biến này có sự tương quan giả,
do khoản thời gian đó kinh tế suy giảm các năm gần đó tỷ lệ sinh giảm, nhưng đặc biệt năm đó là năm
Nghịch biến Đồng biến Không có mối liên hệ.
Bài tập Phân tích định lượng MBA-08
6
may mắn nên các gia đình quyết định sinh con nhiều. Như vậy ta thất ở đây tương quan thật phải là số
lượng trẻ sơ sinh và năm tốt.
- Như vậy h ệ số tương quan chỉ được coi là một chỉ số nói lên sự chặt chẽ giữa các biến.
2.Xây dựng phương trình hồi quy tuyến tính:
Sau khi đã nghiên cứu hệ số tương quan r, ta thấy rằng có thể hai biến có hệ số tương quan chặt chẽ
một cách tuyến tính nhưng thực tế thì không có sự liên hệ nào về thực chất, do vậy để xây dựng
phương trình hồi quy tuyến tính của các biến với nhau thì xem như ta đã nghiên cứu thấu đáo về sự
liên quan giữa chúng trong thực tế, và có xét đến hệ số tương quan cần thiết khá cao.
Sau đó ta tiến hành xây dựng mô hình. Lý thuyết thông thường người ta đặt biến Y là biến kết quả và
biết X nguyên nhân, X được đặt trên trục hoành và Y đặt trên trục tung. Trong phần nghiên cứu của
tiểu luận ta chi đi khảo sát mối liên quan tuyến tính theo đường thẳng đố i với mối liên hệ theo các
hình khác như parabol hay hình gấp khúc không được đề cập.
Phương trình hồi quy tuyến tính của tổng thể và mẫu có dạng đường thẳng như sau:
Yi =
0
+
1
X
i
+ , Yi = B
0
+ B
1
X
i
+
Trong đó Y là biến kết quả dự đoán thứ i, X
i
là biến nguyên nhân thứ i, B
0
hệ số tương quan tung độ
góc là giá trị của Y khi X bằng không, B
1
là hệ số tương quan độ dốc của đường thẳng biểu diễn mô
hình hồi quy, là gía trị khác biệt giữa hồi quy và giá trị thực tế.
Ý nghĩa của các hệ số :
- B
0
nói lên giá trị của biến dự đoán khi gía trị nguyên nh ân bằng không.
- B
1
độ dốc của đường hồi quy nhằm nói lên rằng khi giá trị X thay đổi một đơn vị thì giá trị Y sẽ thay
đổi X.B
1
đơn vị.
- nói lên sự khác biệt giữa giá trị hồi quy và gía trị thực tế, ví dụ một biến kết quả có thể ảnh hưởng
bởi rất nhiều biến nguyên nhân nh ưng ta lại chỉ khảo sát một biến nguyên nhân duy nhất, điều này đưa
đến sự có giá trị khác biệt này, khi giá trị càng nhỏ thì sự ảnh hưởng của biến nguyên nhân đó càng
lớn và càng có sự chính xác kh i áp dụng mô hình hồi quy.
- Ví dụ khi ta khảo sát chiều cao của của đứa trẻ 8 tuổi theo chế độ dinh dưỡng thì ta có gía trị lớn,
thì có nghỉa rằng chiều cao của đứa trẻ phụ thuộc vào dinh dưỡng v à còn phụ thuộc vào các biến khác
như chiều cao của cha mẹ, nơi ăn chốn ở hay cách chăm sóc… hay nói cách khác gía trị nhằm nói
đến sự sai lệch do ta chưa khảo sát hết tất cả các biến ảnh hưởng đến biến phụ thuộc mà ta đang khảo
sát.
- Sau khi có được mô hình hồi quy tuyến tính ta có thể tính gía trị biến phụ thuộc thông qua giá trị
biến không phụ thuộc với một giá trị chênh lệch nào đó mà ta chưa biết, nhưng giá trị đó nhỏ hơn
Bài tập Phân tích định lượng MBA-08
7
giá trị sai biệt khi ta chỉ tính trị trung bình so với giá trị thực tế cần khảo sát. Để hiểu hơn ta có thể đi
đến mục sau: Đánh giá sự phù hợp của mô hình hồi quy tuyến tính.
3.Đánh giá sự phù hợp của mô hình:
Vấn đề quan trọng tron g các mô hình hồi quy là phải chứng minh được sự phù hợp của mô hình mà ta
đang khảo sát, hầu như không có đường thẳng hồi quy nào đều hoàn toàn phù hợp với tập dữ liệu
khảo sát và luôn có gía trị sai lệch giữa các trị dự báo từ hồi quy và giá trị thực tế, sự sai lệch này thể
hiện qua phần dư . Do vậy người ta phải nghỉ đến một thước đo nào đó để chỉ ra mức độ phù hợp
của mô hình.
Thông thường thước đo cho mô hình tuyến tính được dùng là hệ số xác định R2. R2 được tính theo
công thức:
Trong đó SSR được xem như là giá trị sai lệch giữa gía trị dự đoán theo hồi quy so với giá trị trung
bình của tập dữ liệu, nó nói lên ph ần giá trị mà ta có thể ước lượng gần với thực tế hơn khi có phương
pháp hồi quy so với khi ta chỉ tính giá trị trung bình của tổng thể tập mẫu.
Ví dụ khi ta tính thu nhập theo đầu người của thành phố HCM thì giá trị là 5 triệu đồng/người như
vậy khi một gia đình có 3 người đi làm thì ta có thể hiểu là gia đình này thu nhập là 15 triệu đồng.
Nhưng ta đã biết lương bổng thì phụ thuộc vào rất nhiều vấn đề như trình độ học thức, năm kinh
nghiệm, loại công ty hay sự quan h ệ với cấp trên… như vậy khi ta dùng m ô hình hồi quy để tính
lương của một người theo trình độ học vấn thì ta có thể tính như sau:
Lương = B
0
+ B
1
*trình độ = 1 + 2.5*trình độ, khi xét đến một người có học vị đại học anh ta có gía
trị trình độ là 3 thì Lương =1+2.5*3=8.5 triệu. Như vậy khoản chênh lệch 3.5 triệu giữa giá trị trung
bình và giá trị tính theo hồi là SSR.
Giá trị SST được định nghĩa khá đơn giản là giá trị sai lệch giữa giá trị trung bình của tập khảo sát và
giá thị thực tế của một giá trị thực tế nào đó.
Như vậy từ công thức ta có thể thấy giá trị R
2
sẽ nằm trong khoảng từ 0 đến 1 khi R2 càng gần 0 thì
mô hình không phù hợp do mô hình hồi quy không có tác dụng làm sai lệch nhỏ đi mà nó cũng giống
như tính trung bình mà thôi. Khi R
2
càng gần về 1 thì mô hình càng phù hợp do mô hình hồi quy, làm
gía trị dự đoán hầu như chính xác với gía trị thực tế.
Ngoài SST và SSR người ta còn có SSE là giá trị chênh lệch giữa giá trị thực tế và giá trị hồi quy, giá
trị này chính là sai số .
Bài tập Phân tích định lượng MBA-08
8
Vậy SST = SSE +SSR hay sai lệch tổng = sai lệch ngoài + sai lệch hồi quy. Để hiểu rỏ hơn ta xem
hình vẽ sau:
4.Kiểm định giả thuyết về độ phù hợp của mô hình và ý nghĩa của hệ số hồi quy.
a. Kiểm định giả thuyết về độ phù hợp của m ô hình hay phân tích phương sai:
Khi xây dựng xong mô hình hồi quy tuyến tính vấn đề quan trọng ta ph ải đi kiểm định về độ phù hợp
mô hình hồi quy đó, do trong khi đánh giá sự phù hợp của mô hình bằng chỉ số Rsquare ch ỉ cho ta cái
nhìn của tập mẫu nhưng không hẳn tổng thể có giá trị phù hợp tương ứng.
Từ đó ta đi kiểm định, để k iểm định độ phù hợp của mô hình hồi quy tổng thể ta đặt giả thuyết
H
0
: Rpop = 0 sau khi tiến hành bài toán kiểm định giả thuyết H
0
bị bác bỏ thì đây là bước đầu thành
công cho việc kiểm định sự ph ù hợp của mô hình.
Đại lượng F được dùng để kiểm định, nếu xác suất F nhỏ thì ta có thể bác bỏ giả định H
0
, F có công
thức sau :
2
1
2
1
ˆ
( ) /
( ) /( 1)
N
i
i
N
i
i
Y Y p
F
Y Y N p
b. kiểm định giả thuyết về hệ số hồi quy của tổng thể:
Kiểm định thường được thực hiện chính là độ dốc của mô hình tổng thể, ý nghĩa của v iệc phải đi kiểm
định này là do cho dù ta đã có độ dốc của mẫu là B
1
khác 0 nhưng ta khôn g thể chắc rằng độ dốc của
tổng thể 1 là khác 0.
Như vậy cũng tương tự nh ư kiểm định giả thuyết về độ phù hợp của mô hình tổng thể ta đặt giả th uyết
H
0
: 1 = 0 . ta kỳ vọng giả thuyết này sẽ bị bác bỏ thì mô hình có sự liên hệ của hai biến n guyên nhân
và kết quả, hay mô hình hồi quy có quan hệ thật chứ không là quan hệ giả.
Đường thẳng hồi quy
Gía trị trung bình
Bài tập Phân tích định lượng MBA-08
9
Trị thống kê dùng để kiểm định giả thuyết là : t = B
1
/SB
1
Ta cũng có thể đi kiểm định B
0
giống như kiểm định B
1
với trị thống kê là: t = B
0
/SB
0
5. Hồi quy bội, những vấn đề cần quan tâm khi thực hiện.
Hồi quy bội có quá trình xây dựng giống như hồi quy đơn nhưng ở đây ta có nhiều biến n guyên nhân
và chỉ một biến kết quả. Ví dụ như xét đến sự hao phí nhiên liệu cho một động cơ đốt trong thì có thể
có một số biến nguyên nhân là: độ nặng của xe, dung tích cylinder, số cylinder hay tỉ số nén, khoảng
cách từ tử điểm trên đến tử điểm dưới…
Mô hình hồi quy bội có dạng: Y =
0
+
1
X
1
+
2
X
2
+…+
p
X
p
+e
Y: là biến kết quả,
k
là các hệ số hồi quy riêng phần, X
k
là các biến nguyên nhân, e là sai số.
Các ưu điểm của hồi quy bội so với hồi quy đơn:
- Hồi quy bội cho ta đường hồi quy chính xác hơn so với hồi quy đơn khi ta chọn được các
biến nguyên nhân chính xác.
- Giúp ta hiểu rõ hơn về vấn đề đang nhiên cứu, do mọi vấn đề hay hiện tượng trong tự
nhiên hay trong kinh tế, xã hội đều có nhiều n guyên nhân gây ra chứ không phải chỉ một
nguyên nhân ảnh hưỡng duy nhất.
- Sai số e là nhỏ so với hồi quy đơn, khi các biến được chọn phù h ợp.
Nhược điểm :
- Có quy trình khảo sát và thu thập dữ liệu khó.
- Có hiện tượng đa cộng tuyến xảy ra khi nghiên cứu các biến nguyên nhân. Điều này xảy ra
khi các biến nguyên nh ân ảnh hưởng lẫn nhau.
- Có mối liên hệ giả giửa biến nguyên nhân và biến kết quả.
Xây dựng m ô hình:
Bước đầu tiên khi xây dựng m ô hình thì ta phải đi xem xét các mối tương quan tuyến tính giửa các
biến bằng cách xây dựng ma trận tương quan giữa các biến, từ đó ta có thể đánh giá sự tương quan
của các biến nguyên nhân với nhau hay sự tác động đến biến kết quả.
Để đánh giá độ phù hợp của mô hình hồi quy tuyến tính bội: ta cũng quan sát hệ số R2, khi ta đưa vào
mô hình càng nhiều biến nguyên nhân thì hệ số R2 cang tăng, nhưng thực tế cho thấy khi số biến
nguyên nhân tăng thì khôn g hẳn mô hình càng ph ù hợp. Do đó đối với mô hình hồi quy tuyến tính bội
người ta xét độ phù hợp của mô hình thông qua giá trị Rsquare adjust. Giá trị Rsquare điều chỉnh này
không nhất thiết tăng cao gần một khi ta thêm vào mô hình nhiều biến hơn vì nó không phụ thuộc vào
độ lệch phóng đại của R2, R2 điều chỉnh được tính như sau:
Ra
2
=R2-p(1-R2)/(N-p-1)
P là biến số độc lập trong phương trình ( trong mô hình hồi quy đơn biến thì p = 1).
Kiểm định độ phù hợp của mô hình:
Cũng giống như phần hồi quy đơn biến thì ta phải đi kiểm định độ phù hợp của tổng thể, kiểm định F
được sử dụng, ý tưởng của kiểm định này là xem xét tất cả các biến nguyên nhân có liên hệ với biến
kết quả hay không thông qua kiểm định giả thuyết H0:
0
=
1
=
2
=0, và khi giả thuyết H0 bị bác bỏ thì
ta kết luận độ phù hợp tron g m ô hình giải thích được biến khảo sát.
Bài tập Phân tích định lượng MBA-08
10
Xét hệ số beta riêng phần cho mơ hình:
Hệ số này nói lên sự tác động riêng của một biến ngun nhân nào đó vào biến kết quả khi các biến
ngun nhân còn lại khơng có sự thay đổi, hệ số này còn được kiểm định thơng qua mức ý nghĩa sig.
khi mức ý nghĩa càng nhỏ thì ta đánh giá biến ngun nhân đó có tác động đến mơ hình, ngược lại khi
giá trị của mức ý nghĩa lớn hơn 0.05 chẵng hạn thì khơng có sự tác động lớn của biến ngun nhân đó
đến mơ hình.
II. Ứng dụng Hồi quy đơn biến tuyến tính vào để xây dựng một mơ hình hồi quy giải thích sự
khác biệt về tuổi thọ phụ nữ giữa các quốc gia trên thế giới.
1.Xác định biến ngun nhân và kết quả.
Để x ác định biến thì ta dùng SPSS tìm hệ số tương quan r giữa các biến so với biến tuổi thọ phụ nữ,
trong đó có ba điều kiện cần xem xét:
- Các điểm trên đồ thị Scatter phải tương đối tuyến tính theo đường thẳng do ta khảo sát mơ hình hơi
quy tuyến tính đơn.
- Hệ số tương quan càng gần 1 càng tốt.
- Có sự xem xét thực tế là biến n gun nhân đó có thật sự tương quan ảnh hưởng đến biến kết quả là
tuổi thọ phụ nữ.
Ta lần lược chạy vẽ đồ thị Scatter và tính hệ số tương quan r giữa tuổi thọ phụ nữ và các biến ngun
nhân, sau đó sẽ chọn biến nào có ảnh hưởng đến t uổi thọ phụ nữ theo ba tiêu chí nêu trên.
- Tuổi thọ phụ nữ theo tỷ lệ dân biết chữ.
Ty le d an biet chu(%)
120100806040200
Tuo i tho trung b inh Phu Nu
90
80
70
60
50
40
** Correlati on is signi ficant at the 0.01 level (2-tailed ).
T uổi
tho ï TB
phụ nữ
T ỉ l ệ
dân biết
chữ (%)
T uổi thọ TB
phụ nữ
Pearson
Correlation
1 .865(**)
Sig. (2-tailed) . .00 0
N 109 107
T ỉ l ệ d ân
bi ế t chữ (%)
Pearson
Correlation
.86 5(**) 1
Sig. (2-tailed) .00 0 .
N 107 107
Bài tập Phân tích định lượng MBA-08
11
- Tuổi thọ phụ nữ theo mật độ dân số:
Ma t do dan so ( nguoi/km2)
6000500040003000200010000-1000
Tuo i tho phu nu
90
80
70
60
50
40
- Tuổi thọ phụ nữ theo tỷ lệ dân sống ở thành thị:
Ty le dan song o thanh thi (%)
120100806040200
Tu oi tho ph u nu
90
80
70
60
50
40
- Tuổi thọ phụ nữ theo tốc độ tăng dân số:
Toc do tang dan so
6543210-1
Tuo i tho phu nu
90
80
70
60
50
40
** Correlati on is signi ficant at the 0.01 level (2-tailed ).
- Tuổi thọ của phụ nữ theo GDP tính trên đầu người:
GDP tinh t heo dau nguoi (USD)
3 000020 00010 0000- 10000
Tuoi th o phu nu
90
80
70
60
50
40
** Correlati on is signi ficant at the 0.01 level (2-tailed ).
T uổi
thọ T B
phụ nữ
Mật độ
dân s ố
(ngư ời/km
2)
T uổi thọ TB phu ï
nữ
Pearson
Correlation
1 .12 8
Sig. (2-tai led)
. .186
N
109 109
Mật độ dân s ố
(ngư ời/km2)
Pearson
Correlation
.128 1
Sig. (2-tai led)
.186 .
N
109 109
Tuổi tho ï
T B phụ nư õ
T ỉ l ệ dân
sống ở
vùng đô
thò (%)
T uổi thọ T B phụ
nữ
Pearson Correlation
1
.74 3(**)
Sig. (2-tailed)
.
.00 0
N
109
108
T ỉ lệ dân s ống
ở vùn g đo â thò
(%)
Pearson Correlation
.743(** )
1
Sig. (2-tailed)
.00 0
.
N
108
108
T uổi
tho ï TB
phụ nữ
T ốc độ
tăng
dân số
(%/năm)
Tuổi tho ï TB phụ
nữ
Pearson Correlation
1 579(**)
Sig. (2-tai led)
. .00 0
N
109 109
Tốc độ tăng
dân số (%/na êm)
Pearson Correlation
579(**) 1
Sig. (2-tai led)
.000 .
N
109 109
T uổi
tho ï TB
phụ nữ
GDP tính
trên đầu
người
(USD)
T uổi thọ TB phụ
nữ
Pearson Correl ation
1 .642(** )
Sig. (2-tai led)
. .00 0
N
109 10 9
GDP tính trên
đầu người (USD)
Pearson Correl ation .642(** ) 1
Sig. (2-tai led) .000 .
N 109 10 9
Bài tập Phân tích định lượng MBA-08
12
- Tuổi thọ phụ nữ theo tơn giáo:
Ton giao
76543210
Tuoi th o phu nu
9 0
8 0
7 0
6 0
5 0
4 0
** Correlati on is signi ficant at the 0.01 level (2-tailed ).
- Tuổi thọ phụ nữ theo calogi nạp vào hằng ngày theo từng n gười:
Calogi nap vao hang nga y
40003000200010 00
Tuo i tho phu nu
90
80
70
60
50
40
- Tuổi thọ phụ nữ tính theo số con trung bình:
So con trung binh cua phu nu
987654321
Tuoi tho phu nu
90
80
70
60
50
40
** Correlati on is signi ficant at the 0.01 level (2-tailed ).
- Tuổi thọ phụ nữ theo tỷ lệ biết chữ của phụ nữ:
T y le phu nu biet chu( %)
120100806 040200
Tuoi tho phu nu
90
80
70
60
50
40
** Correlati on is signi ficant at the 0.01 level (2-tailed ).
T uổi
tho ï TB
phụ nữ
Region or
ec onomic
group
Tuổi tho ï TB phụ
nữ
Pearson Correlation
1 321(**)
Sig. (2-tai led)
. .00 1
N
109 109
Region or economic
group
Pearson Correlation
321(**) 1
Sig. (2-tai led)
.001 .
N
109 109
T uổi thọ
TB phụ
nữ
Calori na ïp
hàng
ngày TB
1 n gười
T uổi thọ T B
phụ nữ
Pearson
Correlati on
1 .775(** )
Sig. (2-tai led)
. .00 0
N
109 75
Calori nạp ha øng
ngày TB 1
người
Pearson
Correlati on
.77 5(**) 1
Sig. (2-tai led)
.000 .
N
75 75
Tuổi tho ï
T B phụ
nữ
Số con TB
của 1 phụ
nữ
Tuổi tho ï T B phu ï
nữ
Pearson Correlation
1 83 8(**)
Sig. (2-tai led)
. .000
N
109 107
Số c on T B của 1
phụ nữ
Pearson Correlation
838(**) 1
Sig. (2-tai led)
.00 0 .
N
107 107
T uổi thọ
T B phu ï
nữ
Tỉ lệ nữ
giới biết
chữ (%)
T uổi thọ TB phu ï
nữ
Pearson Correlation
1 .819(**)
Sig. (2-tai led)
. .00 0
N
109 85
T ỉ l ệ nữ giới
biết c hữ (%)
Pearson Correlation
.819(**) 1
Sig. (2-tai led)
.00 0 .
N
85 85
Bài tập Phân tích định lượng MBA-08
13
- Tuổi thọ phụ nữ tính theo khí hậu:
Kh i hau chinh
1086420
Tuoi th o phu nu
90
80
70
60
50
40
** Correlati on is signi ficant at the 0.01 level (2-tailed ).
Sau khi dùng SPSS để vẽ đồ thị điểm và tính hệ số tương quan r ta thấy có các biến sau có thể dùng
làm biến ngun nhân là:
- Tỷ lệ dân biết chữ có r = 0.865 và đồ thị các điểm tuyến tính theo đường thẳng.
- Tỷ lệ dân sống ở thành thị có r = 0.743 và đồ thị các điểm tuyến tính theo đường thẳng.
- Theo lượng calogi nạp vào hằng ngày cho từng n gười r = 0.775 và đồ thị các điểm tuyến tính theo
đường thẳng.
- Số con trung bình r = -0.838 và đồ thị các điểm tuyến tính theo đường thẳng nghịch biến.
- Tỷ lệ biết chữ của phụ nữ r = 0.819 và đồ thị các điểm tuyến tính theo đường thẳng.
Theo các tiêu chí nói trên ta chọn một biến làm biến ngun nhân. Ta chọn tỷ lệ phụ nữ biết chữ do
nếu chọn theo tỷ lệ dân biết chữ nó có hệ số tương quan tốt nhất nhưng khi xét đến biết chữ thì lại có
tính cả đàn ơng và trẻ con.
2. Xây dựng mơ hình hồi quy tuyến tính.
Dùn g SPSS chạy hồi quy cho biến ngun nhân là tỷ lệ ph ụ nữ biết chữ và biến kết quả là tuổi thọ
phụ nữ ta có các bảng sau:
Variables Entered/Removed(b)
Model
Variables
Entered
Variabl es
Removed Meth od
1
T ỉ lệ nữ
gi ới biết
chữ (%)(a)
. Enter
a All requested variables entered .
b Depend en t Variable: Tuổi thọ T B phụ nữ
Mo del Su mmary
Model R R S quare
Adjusted R
Square
Std. Error of the
Esti mate
1
.81 9(a) .67 0 .666 6.19 5
a Predictors: (Constant), T ỉ l ệ nư õ giới biết chữ (%)
ANOVA(b)
T uổi thọ
TB phụ
nữ
Khí
hậu
chín h
T uổi thọ T B
phụ nư õ
Pearson
Correlation
1
.33 7(**
)
Sig. (2-tai led)
. .000
N
109 107
Khí hậu chính Pearson
Correlation
.33 7(**) 1
Sig. (2-tai led)
.000 .
N
107 107
Bài tập Phân tích định lượng MBA-08
14
Model
Sum of
Squares
df
Mean Square
F
Sig.
1 Regressio
n
6475.177
1
6475.177 168.698 .00 0(a)
Residual
3185.811
83
38.383
T otal
9660.988
84
a Predic tors: (Constant), T ỉ l ệ nư õ giới biết chữ (%)
b Depend en t Variable: Tuổi thọ T B phụ nữ
Coefficients(a)
Model
Unstandardi zed
Coefficients
Standardized
Coefficients
t Sig. B Std. Error Beta
1 (Constant)
47.170 1.72 6
27.337 .000
T ỉ l ệ nữ giới
biết c hữ (%)
.30 7 .02 4
.81 9 12 .988 .000
a Depend en t Variable: Tuổi thọ T B phụ nữ
Từ bảng kết quả ta có phương trình hồi quy với các hệ số B cho ở bản cuối cùn g Coeficients:
ˆ
47.17 0.307
i i
Y X
hay
47.17 0.307
i i
Y X
3. Đánh giá sự phù hợp và kiểm định mơ hình
a. Đánh giá sự phù hợp của m ơ hình:
Như đã thể hiện trong phần I thơng qua giá trị Rsquare ta có thể đánh giá độ phù hợp của mơ hình
giá trị Rsquare được SP SS tính trong bảng sau:
Model Summary
Model R
R
Square
Adjusted
R Square
Std. Error
of the
Estimate
1 .819(a) .670 .666 6.195
a Predictors: (Constant), Tỉ lệ nữ giới biết chữ (%)
Rsquare =0.67 có giá trị tương đối lớn hơn trung bình nhưng khơng q gần 1 điều này cho thấy mơ
hình có sự phù hợp tương đối và có nghĩa là các điểm trên đồ thị scatter khá rời rạc và khơng trùng
nhiều trên đường hồi quy. Điều này cho ta kết luận rằng tuổi thọ phụ n ữ khơng chỉ phụ thuộc vào việc
biết chữ m à còn phụ thuộc vào các vấn đề khác như số con sinh, lượng calogi nạp vào hay GDP tính
trên đầu người…Như vậy để có thể có mơ hình tốt hơn ta phải tìm hiểu và phân tích tuổi thọ phụ nữ
qua mơ hình hồi quy đa biến.
Rsquare
Bài tập Phân tích định lượng MBA-08
15
T y le phu nu biet chu( %)
120100806040200
Tuoi th o phu nu
90
80
70
60
50
40
b. Đánh giá sự phù hợp của m ơ hình cho tổng thể:
Như đã nêu trong phần lý thuyết tuy ta đã có giá trị Rsquar gần 1 và có kết luận là mơ hình phù hợp
nhưng đó chỉ là đánh giá trên mẫu, nhưng khơng ch ắc tổng thể có được Rsquare gần 1. Để xác định
vấn đề này ta đi kiểm định giả thuyết Ho: Rsquare pop =0, nếu k ết quả kiểm định bác bỏ giả thuyết
Ho thì ta có thể kết luận là mơ hình hồi quy tổng thể phù hợp.
SPSS cho ta kết quả kiểm định chỉ số F trong bản sau:
ANOVA(b)
Model
Sum of
Squares df Mean Square F Sig.
1 Regressio
n
6475.177
1
6475.177
168.698 .000(a)
Residual
3185.811
83
38.383
T otal
9660.988
84
a Predictors: (Constant), T ỉ l ệ nư õ giới biết chữ (%)
b Depend en t Variable: Tuổi thọ T B phụ nữ
Theo kết quả với mức ý nghĩa quan sát rất nhỏ 0.0001 nên ta có thể hòan tồn bác bỏ giả thuyết Ho
hay ta có thể nói mơ hình hồi quy t uyến tính của tổng thể có sự phù hợp.
c.kiểm định giả thuyết về hệ số hồi quy của tổng thể:
Như đã đề cập ở phần lý thuyết tuy ta có các giá trị hệ số của mơ hình hồi quy của mơ hình mẫu là B
1
là khác khơng nhưng ta khơng chắc là độ dốc của mơ hình tổng thể cũng khác khơng, do đó ta phải
tiến hành kiểm định độ dốc tổng thể qua sự bác bỏ giả thuyết Ho:
1
= 0.
Dùn g SPSS chạy kiểm định cho ta giá trị t như sau:
Coefficients(a)
Các đư
ờng thẳng p
hân b
ố khá rời rạc chứ
khơng trùng nhiều vào đường thẳng hồi
quy.
Giá trị F và mức ý nghĩa quan sát được Sig
Bài tập Phân tích định lượng MBA-08
16
Model
Unstandardi zed
Coefficients
Standardized
Coefficients
t Sig.
B Std. Error Beta
1 (Constant)
47.170 1.72 6
27.337 .000
T ỉ l ệ nữ giới
biết c hữ (%)
.30 7 .02 4
.81 9 12 .988 .000
a Depend en t Variable: Tuổi thọ T B phụ nữ
Theo kết quả với mức ý nghĩa quan sát rất nhỏ 0.0001 nên ta có thể hòan tồn bác bỏ giả thuyết Ho
hay ta có thể nói mơ hình hồi quy t uyến tính của tổng thể có độ dốc
1
khác khơng.
4. Mơ hình đa biến, chọn lựa biến ngun nhân, xây dựng và đánh giá.
Chọ lựa biến ngun nhân:
Sau khi dùng SPSS chạy lần lượt nhiều biến ngun nhân thì nhận thấy có các biến phù hợp nhất để
cho ra m ơ hình hồi quy bội với biến kết quả là tuổi thọ phụ nữ. đó là các biến ngun nhân sau:
- Tỷ lệ phần trăm dân số biết chử.
- Số lượng lần sinh con.
- Lượng clogi nạp vào.
Lập ma trận tương quan giữa các biến trên với biến kết quả tuổi thọ phụ nữ bằng SPSS:
Correlations
T uổi thọ
T B phụ
nữ
T ỉ l ệ d ân
bi ế t chữ
(%)
Số c on T B
của 1 ph ụ
nữ
Calori nạp
hàng
ngày TB 1
người
Tuổi tho ï T B phụ
nữ
Pearson Correlation
1
.86 5(**) 838 (**) .775(**)
Sig. (2-tai led)
. .000 .00 0 .000
N
109 107 107 75
Tỉ lệ dân biết
chữ (%)
Pearson Correlation
.86 5(**) 1 866(**) .682(** )
Sig. (2-tai led)
.000 . .000 .000
N
107 107 105 74
Số c on T B c ủ a 1
phụ nữ
Pearson Correlation
83 8(**) 866(**) 1 696(**)
Sig. (2-tai led)
.000 .000 . .00 0
N
107 105 107 75
Calori nạp hàng
ngày T B 1 người
Pearson Correlation
.77 5(**) .682(**) 696(**) 1
Sig. (2-tai led)
.000 .000 .00 0 .
N
75 74 75 75
** Correlati on is signi ficant at the 0.01 level (2-tailed ).
Ta thấy các hệ số tương quan R là khá cao so với các biến ngun nhân với biến kết quả, đây là tính
hiệu lạc quan cho việc đi phân tích hồi quy bội theo ba biến ngun nhân trên.
Đồn g thời cũng có sự tương quang lớn giữa các biến ngun nhân với nhau, điều này rất dể xãy là
hiện tượng đa cộng tuyến nhưng khơng là chắc chắn, do đó ta tiếp tục khảo sát ở phần xây dựng mơ
hình và kiểm định mơ hình.
Xây dựng mơ hình hồi quy bội:
Sử dụng SP SS chạy hồi quy bội t uyến tính ta có bảng kết quả sau:
Variables Entered/Removed(b)
Giá trị t và mức ý nghĩa quan sát được.
Các giá tr
ị R t
ương
quang giữa biến ngun
nhân và biến kết quả khá
lớn
Bài tập Phân tích định lượng MBA-08
17
Model
Variables
Entered
Variabl es
Removed
Meth od
1
Calori nạp
hàng ngày
T B 1 người,
T ỉ l ệ d ân
bi ết chữ
(%), Số c on
T B của 1
phụ nữ(a)
. Enter
a All requested variables entered .
b Depend en t Variable: Tuổi thọ T B phụ nữ
Model Summary
Model R R S quare
Adjusted R
Square
Std. Error of the
Esti mate
1
.91 2(a) .83 2 .825 4.78 9
a Predictors: (Constant), Calori nạp ha øng nga øy T B 1 ng ười , Tỉ l ệ da ân biết c hữ (%), Số c on T B của 1 phụ nữ
ANOVA(b)
Model
Sum of
Squares df Mean Square F Sig.
1 Regressio
n
7962.254
3
2654.085 115.740 .00 0(a)
Residual
1605.205
70
22.932
T otal
9567.459
73
a Predictors: (Constant), Calori nạp ha øng nga øy T B 1 người, Tỉ lệ da ân biết chữ (%), Số c on T B của 1 phụ nữ
b Depend en t Variable: Tuổi thọ T B phụ nữ
Coefficients(a)
Model
Unstandardi zed
Coefficients
Standardized
Coefficients
t Sig. B Std. E rror Beta
1 (Constant)
40.498 6.700
6.044 .000
T ỉ l ệ dân biết
chữ (%)
.22 7 .049 .45 8 4.599 .000
Số c on T B của
1 phụ nữ
-1.4 30 .594 243 -2.407 .019
Calori nạp hàng
ngày TB 1
người
.00 6 .001 .29 6 4.244 .000
a Depend en t Variable: Tuổi thọ T B phụ nữ
Theo kết quả ta xây dựng được mơ hình hồi quy bội theo các biến n gun nhân đó như sau:
Y = 40.498 + 0.227X
1
– 1.430 X
2
+ 0.006X
3
+ e
Kiểm tra độ phù hợp của m ơ hình:
Model R R S quare
Adjusted R
Square
Std. Error of the
Esti mate
1
.91 2(a) .83 2
.825
4.789
Ta thấy mơ hình có độ phù hợp cao do Rsquare điều chỉnh cao 0.825
Kiểm định F cho m ơ hình,
Bác bỏ giả thuyết H0:
0
=
1
=
2
=
3
=0, nếu giả thuyết H0 bị bác bỏ lúc này ta sẽ kết luận rằng có sự
phù hợp của mơ hình cho tổng thể giửa các biến ngun nhân và biến kết quả.
Bài tập Phân tích định lượng MBA-08
18
Mod
el
Sum of
Squares
df
Mean Square
F
Sig.
1 Regressio
n
7962.254
3
2654.085 115.740
.00 0(a)
Residual
1605.205
70
22.932
T otal
9567.459
73
Kiểm tra hệ số
riêng phần:
Ta thấy từ kết quả chạy SPSS thì các hệ số riêng ph ân có mức ý nhĩa đều rất nhỏ và có hệ số tác
động riêng phần đến biến kết quả đều lớn việc này cho thấy các biến ngun nhân đã chọn đều có ý
nghĩa trong mơ hình.
Model
Unstandardi zed
Coefficients
Standardized
Coefficients
t
Sig.
B Std. E rror Beta
1 (Constant)
40.498 6.700
6.0 44
.00 0
T ỉ l ệ dân biết
chữ (%)
.22 7 .049
.45 8
4.5 99
.00 0
Số c on T B của
1 phụ nữ
-1.4 30 .594
243
-2.407 .019
Calori nạp hàng
ngày TB 1
người
.00 6 .001
.29 6
4.2 44 .00 0
Kết luận:
Phương pháp xây dựng mơ hình hồi quy tuyến tính đơn biến và đa biến cho cái nhìn khái qt về sự
liên hệ giữa các biến ngun nhân và kết quả, nhưng trong thực tế xã hội, khoa học hay kinh tế một
vấn đề nào đó ít khi chỉ chịu một ảnh hưởng duy nhất mà thơng thường nó bị ảnh hưởng bởi rất nhiều
tác nhân bên ngòai, đó là mối liên hệ chằng chéo, đơi khi các tác nhân cho một vấn đề nào đó lại có sự
liên hệ, chúng tương tác nhau giữa các biến ngun nhân làm cho sự liên kết trở nên phức tạp khơng
lường.
Do vậy mơ hình hồi quy t uyến tính đơn biến có tính chất học thuật nhằm tạo cho người nghiên cứu
một cái nhìn phổ qt về phương pháp hồi quy sau đó tiếp tục n ghiên cứu các mơ hình phức tạp hơn,
như mơ hình đa biến. Mơ đa biến có tính thực tế hơn, gần gũi với tự nhiên hơn. Do vậy nghiên cứu
mơ hình đa biến là cần thiết, nhưng khơng được nghiên cứu sâu sắc trong tiểu luận này do đây là
bước đầu làm quen với các cách sử dụng SPSS trong định lượng nói chung.
Gi
ả thuyết H0 bị bác bỏ do
mức ý nghĩa cua kiểm định F
rất nhỏ.
M
ức ý nghĩa cho
kiểm định là rất
nhỏ
Các h
ệ số beta
riêng phần lớn.