Tải bản đầy đủ (.pdf) (7 trang)

Mô hình hồi quy giải thích sự khác biệt về tuổi thọ của phụ nữ trên thế giới

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (280.81 KB, 7 trang )

Bài tập Phân tích định lượng

MBA-08

TRƯỜNG Đ ẠI HỌ C MỞ TP.HCM
LỚ P CAO HỌC Q UẢN TRỊ KINH DOANH KHÓA 8

TIỂU LUẬN MÔN HỌC:

PHÂN TÍCH Đ ỊNH LƯỢNG

ĐỀ TÀI TIỂU LUẬN:

NHÓM THỰC HIỆN:
Đào Hùng Anh.
Võ Phương H ồng Cúc.
Lê Trọng Đoan
Cao Văn Tuấn.

TP. Hồ Chí Minh, tháng 2 năm 2009
1


Bài tập Phân tích định lượng

MBA-08

ĐẠI HỌC MỞ TP. HỐ CHÍ MINH

CỘNG HÒA XÃ HỘI CHỦ NGHĨ A VI ỆT NAM
Độc lập – Tự do – Hạnh ph úc


-------------------

-------------

ĐỀ KIỂM TRA
MÔN:
LỚP:
Ghi ch ú:

PHÂN TÍCH ĐỊNH LƯỢNG
MBA8
Sinh viên làm bài theo nhóm

Yêu cầu:
Sử dụn g dữ liệu trong file World 95 Tieng Viet.sav đính k èm, bạn hãy tự xây dựn g cho mình một m ô
hình hồi quy giải thích sự khác biệt về tuổi thọ ph ụ nữ giữa các quố c gia trên thế giới.
Bạn được tự do lựa chọn các biến giải thích để đưa vào m ô hình cũn g như tự quyết định dạng thức
của các liên hệ giữa biến giải thích và biến kết quả.
Hãy mô tả chi tiết quá trình xây dựng mô hình của bạn và tăng tính thuyết phục của m ô hình này bằn g
các côn g cụ chẩn đoán và đánh giá m ô hình. Giải thích ý ngh ĩa các kết quả của mô hình rút ra.
Sản phẩm nộp:
1. Bài làm dạn g fi le Word ( có ghi tên các thành viên của nhóm ở trang đầu)
2. File output SP SS
Cả 2 file được đặt tên như sau MBA8_KT_nhom X (X là số thứ tự nhóm )
Hình thức:
File Word định dạn g khổ giấy A4 (canh lề 2cm m ỗi phía),
font chữ Time New Roman, cỡ 12 points
Cách đoạn ( Spacin g before) 6 points, giãn dòng ( line spa cin g) 1.2

Chúc thành c ông!


2


Bài tập Phân tích định lượng

MBA-08

Lời nói đầu:
Phân tích định lượng là m ôn học nh ằm trang bị kiến thức và phương ph áp trong việc xây dựn g m ô
hình, thu thập thông tin về thị t rường và đời sốn g xã hộ i, phân tích số liệu, đánh giá số liệu nhằm khái
quát hóa các vấn đề n ghiên cứu trong mô hình đã xây dựng. Đằn g sau nhữn g kiến thức đó cần có kiến
thức về thống kê toánvà c ác kỹ năng sử dụn g các loạ i phần mềm ch uyên n gh iệp cho bộ m ôn này như
SPSS, E VIEW S hay Excel. Qua đó ta thấy đây là m ột lĩnh vực rộn g lớn cần có sự trau dồi và tích lũy
kiến thức lâu dài cũng như sự yêu nghề để đạt được sự hiểu biết tường tận và thực hiện tốt công việc
này.

Trong hệ thống kiến thức rộng lớn đó kỹ thuật hồi quy tuy ến tính là một kỹ thuật hay m ô hình quan
trọng để tìm ra sự tương quan của các biến nguy ên nhân và kết quả để ta có thể hình dun g tương đối
mối liên kết đó, giúp ta có thể ứn g dụng mô hình trong thực tế đời sốn g xã hộ i hay kinh tế. Trong tiểu
luận ch úng ta đi n ghiên cứu t uổi thọ của ph ụ nữ kh ác nhau nh ư thế nào trên thế giới thông qua các
biến nguyên nhân như GDP, học vấn hay số lượn g sinh sản … sau đó đánh giá mô hình thông qua các
chỉ số liên k ết, các ch ỉ số v ề sự chính xác và tươn g quan của các biến n ghiên cứu.
Nhóm xin chân thành biết ơn và cảm t ạ thầy Hoàng Trọng, đã hết lòng truyền thụ kiến thức và chia sẻ
những kinh nghiệm quý báu trong quá trình hướng dẫn lớp MBA-08 môn học phân tích định lượn g.
Kính ch úc thầy nhiều sức khỏ e để tiếp tục truyền th ụ sự hiểu biết cho các khóa đàn em mai sau.

3



Bài tập Phân tích định lượng

MBA-08

MỤC LỤC
I. Lý thuyết về hồi quy tuy ến tính.
1. Hệ số tương quan đơn.
2. Xây dựn g ph ươn g trình hồi quy tuyến tính.
3. Đánh giá sự phù hợp của m ô hình.
4. Kiểm định giả thuyết về độ ph ù hợp của m ô hình và ý nghĩa c ủa h ệ số hồi quy.
5. Hồi quy bội, những vấn đề cần quan tâm khi thực hiện.
II. Ứ ng dụn g Hồi quy tuyến tính vào để xây dựn g m ột m ô hình hồi quy giải thích sự khác biệt về tuổi
thọ phụ nữ giữa các quốc gia trên thế giới.
1. Xác định biến n guy ên nhân và k ết quả.
2. Xây dựn g m ô hình hồi quy t uyến tính.
3. Đánh giá sự phù hợp và kiểm định mô hình.
4. Mô hình đa biến, chọn lựa biến nguyên nh ân, xây dựn g và đánh giá.
Kết luận

4


Bài tập Phân tích định lượng

MBA-08

I.Lý thuyết tổng quát về hồi quy đơn biến.
1. H ệ số tương quan.( correlatio n co efficient)

- Hệ số tươn g quan r nhằm nói lên sự liên kết chặt chẽ giữa h ai biến nào đó.

- Hệ số tương quan cho m ẫu là ước lượn g của hệ số tương quan r để đo lường mối liên k ết tuyến chặt
chẽ giữa các biến của mẫ u.
- Hệ số này không có đơn vị.
- Hệ số này có giá trị biến thiên từ -1 đến 1.
- Khi có giá trị âm hệ hai biến có tươn g quan nghịch biến.
- Khi có giá trị dương hệ hai biến có tươn g quan đồn g biến.
- Khi gía trị này bằng khôn g thì hai biến khôn g có liên k ết.

Nghịch biến

-

Đồng biến

Khôn g có mối liên hệ.

Côn g thức tính toán hệ số tươn g quan mẫu:

Trong đó:
r: hệ số tương quan, X : gía trị hệ số nguyên nhân, Y: giá trị hệ số kết quả, X: hệ số trun g bình biến
nguyên nh ân, Y: giá trị trung bình biến k ết quả, n : độ lớn mẫ u.
- Giá trị r giữa hai biến có thể là r ất thấp nhưng chưa hẳn hai biến đó hoàn toàn khôn g có mối liên hệ,
có thể nó lại có dạn g liên quan khác như liên hệ phi tuyến.
- Giá trị r có thể là rất cao có khi gần bằn g 1 nhưng thực tế khôn g có sự liên quan nào, n gười ta gọi là
sự tươn g quan giả, ví dụ như n gười ta ngh iên cứu số lượng trẻ sơ sinh phụ thuộc vào dân số c ủa thành
phố HCM có sự tươn g quan rất cao vào năm 200x nhưng thực tế hai biến này có sự tương quan giả,
do khoản thời gian đó k inh tế suy giảm các n ăm gần đó tỷ lệ sinh giảm, nhưng đặc biệt năm đó là năm

5



Bài tập Phân tích định lượng

MBA-08

may mắn nên các gia đình quy ết định sinh con nhiề u. Nh ư vậy t a thất ở đây tương quan thật phải là số
lượn g trẻ sơ sinh và n ăm t ốt.
- Như vậy h ệ số tương quan ch ỉ được coi là m ột chỉ số nói lên sự chặt chẽ giữa các biến.
2.Xây d ựng phương trình hồi quy tuyến tính:
Sau khi đã nghiên cứu hệ số tươn g quan r, ta thấy rằng có thể hai biến có hệ số tương quan chặt chẽ
một cách tuyến tính nhưng thực tế thì không có sự liên hệ nào về thực chất, do vậy để xây dựn g
phương trình hồi quy tuy ến tính của các biến với nhau thì xem như ta đã nghiên cứu thấu đáo về sự
liên quan giữa chúng trong thực tế, và có xét đến hệ số tươn g quan cần thiết khá cao.

Sau đó ta tiến hành xây dựng mô hình. Lý thuyết thông thường người ta đặt biến Y là biến k ết quả và
biết X nguyên nhân, X được đặt trên trục hoành và Y đặt trên trục tung. Trong phần nghiên cứu c ủa
tiểu luận ta chi đi khảo sát m ối liên quan tuyến tính theo đường thẳng đố i với m ối liên hệ theo các
hình khác như p ara bol hay hình gấp kh úc không được đề cập.
Phươn g trình hồi quy tuyến tính của tổng thể và mẫu có dạn g đườn g thẳng như sau:
Yi = 0 +  1Xi + , Yi = B0 + B1Xi + 
Trong đó Y là biến kết quả dự đoán thứ i, Xi là biến nguyên nhân thứ i, B0 hệ số tươn g quan tun g độ
góc là giá trị của Y khi X bằn g khôn g, B1 là hệ số tươn g quan độ dốc của đường thẳng biểu diễn m ô
hình hồi quy,  là gía trị khác biệt giữa hồi quy và giá trị thực tế.

Ý nghĩa của các hệ số :
- B0 nói lên giá trị của biến dự đoán kh i gía trị n guyên nh ân bằn g khôn g.
- B1 độ dốc của đường hồi quy nhằm nói lên r ằn g khi giá trị X thay đổi một đơn vị thì giá trị Y sẽ thay
đổi X. B1 đơn v ị.
-  nói lên sự khác biệt giữa giá trị hồ i quy v à gía trị thực tế, ví dụ một biến kết quả có thể ảnh h ưởn g
bởi rất nhiều biến n guyên nhân nh ưn g ta lại chỉ khảo sát một biến n guyên nhân duy nhất, điều này đưa

đến sự có giá trị khác biệt này, khi giá trị  càng nhỏ thì sự ảnh hưởng của biến n guyên nhân đó càn g
lớn và càn g có sự chính xác kh i áp dụng mô hình hồi quy.
- Ví dụ khi ta khảo sát chi ều c ao của của đứa trẻ 8 tuổi t heo chế độ dinh dưỡn g thì ta có gía trị  lớn,
thì có nghỉa rằn g chiề u cao của đứa trẻ ph ụ th uộc v ào dinh dưỡn g v à còn phụ thuộc v ào các biến khác
như chiều cao của cha mẹ, nơi ăn chốn ở hay cách chăm sóc… hay nói cách khác gía trị  nhằm nói
đến sự sai lệch do ta ch ưa khảo sát hết tất cả các biến ảnh hưởn g đến biến phụ thuộc mà ta đang khảo
sát.

- Sau khi có được mô hình hồi quy tuyến tính ta có thể t ính gía trị biến phụ thuộ c thông qua giá trị
biến không ph ụ thuộc với một giá trị chênh lệch  nào đó mà ta chưa biết, nhưn g giá trị đó nhỏ hơn

6


Bài tập Phân tích định lượng

MBA-08

giá trị sai biệt khi ta chỉ t ính trị trung bình so với giá trị thực tế cần khảo sát. Để hiểu hơn ta có thể đi
đến m ục sau: Đánh giá sự phù hợp của m ô hình hồi quy tuy ến tính.

3.Đánh giá sự phù hợp của m ô hình:
Vấn đề quan trọng tron g c ác m ô hình hồi quy là phải ch ứng minh được sự phù hợp của m ô hình mà ta
đan g khảo sát, hầu nh ư khôn g có đườn g thẳng hồi quy nào đều hoàn t oàn phù hợp với tập dữ liệu
khảo sát và luôn có gía trị sai lệch giữa các trị dự báo từ hồi quy v à giá trị thực tế, sự sai lệch này thể
hiện qua phần dư . Do vậy người ta phải n ghỉ đến một thước đo nào đó để chỉ ra mức độ ph ù hợp
của mô hình.

Thông thường thước đo cho mô hình tuyến tính được dùn g là hệ số xác định R2. R2 được tính theo
công thức:


Trong đó SSR được xem như là giá trị sai lệch giữa gía t rị dự đo án theo hồi quy so với giá trị trung
bình của tập dữ liệu, nó nói lên ph ần giá trị m à ta có thể ước lượng gần với thực tế hơn khi có ph ươn g
pháp hồi quy so với khi ta chỉ t ính giá trị trun g bình của tổng thể tập mẫu.

Ví dụ khi ta tính thu nhập theo đầu người của thành phố HCM thì giá trị là 5 triệu đồn g/n gười như
vậy khi một gia đình có 3 người đi làm thì ta có t hể hiểu là gia đình n ày thu nhập là 15 triệu đồn g.
Nhưng ta đã biết lươn g bổn g thì ph ụ thuộc vào rất nhi ều vấn đề như trình độ học thức, năm kinh
nghi ệm , loại công ty hay sự quan h ệ vớ i cấp trên … như v ậy khi ta dùn g m ô hình hồi quy để tính
lươn g của m ột người theo trình độ học v ấn thì ta có thể tính như sau:
Lương = B0 + B1*t rình độ = 1 + 2.5*trình độ, khi xét đến một người có học vị đại học anh ta có gía
trị trình độ là 3 thì Lương =1 +2.5*3 =8.5 triệu. Như vậy khoản chênh lệch 3.5 triệu giữa giá trị trung
bình và giá trị tính theo hồi là SSR.

Giá trị SST được định nghĩa khá đơn giản là giá trị sai lệch giữa giá trị trun g bình của tập khảo sát và
giá thị thực tế của một giá trị thực tế nào đó.

Như vậy t ừ công thức ta có thể thấy giá trị R2 sẽ nằm trong khoảng từ 0 đến 1 khi R2 càng gần 0 thì
mô hình không ph ù hợp do m ô hình hồi quy không có tác dụng làm sai lệch nhỏ đi m à nó cũn g giốn g
như tính trung bình mà thôi. Khi R2 càng gần về 1 thì m ô hình càn g ph ù hợp do m ô hình hồi quy, làm
gía trị dự đoán hầu như ch ính xác với gía trị thực tế.
Ngoài SST và SSR người ta còn có SSE là giá trị chênh lệch giữa giá trị thực tế và giá trị hồi quy, giá
trị này chính là sai số .

7



×