Tải bản đầy đủ (.doc) (30 trang)

tiểu luận kinh tế lượng tác ĐỘNG của các đặc điểm NHÀ ở đến GIÁ NHÀ tại HAI THÀNH PHỐ COTO DE CAZA và DOVE CANYON

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (283.27 KB, 30 trang )

TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG
KHOA KINH TẾ QUỐC TẾ
---------***--------

TIỂU LUẬN KINH TẾ LƯỢNG

PHÂN TÍCH TÁC ĐỘNG CỦA CÁC ĐẶC ĐIỂM
NHÀ Ở ĐẾN GIÁ NHÀ TẠI HAI THÀNH PHỐ
COTO DE CAZA VÀ DOVE CANYON

Giáo viên hướng dẫn

: ThS. Nguyễn Thúy Quỳnh

Lớp tín chỉ

: KTE309.3

Nhóm sinh viên thực hiện :
Nguyễn Tùng Linh
Nguyễn Linh Chi
Nguyễn Thu Trang

1611110353
1611110077
1611110607

Hà Nội, tháng 6 năm 2018

1



Đánh giá thành viên
Mã số sinh viên

Họ và tên

1611110607

Nguyễn Thu Trang

1611110353

Nguyễn Tùng Linh 10

1611110077

Nguyễn Linh Chi

Điểm trung bình cá nhân

Thu Trang

Tùng Linh

Linh Chi

10

10
10


10

10

10

10

10

2


Mục lục
LỜI MỞ ĐẦU..................................................................................................................4
I.

Phần I: Cơ sở lý thuyết:...........................................................................................6
1. Mô hình Hedonic..................................................................................................6
2. Mô hình nghiên cứu..............................................................................................8
3. Số liệu và đo lường các biến:................................................................................9

II.

PHẦN II: NỘI DUNG......................................................................................... 10

1. Mô hình nghiên cứu............................................................................................ 10
2. Dữ liệu nghiên cứu.............................................................................................. 10
3. Kết quả ước lượng OLS:..................................................................................... 12

3.1. Ý nghĩa của hệ số hồi qui riêng phần........................................................... 14
3.2. Khoảng tin cậy của các tham số................................................................... 15
3.3. Kiểm định..................................................................................................... 16
3.3.1.

Kiểm định hệ số hồi quy (Phương pháp p-value)................................... 16

3.3.2.

Kiểm định sự phù hợp của mô hình....................................................... 17

3.3.3.

Kiểm định vi phạm giả thiết................................................................... 18

3.3.3.1. Kiểm định Bỏ sót biến....................................................................... 18
3.3.3.2. Vấn đề đa cộng tuyến....................................................................... 19
3.3.3.3. Phương sai sai số thay đổi................................................................ 22
3.3.3.4. Phân phối chuẩn của nhiễu.............................................................. 25
3.3.3.5. Tự tương quan.................................................................................. 25
3.3.4.

Kết quả tóm tắt và một số phương hướng khắc phục khuyết tật.............25

DANH MỤC TÀI LIỆU THAM KHẢO...................................................................... 29

3


LỜI MỞ ĐẦU

Thị trường bất động sản (BĐS) là một trong những thị trường quan trọng của nền kinh tế
vì liên quan trực tiếp tới một lượng tài sản rất lớn về quy mô, tính chất cũng như giá trị
nhiều mặt trong nền kinh tế quốc dân
Là cường quốc số một thế giới, thị trường bất động sản Mỹ luôn có sức hút đặc biệt
đối với các nhà đầu tư không chỉ trong mà còn cả ngoài nước, được đánh giá là tăng
trưởng ổn định ( 5 -7%/ năm) , ít biến động. Điều này hoàn toàn được lý giải là bởi thị
trường bất động sản ở Mỹ được hỗ trợ với pháp lý minh bạch, chính sách an toàn, đồng
đô la Mỹ (USD) liên tục tăng trong những năm qua; tính thanh khoản cao, dễ mua, dễ bán
và dễ cho thuê;… Nói đến nhà đất Mỹ, không thể không kể đến những trung tâm bất
động sản sầm uất bậc nhất như New York, San Francisoco, Las Vegas với những cái giá
trên trời. Bên cạnh đó, các nhà đầu tư cũng đang hướng sự chú ý của mình vào những
thành phố nhỏ, lẻ nhưng lại sở hữu nhiều giá trị tiềm ẩn về bất động sản như Coto de
Caza (hạt Orange); Dove Canyon (bang California), nơi được các hộ gia đình lựa chọn để
định cư lâu dài... Có thể nói, việc chuyển hướng sang các thị trường nhỏ lẻ như vậy chứa
nhiều yếu tố rủi ro nhưng lại mở ra nhiều cơ hội mới mẻ hơn cho các nhà đầu tư.
“ An cư “ thì mới lạc nghiệp”, nhu cầu nhà ở nơi các gia đình mong muốn sẽ sinh
sống lâu dài ngày càng gia tăng. Giá nhà ở vì thế cũng phụ thuộc vào rất nhiều yếu tố .
Nhưng đặc biệt đối với thị trường Coto de Caza và Dove Canyon chúng ta chỉ cần quan
tâm đến những yếu tố liên quan đến cơ sở vật chất, nội thất, kiến trúc, của ngôi nhà. Tình
trạng cơ sở vật chất khác nhau nghĩa là hai ngôi nhà sẽ có giá trị khác nhau, từ đó suy ra
giá trị của chúng trên thị trường là khác nhau. Xuất phát từ thực tế khách quan,và nhu cầu
cấp thiết đó, nhóm chúng em quyết định chọn đề tài nghiên cứu TÁC ĐỘNG CỦA CÁC
ĐẶC ĐIỂM NHÀ Ở ĐẾN GIÁ NHÀ TẠI HAI THÀNH PHỐ COTO DE CAZA VÀ
DOVE CANYON, tiến hành khảo sát mô hình hồi quy để tìm ra sự phụ thuộc của giá nhà
đến các

4


yếu tố cấu trúc và môi trường xung quanh nhằm tìm ra giải pháp giúp người bán và cho

thuê đạt được mục tiêu lợi nhuận, giúp người mua năm bắt được thông tin giá cả kịp thời.

5


I.

Phần I: Cơ sở lý thuyết:

1.

Mô hình Hedonic

Mô hình Hedonic dựa trên lý thuyết người tiêu dùng của Lancaster (1966). Kể từ khi
Rosen (1974) mở rộng lý thuyết này ra thị trường nhà ở, mô hình Hedonic đã được ứng
dụng rộng rãi như là một công cụ để đánh giá thị trường BĐS và phân tích đô thị. Rosen
(1974) đã đưa ra cách xử lý toàn diện đối với giá ẩn hay giá thụ hưởng. Lý thuyết giá ẩn
đã tạo ra một vấn đề trong kinh tế học cân bằng không gian, giúp định hướng người tiêu
dùng cũng như người sản xuất đưa ra các quyết định về vị trí liên quan đến các đặc điểm
không gian.
. Phương pháp định giá Hedonic được định nghĩa là kỹ thuật phân tích hồi quy được
sử dụng để xác định giá trị của những thuộc tính liên quan đến hàng hóa trên thị
trường trong các giai đoạn cụ thể. Những thuộc tính có thể đo lường được như kích cỡ,
tốc độ, trọng lượng,…sẽ ảnh hưởng đến giá trị của hàng hóa. Theo Griliches (1971),
phương pháp Hedonic dựa trên cơ sở: giá của một hàng hóa không đồng nhất có thể
được xác định thông qua những thuộc tính liên quan đến hàng hóa đó.
Vì thế, hàm hồi quy Hedonic có dạng: pi = h(ci),
• Pi là giá của hàng hóa
• Ci là vector của các đặc tính liên quan đến hàng hóa.
Mô hình Hedonic được dựa trên lý thuyết người tiêu dùng của Lancaster (1966). Kể từ

khi Rosen (1974) mở rộng lý thuyết này ra thị trường nhà ở, mô hình Hedonic đã được
ứng dụng rộng rãi như là một công cụ để đánh giá thị trường BĐS và phân tích đô thị.
Rosen (1974) đã đưa ra cách xử lý toàn diện đối với giá ẩn hay giá thụ hưởng. Lý thuyết
giá ẩn đã tạo ra một vấn đề trong kinh tế học cân bằng không gian, giúp định hướng
người tiêu dùng cũng như người sản xuất đưa ra các quyết định về vị trí liên quan đến các
đặc điểm không gian
6


Cả hai hướng tiếp cận đều nhằm mục tiêu ước tính giá trị và số lượng thuộc tính dựa
trên những sản phẩm khác nhau được đưa vào quan sát. Lancaster đã xây dựng nền tảng
lý thuyết cho mô hình Hedonic: sự thỏa dụng của người tiêu dùng có được từ những đặc
tính của sản phẩm, chứ không phải trực tiếp từ sản phẩm đó. Hiện nay, phương pháp định
giá Hedonic được áp dụng rộng rãi tại các quốc gia phát triển.Theo Malpezzi (2003),
trong quá trình phát triển, thị trường nhà ở là một trong ứng dụng rộng rãi của mô hình
định giá Hedonic, vì nhà ở là hàng hóa không đồng nhất; đồng thời nhu cầu của người
tiêu thụ cũng không đồng nhất.
Thật vậy, một căn hộ gồm nhiều đặc điểm riêng biệt về diện tích, chất lượng, vị trí,…
Mỗi căn nhà có một vị trí nhất định, thời gian xây dựng khác nhau, có diện tích khác
nhau. Bên cạnh đó, mức độ thỏa dụng của người mua khác nhau, định giá căn hộ
cũngkhác nhau. Một căn hộ có cùng một nhóm đặc điểm được định giá khác nhau theo
từng người mua. Việc định giá vì thế cũng trở nên khó khăn. Từ đó, phương pháp
Hedonic được sử dụng phổ biến vì nó ước tính được giá trị của các đặc điểm riêng lẻ cấu
thành nên giá trị chung của cả căn hộ. Theo nghiên cứu ứng dụng mô hình Hedonic trong
thị trường nhà ở của Thibodeau và Malpezzi (1980), phương pháp định giá Hedonic là
một mô hình hồi quy của giá trị hoặc giá thuê căn hộ dựa trên những đặc tính liên quan
đến căn hộ. Trong đó, từng biến độc lập đại diện cho từng đặc điểm riêng biệt và các hệ
số trong kết quả của mô hình là giá tiềm ẩn của những đặc điểm này. Mô hình hồi quy
của giá thuê nhà hoặc giá trị căn hộ có dạng như sau:
R = f (S, N, L, C, T),

Trong đó: R là giá thuê hoặc giá trị căn hộ; S là những đặc điểm thuộc cấu trúc; N là
đặc điểm thuộc môi trường xung quanh; L là vị trí; C là đặc điểm về hợp đồng giao dịch
và T là thời hạn căn hộ được quan sát.
Lợi thế của mô hình Hodenic là tính linh hoạt, có thể sử dụng ngay được các dữ liệu giao
dịch đang diễn ra và dữ liệu về đặc tính của một bất động sản có thể khai thác từ rất nhiều
7


nguồn khác nhau. Kết quả của phương pháp này là cho kết quả đáng tin cậy trong việc
xác định giá trị cho một bất động sản. Ngoài ra mô hình Hodenic còn giúp chúng ta dự
đoán được bong bóng cục bộ của thị trường bất động sản khi giá trị giao dịch của khu vực
đó cao hơn nhiều so với giá trị tính toán cho bởi mô hình. Khi xây dựng và đánh giá sai
số của mô hình, chúng ta cũng có thể lựa chọn được đặc trưng ảnh hưởng nhiều đến giá
đất trên quan điểm ít đặc tính nhất và sai số nhỏ nhất.
2.

Mô hình nghiên cứu

Nội dung của bài tiểu luận sẽ đi nghiên cứu sự ảnh hưởng giá nhà theo các yếu tố sau:
- Những đặc điểm thuộc cấu trúc:
Ln(Sqft): Diện tích của ngôi nhà lấy theo logarit
Bedrms: Số phòng ngủ
Baths: Số phòng tắm
Garage: Số chỗ để xe ô tô
Age: Tuổi của nhà
- Những đặc điểm thuộc môi trường xung quanh ngôi nhà:
City: Vị trí nhà ở thành phố nào
Khi đưa vào mô hình hồi quy kinh tế lượng, biến SalePric là biến phụ thuộc, còn
các biến Sqft, Bedrms, Baths, Garage, Age, City là biến độc lập. Ta xét mô hình hồi quy
kinh tế:

SalePr= β1 + β2 Sqft + β3 Bedrms + β4 Baths + β5 Garage + 6Age + 7City + Ui

8


Dự đoán dấu của các hệ số dựa vào lý thuyết /kinh nghiệm thực tế: Do theo lý thuyết
trong các ngành khác cũng như trong thực tế, ta thấy diện tích nhà tác động cùng chiều
với giá nhà, tức là diện tích nhà càng lớn thì diện tích nhà càng có xu hướng tăng. Vì thế
β2 mang dấu (+) Tương tự với các biến số phòng ngủ, số phòng tắm, số chỗ để ô tô càng
lớn thì giá nhà càng có xu hướng tăng. Vì thế β 3, β4, β5 đều mang dấu (+) Ngược lại, tuổi
của nhà, tuổi của thành phố càng tăng, thì người mua nhà sẽ cảm thấy chất lượng ngôi
nhà sẽ bị giảm đi, vì thế biến tuổi của nhà và tuổi của thành phố có tác động ngược chiều
với giá nhà và 6, 7 mang dấu (-)
3.

Số liệu và đo lường các biến:
-

Số liệu lấy từ phần mềm Gretl, ở bộ Ramanathan, data 7-24. Sale price and
characteristics of homes.

-

Số quan sát : 224

-

Salepric: Giá nhà ở (Nghìn đô la ( $) )

-


Sqft: Diện tích của ngôi nhà (feet vuông)

-

Bedrms: Số phòng ngủ (phòng)

-

Baths: Số phòng tắm (phòng)

-

Garage: Số chỗ để xe ô tô (chỗ)

-

Age: Tuổi của nhà (tuổi)

-

City: = 0: Nhà ở Dove Canyon, = 1: Nhà ở Coto de Caza.

9


II.

PHẦN II: NỘI DUNG


1.

Mô hình nghiên cứu

* Mô hình toán kinh tế:

Salepric = β1 + β2 sqft + β3 bedrms + β4 baths + β5 garage + β6 age + β7 city + ui

*Mô hình kinh tế lượng:
̂ ̂

̂̂

̂

̂

̂

̂

̂

= + sqft + bedrms + baths + garage + age + city

salepric β1 β2β3β4β5β6β7

2.

Dữ liệu nghiên cứu


BẢNG 1: Bảng mô tả thống kê
Variable

Mean

Minimum

Maximum

Salepric

642,93

349,00

2900,0

Sqft

4025.2

2583.00

11000

Bedrms

4,5625


2,0000

7,0000

Baths

4,1558

2,5000

8,0000

Garage

3,1607

2,0000

7,0000

Age

5,4732

0,0000

19,0000

City


0,52679

0,0000

1,0000

Nguồn: Nhóm tác giả tự nghiên cứu tổng hợp với sự hỗ trợ của phần mềm Gretl
Nhận xét:
 Hai thành phố Coto de Caza và Dove Canyon của bang California tại USA là hai
thành phố có nền kinh tế phát triển, đông dân cư, giá nhà dao động mạnh từ
349,00 đến 2900,00 ( nghìn $)
10


 Diện tích của nhà ở thuộc 2 thành phố này rất đa dạng, căn nhỏ nhất là 2583 feet
vuông, căn lớn nhất 11000 feet vuông, và diện tích trung bình đo lường được là
4025 feet vuông.
 Về tiện ích bên trong: số phòng tắm từ 2,5 đến 8 phòng/ 1 căn, số phòng ngủ từ 27 phòng/ căn, khả năng chứa của gara từ 2-7 chiếc ô tô.
 Nhà ở của hai thành phố này tương đối mới, độ tuổi trung bình của nhà ở là 5,4732
năm, trong đó cũng có những ngôi nhà khá lâu như 19 năm.
 Nhà ở phân bố khá đều giữa hai thành phố Coto de Cara và Dove Canyon
( trung bình giữa hai thành phố là 0,52679).
BẢNG 2: Bảng mô tả tương quan
Correlation coefficients, using the observations 1 - 224
5% critical value (two-tailed) = 0.1311 for n = 224
Salepric

sqft

Bedrms


Baths

garage

Age

City

1,0000

0,9193

0,5234

0,6982

0,6536

0,0900

0,5033

salepric

1,0000

0,5972

0.7397


0.5818

0.0244

0.4275

sqft

1,0000

0,5999

0,4268

-0,2126

0,2126

bedrms

1,0000

0,5961

-0,2144

0,2660

baths


1,0000

-0,0929

0,2421

garage

1,0000

0,2951

age

1,0000

city

Nguồn: : Nhóm tác giả tự nghiên cứu tổng hợp với sự hỗ trợ của phần mềm Gretl

11


Nhận xét:


Tương quan giữa các biến sqft, bedrms, baths, garage, age, city và biến salepric:

 r(salepric,sqft) = 0,9193 : mức độ tương quan rất cao, tương quan cùng chiều

 r(salepric,bedrms) = 0,5234 : Mức độ tương quan trung bình, tương quan cùng
chiều
 r(salepric,baths) = 0,6982 : Mức độ tương quan cao, tương quan cùng chiều
 r(salepric,garage) = 0,6536 : Mức độ tương quan cao, tương quan cùng chiều
 r(salepric,age) = 0,0900 : mức độ tương quan rất thấp, tương quan cùng chiều
 r(salepric,city) = 0,5033 : mức độ tương quan trung bình, tương quan cùng chiều
Từ kết quả trên có thể kỳ vọng rằng yếu tố diện tích ( sqft) là yếu tố có ảnh hưởng
cùng chiều và lớn nhất đến giá nhà. Trong khi đó, yếu tố tuổi của nhà (age) lại không
thực sự ảnh hưởng nhiều đến giá nhà.


Tương quan giữa các biến sqft, bedrms, baths, garage, age, city với nhau:

 r(sqft, bedrms) = 0,5972 : Mức độ tương quan trung bình, tương quan cùng chiều
 r(sqft, baths) = 0,7397 : Mức độ tương quan cao, tương quan cùng chiều
 r(bedrms, garage) = 0,4268 : Mức độ tương quan trung bình, tương quan
cùng chiều
 r(bedrms, age) = -0,2126 : Mức độ tương quan thấp, tương quan ngược chiều
 r(baths,age) = -0,2144: Mức độ tương quan thấp, tương quan ngược chiều
 r(baths, city) = 0,2660 : Mức độ tương quan thấp, tương quan cùng chiều
Từ kết quả trên có thể kỳ vọng rằng yếu tố diện tích (sqft) có ảnh hưởng lớn đến số
phòng tắm (baths) và số phòng ngủ ( bedrms) trong khi đó yếu tố tuổi của nhà (age) và
số phòng ngủ (bedrms) ảnh hưởng ít đến nhau và là ảnh hưởng là ngược chiều.
3.

Kết quả ước lượng OLS:

BẢNG 3: Kết quả ước lượng

12



Model 1: OLS, using observations 1-224
Dependent variable: salepric
Coefficient

Std. Error

t-ratio

p-value

Const

-698,069

75,242

-9,2777

<0,00001 ***

Sqft

0,222893

0,01165

19,1325


<0,00001 ***

Bedrms

-21,7851

15,3093

-1,4230

0,15617

Baths

10,0481

15,2165

0,6603

0,50974

Garage

134,113

21,2184

6,3206


<0,00001 ***

Age

5,71295

2,99978

1,9045

0,05817 *

City

87,8474

19,9034

4,4137

0,00002 ***

Mean dependent var

642,9294

S.D. dependent var

371,3762


Sum squared resid

3525538

S.E. of regression

127,4626

R-squared

0,885372

Adjusted R-squared

0,882202

F(6, 217)

279,3456

P-value(F)

4,08e-99

-1400,199

Akaike criterion

2814,397


2838,279

Hannan-Quinn

2824,037

Log-likelihood
Schwarz criterion

Nguồn: : Nhóm tác giả tự nghiên cứu tổng hợp với sự hỗ trợ của phần mềm Gretl
Dựa vào kết quả ước lượng từ bảng trên ta thu được:
̂̂

̂

̂

̂

̂

̂

̂

̂

(SRF) salepric = β1 + β2 sqft + β3 bedrms + β4 baths + β5 garage + β6 age + β7 city
̂̂
= -698,069+ 0,222893 sqft -21,7851 bedrms + 10,0481 baths + 134,113 garage


salepric

+ 5,71295 age + 87,8474 city

13


Mô hình cho thấy: diện tích của ngôi nhà, số phòng ngủ, số phòng tắm, số chỗ đỗ xe ô
tô, tuổi của ngôi nhà đều có tác động đến giá nhà ở.
2

Hệ số xác định R = 0.885372 cho ta biết rằng 88,5372% sự thay đổi của giá nhà là do
ảnh hưởng của các yếu tố diện tích, số phòng ngủ, số phòng tắm, số chỗ để xe oto, tuổi
của nhà và vị trí của nhà (thành phố nào). Còn lại 11,4628% sự thay đổi của giá nhà là do
các yếu tố khác (như hướng nhà, số mặt tiền,…).
3.1.

Ý nghĩa của hệ số hồi qui riêng phần

Hệ số hồi quy
β1= -698,069

Ý nghĩa
Khi diện tích nhà , số phòng ngủ, số nhà tắm, số chỗ để xe ô tô, số tuổi
của nhà bằng 0 ở thành phố Dove Canyon thì giá nhà trung bình là
-698,069 nghìn$
Tuy nhiên hệ số này là vô nghĩa vì trong thực tế diện tích nhà ở, số
phòng ngủ, số nhà tắm, số chỗ để xe ô tô, số tuổi của nhà không thể
đồng thời bằng 0 ở thành phố Dove Canyon.


β2 =

0,222893

Nếu diện tích nhà ở tăng 1 đơn vị (feet vuông) và các yếu tố khác
không đổi thì giá nhà trung bình tăng 0,222893 nghìn$

β3

= -21,7851

Nếu số phòng ngủ tăng 1 phòng và các yếu tố khác không đổi thì giá
nhà trung bình giảm 21,7851 nghìn$

β4

= 10,0481

Nếu số phòng tắm tăng 1 phòng và các yếu tố khác không đổi thì giá
nhà trung bình tăng 10,0481 nghìn$

β5

= 134,113

Nếu số chỗ để xe ô tô tăng 1 chỗ và các yếu tố khác không đổi thì giá
nhà trung bình tăng 134,113 nghìn$

β6


= 5,71295

Nếu số tuổi của nhà tăng 1 tuổi và các yếu tố khác không đổi thì giá
nhà trung bình tăng 5,71295 nghìn$
14


Với các yếu tố khác như nhau, chênh lệch giữa giá nhà trung bình ở

β7= 87,8474

thành phố Coto de Caza và giá nhà trung bình ở thành phố Dove
Canyon là 87,8474 nghìn$

Ước lượng phương sai của nhiễu
̂̂2

RSS

∑ ei2

δ

=

=
n−7




n−7

3525538

=

224−7

=16246,7189

Vậy sự biếnđộnggiátrị củabiếnphụ
thuộcgiánhà đo bằngphươngsaido các
̂̂2

= 16246,7189

yếu tố ngẫu nhiên gây ra là δ

3.2.


Khoảng tin cậy của các tham số
Khoảng tin cậy của β2

̂̂

α

̂̂ -̂ t


β 2 ∈ (β 2- t

α

̂̂

SE(β 2); β2

(n−7,

)

SE(β2)) = (0,1 99931; 0,245854)

(n−7,

2

)
2

Vậy với mức ý nghĩa α= 0,05, khi diện tích nhà ở tăng thêm 1 đơn vị (feet vuông) thì giá nhà tăng
thêm tối thiểu 0,199931; tối đa là 0,245854 (nghìn) Với các yếu tố khác không đổi


ảậủβ

̂̂- t


α

̂̂ -̂ t

β3 ∈ (β3

α

̂̂

SE(β 3); β3

(n−7,

)

SE(β3)) = (-51,95 90; 8,38894)

(n−7,

2

)
2

Kết luận: sai sót dữ liệu


ảậủβ


̂̂- t

α

̂̂ -̂ t

β4 ∈ (β4

α

̂̂

SE(β 4); β4

(n−7,

)
2

SE(β4)) = (-19,9 430; 40,0 392)

(n−7,

)
2

Kết luận: Sai sót dữ liệu
15





ảậủβ
̂̂- t

α

̂̂ -̂ t

β5 ∈ (β5

α

̂̂

SE(β 5); β5

(n−7,

)

SE(β5)) = (92,2925 ; 175,934)

(n−7,

2

)
2


Vậy với mức ý nghĩa α= 0,05, khi số chỗ để xe oto tăng lên 1 chỗ thì giá nhà tăng thêm tối thiểu 92,2925 và tăng tối đa 175,934 (nghìn), với các yếu tố khác
không đổi


ảậủβ

̂̂- t

α

̂̂ -̂ t

β6 ∈ (β6

α

̂̂

SE(β 6); β6

(n−7,

)

SE(β6)) = (-0,199479; 11,6254)

(n−7,

2


)
2

Kết luận: Sai sót dữ liệu


ảậủβ

̂̂- t

α

̂̂ -̂ t

β7 ∈ (β7

α

̂̂

SE(β 7); β7

(n−7,

)

SE(β7)) = (48 ,6 18 7; 127,0 76)

(n−7,


2

)
2

Vậy với mức ý nghĩa α= 0,05, chênh lệch giá nhà ở thành phố Coto de Caza và giá nhà ở thành phố
Dove Canyon tối thiểu là 48,6187 và tối đa là 127,076 (nghìn đô ) Với các yếu tố khác không đổi.

3.3.

Kiểm định

3.3.1. Kiểm định hệ số hồi quy (Phương pháp p-value)
H0: βi = 0

Giả thuyết: {

với mức ý nghĩa α = 5%
H 1 : βi ≠ 0

Sử dụng p-value:

-

Nếu p-value < α = 5% thì bác bỏ giả thiết H0
Nếu p-value > α = 5% thì không bác bỏ giả thiết H0

16



Bảng kiểm định hệ số hồi quy
Biến độc

βi

p-value

Kết quả

Kết luận

lập
Diện tích

β

1,82e-048 < α

nhà ở
Số phòng

β3

0,1562 > α

ngủ
Số phòng

β4


0,6603 > α

β

đến giá nhà

Không có ý

Số phòng ngủ của ngôi nhà

Không có ý

Số phòng tắm của ngôi nhà

1,46e-09 < α

β

Có ý nghĩa

Số chỗ để xe oto có ảnh hưởng

thông kê

đến giá nhà

Không có ý

Tuổi của ngôi nhà không ảnh


5

1,9045 > α
6

ngôi nhà

Thành phố

thống kê

nghĩa thống kê không ảnh hưởng đến giá nhà

xe ô tô
Tuổi của

Diện tích nhà có ảnh hưởng

nghĩa thống kê không ảnh hưởng đến giá nhà

tắm
Số chỗ để

Có ý nghĩa

2

nghĩa thống kê hưởng đến giá nhà

β7


1,60e-05 < α

Có ý nghĩa

Có sự chênh lệch giá giữa giá

thống kê

nhà ở thành phố Coto de Caza
và giá nhà ở thành phố Dove
Canyon.

Nhận xét: Dựa vào giá trị thống kê này ta có thể kết luận rằng các hệ số hồi quy của các
biến diện tích nhà ở, số chỗ để xe ô tô và thành phố có ý nghĩa thống kê với mức ý nghĩa
α = 5%. Hay nói cách khác các biến này có ảnh hưởng đến giá nhà.
3.3.2. Kiểm định sự phù hợp của mô hình
Kiểm định này nhằm xem xét trường hợp các tham số của biến độc lập βi đồng thời xảy ra bằng 0 có xảy ra không.

17


-

Mức độ phù hợp ( biến độc lập giải thích được bao nhiêu % biến phụ thuộc)
2

Ta có R = 0,885372
 Mức độ phù hợp của mô hình hồi quy là 88,5372% (mô hình lý thuyết phản ánh
được 88,5372% thực tế).

-

Kiểm định mức độ phù hợp của mô hình ( kiểm định hệ số góc bằng 0)

-

Kiểm định F: kiểm định cặp giả thuyết sau
{

Ta có Fqs = (1−R2)(k−1)= (1−0,885372)(7−1)

0,885372(224−7)

H0:β2= β3=β4=β5=β6=β7=0 H1: Có ít nhất một trong các hệ số
khác 0

=297,3467 > F(6;217)

2

R (n−k)

Kết luận: Bác bỏ H0, Mô hình phù hợp
3.3.3. Kiểm định vi phạm giả thiết
3.3.3.1.
Kiểm định Bỏ sót biến
 Kiểm định Ramsey RESET:
Xét mô hình hồi quy gốc
Salepric = β1 + β2 sqft + β3 bedrms + β4 baths + β5 garage + β6 age + β7 city + ui


Xét mô hình hồi quy phụ:
+
̂̂

Salepric = α1
+ α 2 sqft + α 3 be drms + α4 baths + α5garage + α 6age + α 7city + α 8Y

2

3
̂̂

α9Y

+ ui

Kiểm định cặp gải thuyết sau:
{

H : Mô hình không bỏ sót biến: α = α = 0
H1: Mô hình bỏ sót biến: α28 + α29 > 0089

Ramsey’s RESET Test
18


Test statistic: F = 11.738656,
with p-value = P(F(2,215) > 11.7387) = 1.45e-005
Vì p-value = 1,45e-005 <0,05
Kết luận: Bác bỏ H0, mô hình bỏ sót biến.

3.3.3.2.
Vấn đề đa cộng tuyến

Phát hiện đa cộng tuyến
Cách 1: R2 cao và thống kê t thấp
Ta có t-ratio của các biến lần lượt là
const

-9.278

sqft

19.13

bedrms

-1.423

baths

0.6603

garage

6.321

age

1.904


city

4.414
2

Ta thấy hệ số xác định R =0.885372 >0.8 tương đối cao, tuy nhiên hầu hết các giá trị
của t-ratio của các biến đều có giá trị lớn đều >1.96 => Không có hiện tượng đa cộng
tuyến. Cách 2: Tương quan tuyến tính mạnh giữa các biến độc lập

19


Bảng ma trận hệ số tương quan giữa các biến
Salepric

sqft

Bedrms

Baths

garage

Age

City

1,0000

0,9193


0,5234

0,6982

0,6536

0,0900

0,5033

salepric

1,0000

0,5972

0.7397

0.5818

0.0244

0.4275

sqft

1,0000

0,5999


0,4268

-0,2126

0,2126

bedrms

1,0000

0,5961

-0,2144

0,2660

baths

1,0000

-0,0929

0,2421

garage

1,0000

0,2951


age

1,0000

city

Nhận xét: Từ ma trận hệ số tương quan giữa các biến, ta thấy các hệ số tương hầu hết đều
có giá trị <0.8, duy chỉ có r(sqft, salepric)=0.9193>0.8
Kết luận: Mô hình không có hiện tượng đa cộng tuyến
Cách 3: Sử dụng hồi quy phụ
 Ta có mô hình hồi quy sqft theo các biến còn lại:
̂ ̂
̂
̂
̂
̂
= + bedrms + baths + garage + age + city

̂̂

sqft β1 β2β3β4β5β6

2

2

R của hồi quy phụ = 0.669951 < R hồi quy chính = 0.885372
2


Và R của hồi quy phụ < 0.9
 Ta có mô hình hồi quy bedrms theo các biến còn lại:
̂̂

̂ ̂
̂
̂
̂
̂
= + sqft + baths + garage + age + city

bedrms β1 β2β3β4β5β6

20


2

2

R của hồi quy phụ = 0.437001< R hồi quy chính = 0.885372
2

Và R của hồi quy phụ < 0.9
 Ta có mô hình hồi quy baths theo các biến còn lại:
̂ ̂
̂
̂
̂
̂

= + sqft + bedrms + garage + age + city

̂̂

baths β1 β2β3β4β5β6

2

2

R của hồi quy phụ = 0.646730 < R hồi quy chính = 0.885372
2

Và R của hồi quy phụ < 0.9
 Ta có mô hình hồi quy garage theo các biến còn̂ lại:

garage

age + β city

=̂+β
̂ β1

sqft + β
̂ 3

2

2


bedrms + β
̂ 4

6

baths + β
̂ 5

2

R của hồi quy phụ = 0.475363< R hồi quy chính = 0.885372
2

Và R của hồi quy phụ < 0.9
 Ta có mô hình hồi quy age theo các biến còn lại:

garage + β̂ city

= ̂ age β1


̂ 2

sqft + β
̂ 3

2

bedrms + β
̂ 4


6

baths + β
̂ 5

2

R của hồi quy phụ = 0.235572< R hồi quy chính = 0.885372
2

Và R của hồi quy phụ < 0.9
 Ta có mô hình hồi quy city theo các biến còn lại:
̂ ̂
̂
̂
̂
̂
= + sqft + bedrms + baths + garage + age

̂̂

city β1 β2β3β4β5β6

2

2

R của hồi quy phụ = 0.265532< R hồi quy chính = 0.885372
2


Và R của hồi quy phụ < 0.9
Kết luận: Không có hiện tượng đa cộng tuyến giữa các biến.

21


Cách 4: Sử dụng thừa số tăng phương sai VIF
VIF
sqft

3.030

bedrms

1.776

baths

2.831

garage

1.669

age

1.308

city


1.362

VIF(j) = 1/(1 - R(j)^2)
Thừa số tăng phương sai VIF của tất cả các biến đều nhỏ hơn 10
Kết luận: Mô hình không có đa cộng tuyến
3.3.3.3.


Phương sai sai số thay đổi

Phát hiện phương sai sai số thay đổi

22


Kiểm định White
Xét mô hình hổi quy gốc:

Salepric = β1 + β2 sqft + β3 bedrms + β4 baths + β5 garage + β6 age + β7 city + ui

Mô hình hồi quy phụ:
e2i= α1 + α2 sqft + α3 bedrms + α4 baths + α5garage + α6age + α7city + α8 sqft2+ α9bedrms2+ α10baths2+ α11garage2 + α12age 2 + α13city2 +
α14 sqft.bedrms +α15 sqft.baths + α16 sqft.garage + α17 sqft.age + α18 sqft.city + α19 bedrms.baths + α20 bedrms.garage + α21 bedrms.age + α22 bedrms.city +
α23 baths.garage + α24 baths.age + α25 baths.city + α26 garage.age + α27 garage.city + α28age. city +ui
Cặp giả định H0: α1=α2 = α3 =α4=α5= α6=.....=α25 =α26 =α27 =α28

H1= α12 + α22 + α32 + α42 + α52 + α62+.....+α252 +α262+α272+α282

Test statistic: TR^2 = 173.556870

with p-value = P(Chi-square(26) > 173.556870) = 0.000000
Ta có: P-value = P(

2

qs)

=0.000000< 0,05

Kết luận: Phương sai sai số có thay đổi


Khắc phục hiện tượng phương sai sai số thay đổi:
Dùng hồi quy Robust:

23


Chạy Robust trên Gretl ta có bảng
Model 7: OLS, using observations 1-224
Dependent variable: salepric
Heteroskedasticity-robust standard errors, variant HC1
Coefficient

Std. Error

t-ratio

p-value


Const

-698,069

127,021

-5,4957

<0,00001

***

Sqft

0,222893

0,0328684

6,7814

<0,00001

***

Bedrms

-21,7851

24,2528


-0,8982

0,37005

Baths

10,0481

20,2989

0,4950

0,62110

Garage

134,113

45,9194

2,9206

0,00386

Age

5,71295

3,80896


1,4999

0,13510

City

87,8474

22,5488

3,8959

0,00013

***
***

Mean dependent var

642,9294

S.D. dependent var

371,3762

Sum squared resid

3525538

S.E. of regression


127,4626

R-squared

0,885372

Adjusted R-squared

0,882202

F(6, 217)

112,6578

P-value(F)

7,65e-64

-1400,199

Akaike criterion

2814,397

2838,279

Hannan-Quinn

2824,037


Log-likelihood
Schwarz criterion

Nguồn: Nhóm tác giả tự nghiên cứu tổng hợp với sự hỗ trợ của phần mềm Gretl
Ta thấy: p-value = 7,65e-64 < 0,05
Tuy nhiên khi dùng hồi quy Robust kết quả ước lượng sẽ không bị ảnh hường bởi
phương sai sai số thay đổi.

24


3.3.3.4.
Cặp giả thuyết {

Phân phối chuẩn của nhiễu
H0: Nhiễu có phân phối chuẩn

H1: Nhiễu không có phân phối chuẩn

Jarque-Bera test = 26.3389, with p-value 1.90802e006 p-value=1.90802e-006<0.05
Kết luận: Bác bỏ giả thiết Ho=> Nhiễu không có phân phối chuẩn
 Khắc phục: Vì số quan sát của mẫu n=224>120=> các suy diễn thống kê vẫn có
giá trị dù ui có phân phối chuẩn hay không
3.3.3.5.
Tự tương quan
Mô hình nghiên cứu với bộ dữ liệu là dữ liệu chéo, mặt khác hiện trượng tự tương quan
thường xảy ra trên dữ liệu thời gian, xác suất xảy ra hiện tượng này trên dữ liệu chéo là
rất thấp. Vì thế, trong gretl không thể kiểm định được hiện tượng tự tương quan với bộ dữ
liệu trên.

3.3.4. Kết quả tóm tắt và một số phương hướng khắc phục khuyết tật

Mô hình phù hợp với lý thuyết kinh tế:
Mô hình đã thể hiện được các nhân tố đặc điểm cấu trúc ảnh hưởng đến giá cả
trung bình của căn nhà ở tại hai thành phố Coto de Caza và Dove Canyon, trong đó nhân
25


×