TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG
KHOA KINH TẾ QUỐC TẾ
---------***--------
TIỂU LUẬN KINH TẾ LƯỢNG
PHÂN TÍCH TÁC ĐỘNG CỦA CÁC ĐẶC ĐIỂM
NHÀ Ở ĐẾN GIÁ NHÀ TẠI HAI THÀNH PHỐ
COTO DE CAZA VÀ DOVE CANYON
Giáo viên hướng dẫn
: ThS. Nguyễn Thúy Quỳnh
Lớp tín chỉ
: KTE309.3
Nhóm sinh viên thực hiện :
Nguyễn Tùng Linh
Nguyễn Linh Chi
Nguyễn Thu Trang
1611110353
1611110077
1611110607
Hà Nội, tháng 6 năm 2018
1
Đánh giá thành viên
Mã số sinh viên
Họ và tên
1611110607
Nguyễn Thu Trang
1611110353
Nguyễn Tùng Linh 10
1611110077
Nguyễn Linh Chi
Điểm trung bình cá nhân
Thu Trang
Tùng Linh
Linh Chi
10
10
10
10
10
10
10
10
2
Mục lục
LỜI MỞ ĐẦU..................................................................................................................4
I.
Phần I: Cơ sở lý thuyết:...........................................................................................6
1. Mô hình Hedonic..................................................................................................6
2. Mô hình nghiên cứu..............................................................................................8
3. Số liệu và đo lường các biến:................................................................................9
II.
PHẦN II: NỘI DUNG......................................................................................... 10
1. Mô hình nghiên cứu............................................................................................ 10
2. Dữ liệu nghiên cứu.............................................................................................. 10
3. Kết quả ước lượng OLS:..................................................................................... 12
3.1. Ý nghĩa của hệ số hồi qui riêng phần........................................................... 14
3.2. Khoảng tin cậy của các tham số................................................................... 15
3.3. Kiểm định..................................................................................................... 16
3.3.1.
Kiểm định hệ số hồi quy (Phương pháp p-value)................................... 16
3.3.2.
Kiểm định sự phù hợp của mô hình....................................................... 17
3.3.3.
Kiểm định vi phạm giả thiết................................................................... 18
3.3.3.1. Kiểm định Bỏ sót biến....................................................................... 18
3.3.3.2. Vấn đề đa cộng tuyến....................................................................... 19
3.3.3.3. Phương sai sai số thay đổi................................................................ 22
3.3.3.4. Phân phối chuẩn của nhiễu.............................................................. 25
3.3.3.5. Tự tương quan.................................................................................. 25
3.3.4.
Kết quả tóm tắt và một số phương hướng khắc phục khuyết tật.............25
DANH MỤC TÀI LIỆU THAM KHẢO...................................................................... 29
3
LỜI MỞ ĐẦU
Thị trường bất động sản (BĐS) là một trong những thị trường quan trọng của nền kinh tế
vì liên quan trực tiếp tới một lượng tài sản rất lớn về quy mô, tính chất cũng như giá trị
nhiều mặt trong nền kinh tế quốc dân
Là cường quốc số một thế giới, thị trường bất động sản Mỹ luôn có sức hút đặc biệt
đối với các nhà đầu tư không chỉ trong mà còn cả ngoài nước, được đánh giá là tăng
trưởng ổn định ( 5 -7%/ năm) , ít biến động. Điều này hoàn toàn được lý giải là bởi thị
trường bất động sản ở Mỹ được hỗ trợ với pháp lý minh bạch, chính sách an toàn, đồng
đô la Mỹ (USD) liên tục tăng trong những năm qua; tính thanh khoản cao, dễ mua, dễ bán
và dễ cho thuê;… Nói đến nhà đất Mỹ, không thể không kể đến những trung tâm bất
động sản sầm uất bậc nhất như New York, San Francisoco, Las Vegas với những cái giá
trên trời. Bên cạnh đó, các nhà đầu tư cũng đang hướng sự chú ý của mình vào những
thành phố nhỏ, lẻ nhưng lại sở hữu nhiều giá trị tiềm ẩn về bất động sản như Coto de
Caza (hạt Orange); Dove Canyon (bang California), nơi được các hộ gia đình lựa chọn để
định cư lâu dài... Có thể nói, việc chuyển hướng sang các thị trường nhỏ lẻ như vậy chứa
nhiều yếu tố rủi ro nhưng lại mở ra nhiều cơ hội mới mẻ hơn cho các nhà đầu tư.
“ An cư “ thì mới lạc nghiệp”, nhu cầu nhà ở nơi các gia đình mong muốn sẽ sinh
sống lâu dài ngày càng gia tăng. Giá nhà ở vì thế cũng phụ thuộc vào rất nhiều yếu tố .
Nhưng đặc biệt đối với thị trường Coto de Caza và Dove Canyon chúng ta chỉ cần quan
tâm đến những yếu tố liên quan đến cơ sở vật chất, nội thất, kiến trúc, của ngôi nhà. Tình
trạng cơ sở vật chất khác nhau nghĩa là hai ngôi nhà sẽ có giá trị khác nhau, từ đó suy ra
giá trị của chúng trên thị trường là khác nhau. Xuất phát từ thực tế khách quan,và nhu cầu
cấp thiết đó, nhóm chúng em quyết định chọn đề tài nghiên cứu TÁC ĐỘNG CỦA CÁC
ĐẶC ĐIỂM NHÀ Ở ĐẾN GIÁ NHÀ TẠI HAI THÀNH PHỐ COTO DE CAZA VÀ
DOVE CANYON, tiến hành khảo sát mô hình hồi quy để tìm ra sự phụ thuộc của giá nhà
đến các
4
yếu tố cấu trúc và môi trường xung quanh nhằm tìm ra giải pháp giúp người bán và cho
thuê đạt được mục tiêu lợi nhuận, giúp người mua năm bắt được thông tin giá cả kịp thời.
5
I.
Phần I: Cơ sở lý thuyết:
1.
Mô hình Hedonic
Mô hình Hedonic dựa trên lý thuyết người tiêu dùng của Lancaster (1966). Kể từ khi
Rosen (1974) mở rộng lý thuyết này ra thị trường nhà ở, mô hình Hedonic đã được ứng
dụng rộng rãi như là một công cụ để đánh giá thị trường BĐS và phân tích đô thị. Rosen
(1974) đã đưa ra cách xử lý toàn diện đối với giá ẩn hay giá thụ hưởng. Lý thuyết giá ẩn
đã tạo ra một vấn đề trong kinh tế học cân bằng không gian, giúp định hướng người tiêu
dùng cũng như người sản xuất đưa ra các quyết định về vị trí liên quan đến các đặc điểm
không gian.
. Phương pháp định giá Hedonic được định nghĩa là kỹ thuật phân tích hồi quy được
sử dụng để xác định giá trị của những thuộc tính liên quan đến hàng hóa trên thị
trường trong các giai đoạn cụ thể. Những thuộc tính có thể đo lường được như kích cỡ,
tốc độ, trọng lượng,…sẽ ảnh hưởng đến giá trị của hàng hóa. Theo Griliches (1971),
phương pháp Hedonic dựa trên cơ sở: giá của một hàng hóa không đồng nhất có thể
được xác định thông qua những thuộc tính liên quan đến hàng hóa đó.
Vì thế, hàm hồi quy Hedonic có dạng: pi = h(ci),
• Pi là giá của hàng hóa
• Ci là vector của các đặc tính liên quan đến hàng hóa.
Mô hình Hedonic được dựa trên lý thuyết người tiêu dùng của Lancaster (1966). Kể từ
khi Rosen (1974) mở rộng lý thuyết này ra thị trường nhà ở, mô hình Hedonic đã được
ứng dụng rộng rãi như là một công cụ để đánh giá thị trường BĐS và phân tích đô thị.
Rosen (1974) đã đưa ra cách xử lý toàn diện đối với giá ẩn hay giá thụ hưởng. Lý thuyết
giá ẩn đã tạo ra một vấn đề trong kinh tế học cân bằng không gian, giúp định hướng
người tiêu dùng cũng như người sản xuất đưa ra các quyết định về vị trí liên quan đến các
đặc điểm không gian
6
Cả hai hướng tiếp cận đều nhằm mục tiêu ước tính giá trị và số lượng thuộc tính dựa
trên những sản phẩm khác nhau được đưa vào quan sát. Lancaster đã xây dựng nền tảng
lý thuyết cho mô hình Hedonic: sự thỏa dụng của người tiêu dùng có được từ những đặc
tính của sản phẩm, chứ không phải trực tiếp từ sản phẩm đó. Hiện nay, phương pháp định
giá Hedonic được áp dụng rộng rãi tại các quốc gia phát triển.Theo Malpezzi (2003),
trong quá trình phát triển, thị trường nhà ở là một trong ứng dụng rộng rãi của mô hình
định giá Hedonic, vì nhà ở là hàng hóa không đồng nhất; đồng thời nhu cầu của người
tiêu thụ cũng không đồng nhất.
Thật vậy, một căn hộ gồm nhiều đặc điểm riêng biệt về diện tích, chất lượng, vị trí,…
Mỗi căn nhà có một vị trí nhất định, thời gian xây dựng khác nhau, có diện tích khác
nhau. Bên cạnh đó, mức độ thỏa dụng của người mua khác nhau, định giá căn hộ
cũngkhác nhau. Một căn hộ có cùng một nhóm đặc điểm được định giá khác nhau theo
từng người mua. Việc định giá vì thế cũng trở nên khó khăn. Từ đó, phương pháp
Hedonic được sử dụng phổ biến vì nó ước tính được giá trị của các đặc điểm riêng lẻ cấu
thành nên giá trị chung của cả căn hộ. Theo nghiên cứu ứng dụng mô hình Hedonic trong
thị trường nhà ở của Thibodeau và Malpezzi (1980), phương pháp định giá Hedonic là
một mô hình hồi quy của giá trị hoặc giá thuê căn hộ dựa trên những đặc tính liên quan
đến căn hộ. Trong đó, từng biến độc lập đại diện cho từng đặc điểm riêng biệt và các hệ
số trong kết quả của mô hình là giá tiềm ẩn của những đặc điểm này. Mô hình hồi quy
của giá thuê nhà hoặc giá trị căn hộ có dạng như sau:
R = f (S, N, L, C, T),
Trong đó: R là giá thuê hoặc giá trị căn hộ; S là những đặc điểm thuộc cấu trúc; N là
đặc điểm thuộc môi trường xung quanh; L là vị trí; C là đặc điểm về hợp đồng giao dịch
và T là thời hạn căn hộ được quan sát.
Lợi thế của mô hình Hodenic là tính linh hoạt, có thể sử dụng ngay được các dữ liệu giao
dịch đang diễn ra và dữ liệu về đặc tính của một bất động sản có thể khai thác từ rất nhiều
7
nguồn khác nhau. Kết quả của phương pháp này là cho kết quả đáng tin cậy trong việc
xác định giá trị cho một bất động sản. Ngoài ra mô hình Hodenic còn giúp chúng ta dự
đoán được bong bóng cục bộ của thị trường bất động sản khi giá trị giao dịch của khu vực
đó cao hơn nhiều so với giá trị tính toán cho bởi mô hình. Khi xây dựng và đánh giá sai
số của mô hình, chúng ta cũng có thể lựa chọn được đặc trưng ảnh hưởng nhiều đến giá
đất trên quan điểm ít đặc tính nhất và sai số nhỏ nhất.
2.
Mô hình nghiên cứu
Nội dung của bài tiểu luận sẽ đi nghiên cứu sự ảnh hưởng giá nhà theo các yếu tố sau:
- Những đặc điểm thuộc cấu trúc:
Ln(Sqft): Diện tích của ngôi nhà lấy theo logarit
Bedrms: Số phòng ngủ
Baths: Số phòng tắm
Garage: Số chỗ để xe ô tô
Age: Tuổi của nhà
- Những đặc điểm thuộc môi trường xung quanh ngôi nhà:
City: Vị trí nhà ở thành phố nào
Khi đưa vào mô hình hồi quy kinh tế lượng, biến SalePric là biến phụ thuộc, còn
các biến Sqft, Bedrms, Baths, Garage, Age, City là biến độc lập. Ta xét mô hình hồi quy
kinh tế:
SalePr= β1 + β2 Sqft + β3 Bedrms + β4 Baths + β5 Garage + 6Age + 7City + Ui
8
Dự đoán dấu của các hệ số dựa vào lý thuyết /kinh nghiệm thực tế: Do theo lý thuyết
trong các ngành khác cũng như trong thực tế, ta thấy diện tích nhà tác động cùng chiều
với giá nhà, tức là diện tích nhà càng lớn thì diện tích nhà càng có xu hướng tăng. Vì thế
β2 mang dấu (+) Tương tự với các biến số phòng ngủ, số phòng tắm, số chỗ để ô tô càng
lớn thì giá nhà càng có xu hướng tăng. Vì thế β 3, β4, β5 đều mang dấu (+) Ngược lại, tuổi
của nhà, tuổi của thành phố càng tăng, thì người mua nhà sẽ cảm thấy chất lượng ngôi
nhà sẽ bị giảm đi, vì thế biến tuổi của nhà và tuổi của thành phố có tác động ngược chiều
với giá nhà và 6, 7 mang dấu (-)
3.
Số liệu và đo lường các biến:
-
Số liệu lấy từ phần mềm Gretl, ở bộ Ramanathan, data 7-24. Sale price and
characteristics of homes.
-
Số quan sát : 224
-
Salepric: Giá nhà ở (Nghìn đô la ( $) )
-
Sqft: Diện tích của ngôi nhà (feet vuông)
-
Bedrms: Số phòng ngủ (phòng)
-
Baths: Số phòng tắm (phòng)
-
Garage: Số chỗ để xe ô tô (chỗ)
-
Age: Tuổi của nhà (tuổi)
-
City: = 0: Nhà ở Dove Canyon, = 1: Nhà ở Coto de Caza.
9
II.
PHẦN II: NỘI DUNG
1.
Mô hình nghiên cứu
* Mô hình toán kinh tế:
Salepric = β1 + β2 sqft + β3 bedrms + β4 baths + β5 garage + β6 age + β7 city + ui
*Mô hình kinh tế lượng:
̂ ̂
̂̂
̂
̂
̂
̂
̂
= + sqft + bedrms + baths + garage + age + city
salepric β1 β2β3β4β5β6β7
2.
Dữ liệu nghiên cứu
BẢNG 1: Bảng mô tả thống kê
Variable
Mean
Minimum
Maximum
Salepric
642,93
349,00
2900,0
Sqft
4025.2
2583.00
11000
Bedrms
4,5625
2,0000
7,0000
Baths
4,1558
2,5000
8,0000
Garage
3,1607
2,0000
7,0000
Age
5,4732
0,0000
19,0000
City
0,52679
0,0000
1,0000
Nguồn: Nhóm tác giả tự nghiên cứu tổng hợp với sự hỗ trợ của phần mềm Gretl
Nhận xét:
Hai thành phố Coto de Caza và Dove Canyon của bang California tại USA là hai
thành phố có nền kinh tế phát triển, đông dân cư, giá nhà dao động mạnh từ
349,00 đến 2900,00 ( nghìn $)
10
Diện tích của nhà ở thuộc 2 thành phố này rất đa dạng, căn nhỏ nhất là 2583 feet
vuông, căn lớn nhất 11000 feet vuông, và diện tích trung bình đo lường được là
4025 feet vuông.
Về tiện ích bên trong: số phòng tắm từ 2,5 đến 8 phòng/ 1 căn, số phòng ngủ từ 27 phòng/ căn, khả năng chứa của gara từ 2-7 chiếc ô tô.
Nhà ở của hai thành phố này tương đối mới, độ tuổi trung bình của nhà ở là 5,4732
năm, trong đó cũng có những ngôi nhà khá lâu như 19 năm.
Nhà ở phân bố khá đều giữa hai thành phố Coto de Cara và Dove Canyon
( trung bình giữa hai thành phố là 0,52679).
BẢNG 2: Bảng mô tả tương quan
Correlation coefficients, using the observations 1 - 224
5% critical value (two-tailed) = 0.1311 for n = 224
Salepric
sqft
Bedrms
Baths
garage
Age
City
1,0000
0,9193
0,5234
0,6982
0,6536
0,0900
0,5033
salepric
1,0000
0,5972
0.7397
0.5818
0.0244
0.4275
sqft
1,0000
0,5999
0,4268
-0,2126
0,2126
bedrms
1,0000
0,5961
-0,2144
0,2660
baths
1,0000
-0,0929
0,2421
garage
1,0000
0,2951
age
1,0000
city
Nguồn: : Nhóm tác giả tự nghiên cứu tổng hợp với sự hỗ trợ của phần mềm Gretl
11
Nhận xét:
Tương quan giữa các biến sqft, bedrms, baths, garage, age, city và biến salepric:
r(salepric,sqft) = 0,9193 : mức độ tương quan rất cao, tương quan cùng chiều
r(salepric,bedrms) = 0,5234 : Mức độ tương quan trung bình, tương quan cùng
chiều
r(salepric,baths) = 0,6982 : Mức độ tương quan cao, tương quan cùng chiều
r(salepric,garage) = 0,6536 : Mức độ tương quan cao, tương quan cùng chiều
r(salepric,age) = 0,0900 : mức độ tương quan rất thấp, tương quan cùng chiều
r(salepric,city) = 0,5033 : mức độ tương quan trung bình, tương quan cùng chiều
Từ kết quả trên có thể kỳ vọng rằng yếu tố diện tích ( sqft) là yếu tố có ảnh hưởng
cùng chiều và lớn nhất đến giá nhà. Trong khi đó, yếu tố tuổi của nhà (age) lại không
thực sự ảnh hưởng nhiều đến giá nhà.
Tương quan giữa các biến sqft, bedrms, baths, garage, age, city với nhau:
r(sqft, bedrms) = 0,5972 : Mức độ tương quan trung bình, tương quan cùng chiều
r(sqft, baths) = 0,7397 : Mức độ tương quan cao, tương quan cùng chiều
r(bedrms, garage) = 0,4268 : Mức độ tương quan trung bình, tương quan
cùng chiều
r(bedrms, age) = -0,2126 : Mức độ tương quan thấp, tương quan ngược chiều
r(baths,age) = -0,2144: Mức độ tương quan thấp, tương quan ngược chiều
r(baths, city) = 0,2660 : Mức độ tương quan thấp, tương quan cùng chiều
Từ kết quả trên có thể kỳ vọng rằng yếu tố diện tích (sqft) có ảnh hưởng lớn đến số
phòng tắm (baths) và số phòng ngủ ( bedrms) trong khi đó yếu tố tuổi của nhà (age) và
số phòng ngủ (bedrms) ảnh hưởng ít đến nhau và là ảnh hưởng là ngược chiều.
3.
Kết quả ước lượng OLS:
BẢNG 3: Kết quả ước lượng
12
Model 1: OLS, using observations 1-224
Dependent variable: salepric
Coefficient
Std. Error
t-ratio
p-value
Const
-698,069
75,242
-9,2777
<0,00001 ***
Sqft
0,222893
0,01165
19,1325
<0,00001 ***
Bedrms
-21,7851
15,3093
-1,4230
0,15617
Baths
10,0481
15,2165
0,6603
0,50974
Garage
134,113
21,2184
6,3206
<0,00001 ***
Age
5,71295
2,99978
1,9045
0,05817 *
City
87,8474
19,9034
4,4137
0,00002 ***
Mean dependent var
642,9294
S.D. dependent var
371,3762
Sum squared resid
3525538
S.E. of regression
127,4626
R-squared
0,885372
Adjusted R-squared
0,882202
F(6, 217)
279,3456
P-value(F)
4,08e-99
-1400,199
Akaike criterion
2814,397
2838,279
Hannan-Quinn
2824,037
Log-likelihood
Schwarz criterion
Nguồn: : Nhóm tác giả tự nghiên cứu tổng hợp với sự hỗ trợ của phần mềm Gretl
Dựa vào kết quả ước lượng từ bảng trên ta thu được:
̂̂
̂
̂
̂
̂
̂
̂
̂
(SRF) salepric = β1 + β2 sqft + β3 bedrms + β4 baths + β5 garage + β6 age + β7 city
̂̂
= -698,069+ 0,222893 sqft -21,7851 bedrms + 10,0481 baths + 134,113 garage
salepric
+ 5,71295 age + 87,8474 city
13
Mô hình cho thấy: diện tích của ngôi nhà, số phòng ngủ, số phòng tắm, số chỗ đỗ xe ô
tô, tuổi của ngôi nhà đều có tác động đến giá nhà ở.
2
Hệ số xác định R = 0.885372 cho ta biết rằng 88,5372% sự thay đổi của giá nhà là do
ảnh hưởng của các yếu tố diện tích, số phòng ngủ, số phòng tắm, số chỗ để xe oto, tuổi
của nhà và vị trí của nhà (thành phố nào). Còn lại 11,4628% sự thay đổi của giá nhà là do
các yếu tố khác (như hướng nhà, số mặt tiền,…).
3.1.
Ý nghĩa của hệ số hồi qui riêng phần
Hệ số hồi quy
β1= -698,069
Ý nghĩa
Khi diện tích nhà , số phòng ngủ, số nhà tắm, số chỗ để xe ô tô, số tuổi
của nhà bằng 0 ở thành phố Dove Canyon thì giá nhà trung bình là
-698,069 nghìn$
Tuy nhiên hệ số này là vô nghĩa vì trong thực tế diện tích nhà ở, số
phòng ngủ, số nhà tắm, số chỗ để xe ô tô, số tuổi của nhà không thể
đồng thời bằng 0 ở thành phố Dove Canyon.
β2 =
0,222893
Nếu diện tích nhà ở tăng 1 đơn vị (feet vuông) và các yếu tố khác
không đổi thì giá nhà trung bình tăng 0,222893 nghìn$
β3
= -21,7851
Nếu số phòng ngủ tăng 1 phòng và các yếu tố khác không đổi thì giá
nhà trung bình giảm 21,7851 nghìn$
β4
= 10,0481
Nếu số phòng tắm tăng 1 phòng và các yếu tố khác không đổi thì giá
nhà trung bình tăng 10,0481 nghìn$
β5
= 134,113
Nếu số chỗ để xe ô tô tăng 1 chỗ và các yếu tố khác không đổi thì giá
nhà trung bình tăng 134,113 nghìn$
β6
= 5,71295
Nếu số tuổi của nhà tăng 1 tuổi và các yếu tố khác không đổi thì giá
nhà trung bình tăng 5,71295 nghìn$
14
Với các yếu tố khác như nhau, chênh lệch giữa giá nhà trung bình ở
β7= 87,8474
thành phố Coto de Caza và giá nhà trung bình ở thành phố Dove
Canyon là 87,8474 nghìn$
Ước lượng phương sai của nhiễu
̂̂2
RSS
∑ ei2
δ
=
=
n−7
n−7
3525538
=
224−7
=16246,7189
Vậy sự biếnđộnggiátrị củabiếnphụ
thuộcgiánhà đo bằngphươngsaido các
̂̂2
= 16246,7189
yếu tố ngẫu nhiên gây ra là δ
3.2.
Khoảng tin cậy của các tham số
Khoảng tin cậy của β2
̂̂
α
̂̂ -̂ t
β 2 ∈ (β 2- t
α
̂̂
SE(β 2); β2
(n−7,
)
SE(β2)) = (0,1 99931; 0,245854)
(n−7,
2
)
2
Vậy với mức ý nghĩa α= 0,05, khi diện tích nhà ở tăng thêm 1 đơn vị (feet vuông) thì giá nhà tăng
thêm tối thiểu 0,199931; tối đa là 0,245854 (nghìn) Với các yếu tố khác không đổi
ảậủβ
̂̂- t
α
̂̂ -̂ t
β3 ∈ (β3
α
̂̂
SE(β 3); β3
(n−7,
)
SE(β3)) = (-51,95 90; 8,38894)
(n−7,
2
)
2
Kết luận: sai sót dữ liệu
ảậủβ
̂̂- t
α
̂̂ -̂ t
β4 ∈ (β4
α
̂̂
SE(β 4); β4
(n−7,
)
2
SE(β4)) = (-19,9 430; 40,0 392)
(n−7,
)
2
Kết luận: Sai sót dữ liệu
15
ảậủβ
̂̂- t
α
̂̂ -̂ t
β5 ∈ (β5
α
̂̂
SE(β 5); β5
(n−7,
)
SE(β5)) = (92,2925 ; 175,934)
(n−7,
2
)
2
Vậy với mức ý nghĩa α= 0,05, khi số chỗ để xe oto tăng lên 1 chỗ thì giá nhà tăng thêm tối thiểu 92,2925 và tăng tối đa 175,934 (nghìn), với các yếu tố khác
không đổi
ảậủβ
̂̂- t
α
̂̂ -̂ t
β6 ∈ (β6
α
̂̂
SE(β 6); β6
(n−7,
)
SE(β6)) = (-0,199479; 11,6254)
(n−7,
2
)
2
Kết luận: Sai sót dữ liệu
ảậủβ
̂̂- t
α
̂̂ -̂ t
β7 ∈ (β7
α
̂̂
SE(β 7); β7
(n−7,
)
SE(β7)) = (48 ,6 18 7; 127,0 76)
(n−7,
2
)
2
Vậy với mức ý nghĩa α= 0,05, chênh lệch giá nhà ở thành phố Coto de Caza và giá nhà ở thành phố
Dove Canyon tối thiểu là 48,6187 và tối đa là 127,076 (nghìn đô ) Với các yếu tố khác không đổi.
3.3.
Kiểm định
3.3.1. Kiểm định hệ số hồi quy (Phương pháp p-value)
H0: βi = 0
Giả thuyết: {
với mức ý nghĩa α = 5%
H 1 : βi ≠ 0
Sử dụng p-value:
-
Nếu p-value < α = 5% thì bác bỏ giả thiết H0
Nếu p-value > α = 5% thì không bác bỏ giả thiết H0
16
Bảng kiểm định hệ số hồi quy
Biến độc
βi
p-value
Kết quả
Kết luận
lập
Diện tích
β
1,82e-048 < α
nhà ở
Số phòng
β3
0,1562 > α
ngủ
Số phòng
β4
0,6603 > α
β
đến giá nhà
Không có ý
Số phòng ngủ của ngôi nhà
Không có ý
Số phòng tắm của ngôi nhà
1,46e-09 < α
β
Có ý nghĩa
Số chỗ để xe oto có ảnh hưởng
thông kê
đến giá nhà
Không có ý
Tuổi của ngôi nhà không ảnh
5
1,9045 > α
6
ngôi nhà
Thành phố
thống kê
nghĩa thống kê không ảnh hưởng đến giá nhà
xe ô tô
Tuổi của
Diện tích nhà có ảnh hưởng
nghĩa thống kê không ảnh hưởng đến giá nhà
tắm
Số chỗ để
Có ý nghĩa
2
nghĩa thống kê hưởng đến giá nhà
β7
1,60e-05 < α
Có ý nghĩa
Có sự chênh lệch giá giữa giá
thống kê
nhà ở thành phố Coto de Caza
và giá nhà ở thành phố Dove
Canyon.
Nhận xét: Dựa vào giá trị thống kê này ta có thể kết luận rằng các hệ số hồi quy của các
biến diện tích nhà ở, số chỗ để xe ô tô và thành phố có ý nghĩa thống kê với mức ý nghĩa
α = 5%. Hay nói cách khác các biến này có ảnh hưởng đến giá nhà.
3.3.2. Kiểm định sự phù hợp của mô hình
Kiểm định này nhằm xem xét trường hợp các tham số của biến độc lập βi đồng thời xảy ra bằng 0 có xảy ra không.
17
-
Mức độ phù hợp ( biến độc lập giải thích được bao nhiêu % biến phụ thuộc)
2
Ta có R = 0,885372
Mức độ phù hợp của mô hình hồi quy là 88,5372% (mô hình lý thuyết phản ánh
được 88,5372% thực tế).
-
Kiểm định mức độ phù hợp của mô hình ( kiểm định hệ số góc bằng 0)
-
Kiểm định F: kiểm định cặp giả thuyết sau
{
Ta có Fqs = (1−R2)(k−1)= (1−0,885372)(7−1)
0,885372(224−7)
H0:β2= β3=β4=β5=β6=β7=0 H1: Có ít nhất một trong các hệ số
khác 0
=297,3467 > F(6;217)
2
R (n−k)
Kết luận: Bác bỏ H0, Mô hình phù hợp
3.3.3. Kiểm định vi phạm giả thiết
3.3.3.1.
Kiểm định Bỏ sót biến
Kiểm định Ramsey RESET:
Xét mô hình hồi quy gốc
Salepric = β1 + β2 sqft + β3 bedrms + β4 baths + β5 garage + β6 age + β7 city + ui
Xét mô hình hồi quy phụ:
+
̂̂
Salepric = α1
+ α 2 sqft + α 3 be drms + α4 baths + α5garage + α 6age + α 7city + α 8Y
2
3
̂̂
α9Y
+ ui
Kiểm định cặp gải thuyết sau:
{
H : Mô hình không bỏ sót biến: α = α = 0
H1: Mô hình bỏ sót biến: α28 + α29 > 0089
Ramsey’s RESET Test
18
Test statistic: F = 11.738656,
with p-value = P(F(2,215) > 11.7387) = 1.45e-005
Vì p-value = 1,45e-005 <0,05
Kết luận: Bác bỏ H0, mô hình bỏ sót biến.
3.3.3.2.
Vấn đề đa cộng tuyến
Phát hiện đa cộng tuyến
Cách 1: R2 cao và thống kê t thấp
Ta có t-ratio của các biến lần lượt là
const
-9.278
sqft
19.13
bedrms
-1.423
baths
0.6603
garage
6.321
age
1.904
city
4.414
2
Ta thấy hệ số xác định R =0.885372 >0.8 tương đối cao, tuy nhiên hầu hết các giá trị
của t-ratio của các biến đều có giá trị lớn đều >1.96 => Không có hiện tượng đa cộng
tuyến. Cách 2: Tương quan tuyến tính mạnh giữa các biến độc lập
19
Bảng ma trận hệ số tương quan giữa các biến
Salepric
sqft
Bedrms
Baths
garage
Age
City
1,0000
0,9193
0,5234
0,6982
0,6536
0,0900
0,5033
salepric
1,0000
0,5972
0.7397
0.5818
0.0244
0.4275
sqft
1,0000
0,5999
0,4268
-0,2126
0,2126
bedrms
1,0000
0,5961
-0,2144
0,2660
baths
1,0000
-0,0929
0,2421
garage
1,0000
0,2951
age
1,0000
city
Nhận xét: Từ ma trận hệ số tương quan giữa các biến, ta thấy các hệ số tương hầu hết đều
có giá trị <0.8, duy chỉ có r(sqft, salepric)=0.9193>0.8
Kết luận: Mô hình không có hiện tượng đa cộng tuyến
Cách 3: Sử dụng hồi quy phụ
Ta có mô hình hồi quy sqft theo các biến còn lại:
̂ ̂
̂
̂
̂
̂
= + bedrms + baths + garage + age + city
̂̂
sqft β1 β2β3β4β5β6
2
2
R của hồi quy phụ = 0.669951 < R hồi quy chính = 0.885372
2
Và R của hồi quy phụ < 0.9
Ta có mô hình hồi quy bedrms theo các biến còn lại:
̂̂
̂ ̂
̂
̂
̂
̂
= + sqft + baths + garage + age + city
bedrms β1 β2β3β4β5β6
20
2
2
R của hồi quy phụ = 0.437001< R hồi quy chính = 0.885372
2
Và R của hồi quy phụ < 0.9
Ta có mô hình hồi quy baths theo các biến còn lại:
̂ ̂
̂
̂
̂
̂
= + sqft + bedrms + garage + age + city
̂̂
baths β1 β2β3β4β5β6
2
2
R của hồi quy phụ = 0.646730 < R hồi quy chính = 0.885372
2
Và R của hồi quy phụ < 0.9
Ta có mô hình hồi quy garage theo các biến còn̂ lại:
garage
age + β city
=̂+β
̂ β1
sqft + β
̂ 3
2
2
bedrms + β
̂ 4
6
baths + β
̂ 5
2
R của hồi quy phụ = 0.475363< R hồi quy chính = 0.885372
2
Và R của hồi quy phụ < 0.9
Ta có mô hình hồi quy age theo các biến còn lại:
garage + β̂ city
= ̂ age β1
+β
̂ 2
sqft + β
̂ 3
2
bedrms + β
̂ 4
6
baths + β
̂ 5
2
R của hồi quy phụ = 0.235572< R hồi quy chính = 0.885372
2
Và R của hồi quy phụ < 0.9
Ta có mô hình hồi quy city theo các biến còn lại:
̂ ̂
̂
̂
̂
̂
= + sqft + bedrms + baths + garage + age
̂̂
city β1 β2β3β4β5β6
2
2
R của hồi quy phụ = 0.265532< R hồi quy chính = 0.885372
2
Và R của hồi quy phụ < 0.9
Kết luận: Không có hiện tượng đa cộng tuyến giữa các biến.
21
Cách 4: Sử dụng thừa số tăng phương sai VIF
VIF
sqft
3.030
bedrms
1.776
baths
2.831
garage
1.669
age
1.308
city
1.362
VIF(j) = 1/(1 - R(j)^2)
Thừa số tăng phương sai VIF của tất cả các biến đều nhỏ hơn 10
Kết luận: Mô hình không có đa cộng tuyến
3.3.3.3.
Phương sai sai số thay đổi
Phát hiện phương sai sai số thay đổi
22
Kiểm định White
Xét mô hình hổi quy gốc:
Salepric = β1 + β2 sqft + β3 bedrms + β4 baths + β5 garage + β6 age + β7 city + ui
Mô hình hồi quy phụ:
e2i= α1 + α2 sqft + α3 bedrms + α4 baths + α5garage + α6age + α7city + α8 sqft2+ α9bedrms2+ α10baths2+ α11garage2 + α12age 2 + α13city2 +
α14 sqft.bedrms +α15 sqft.baths + α16 sqft.garage + α17 sqft.age + α18 sqft.city + α19 bedrms.baths + α20 bedrms.garage + α21 bedrms.age + α22 bedrms.city +
α23 baths.garage + α24 baths.age + α25 baths.city + α26 garage.age + α27 garage.city + α28age. city +ui
Cặp giả định H0: α1=α2 = α3 =α4=α5= α6=.....=α25 =α26 =α27 =α28
H1= α12 + α22 + α32 + α42 + α52 + α62+.....+α252 +α262+α272+α282
Test statistic: TR^2 = 173.556870
with p-value = P(Chi-square(26) > 173.556870) = 0.000000
Ta có: P-value = P(
2
qs)
=0.000000< 0,05
Kết luận: Phương sai sai số có thay đổi
Khắc phục hiện tượng phương sai sai số thay đổi:
Dùng hồi quy Robust:
23
Chạy Robust trên Gretl ta có bảng
Model 7: OLS, using observations 1-224
Dependent variable: salepric
Heteroskedasticity-robust standard errors, variant HC1
Coefficient
Std. Error
t-ratio
p-value
Const
-698,069
127,021
-5,4957
<0,00001
***
Sqft
0,222893
0,0328684
6,7814
<0,00001
***
Bedrms
-21,7851
24,2528
-0,8982
0,37005
Baths
10,0481
20,2989
0,4950
0,62110
Garage
134,113
45,9194
2,9206
0,00386
Age
5,71295
3,80896
1,4999
0,13510
City
87,8474
22,5488
3,8959
0,00013
***
***
Mean dependent var
642,9294
S.D. dependent var
371,3762
Sum squared resid
3525538
S.E. of regression
127,4626
R-squared
0,885372
Adjusted R-squared
0,882202
F(6, 217)
112,6578
P-value(F)
7,65e-64
-1400,199
Akaike criterion
2814,397
2838,279
Hannan-Quinn
2824,037
Log-likelihood
Schwarz criterion
Nguồn: Nhóm tác giả tự nghiên cứu tổng hợp với sự hỗ trợ của phần mềm Gretl
Ta thấy: p-value = 7,65e-64 < 0,05
Tuy nhiên khi dùng hồi quy Robust kết quả ước lượng sẽ không bị ảnh hường bởi
phương sai sai số thay đổi.
24
3.3.3.4.
Cặp giả thuyết {
Phân phối chuẩn của nhiễu
H0: Nhiễu có phân phối chuẩn
H1: Nhiễu không có phân phối chuẩn
Jarque-Bera test = 26.3389, with p-value 1.90802e006 p-value=1.90802e-006<0.05
Kết luận: Bác bỏ giả thiết Ho=> Nhiễu không có phân phối chuẩn
Khắc phục: Vì số quan sát của mẫu n=224>120=> các suy diễn thống kê vẫn có
giá trị dù ui có phân phối chuẩn hay không
3.3.3.5.
Tự tương quan
Mô hình nghiên cứu với bộ dữ liệu là dữ liệu chéo, mặt khác hiện trượng tự tương quan
thường xảy ra trên dữ liệu thời gian, xác suất xảy ra hiện tượng này trên dữ liệu chéo là
rất thấp. Vì thế, trong gretl không thể kiểm định được hiện tượng tự tương quan với bộ dữ
liệu trên.
3.3.4. Kết quả tóm tắt và một số phương hướng khắc phục khuyết tật
Mô hình phù hợp với lý thuyết kinh tế:
Mô hình đã thể hiện được các nhân tố đặc điểm cấu trúc ảnh hưởng đến giá cả
trung bình của căn nhà ở tại hai thành phố Coto de Caza và Dove Canyon, trong đó nhân
25