MƠ TẢ
Cột
Mơ tả ngắn
id
ID nhà
date
Ngày bán nhà
price
Giá nhà - biến target cần dự đốn
bedrooms
Số phịng ngủ
bathrooms
Số phịng tắm (Xem lại)
sqft_living
Diện tích nhà. Đơn vị tính là Foot vng <1
foot vng = 0.092903 mét vng>, một đơn
vị đo lường diện tích của Anh-Mỹ)
sqft_lot
Diện tích của cả lơ đất bao gồm nhà
floors
Tổng số tầng của nhà, nếu có 0.5 thì là
penthouse
waterfront
Nhà có view ra bờ sơng
view
Nhà có wiew
condition
Thang đo đánh giá điều kiện sống tại khu
vực
grade
cấp loại nhà
sqft_above
Diện tích nhà ngồi tầng hầm
sqft_basemen
t
Diện tích tầng hầm
yr_built
Năm xây dựng nhà
yr_renovated
Năm cải tạo lại nhà
zipcode
Mã bưu chính
lat
Tọa độ kinh tuyến
long
Tọa độ vĩ tuyến
sqft_living15
Diện tích phịng khách vào năm 2015 (sau
khi cải tạo nhà). Nó khơng ảnh hưởng đến
diện tích lơ đất
sqft_lot15
Diện tích lơ đất vào năm 2015
Yêu cầu:
Câu 1. Xử lý giá trị bị khuyết:
- Biến
"bedrooms",
"bathrooms",
"view",
"sqft_basement", "sqft_lot" tự chọn phương pháp điền
khuyết, giải thích cách chọn phương pháp.
- Nếu còn lại các biến khác bị khuyết thì loại bỏ mẫu dữ
liệu.
Câu 2. Có thể dùng loại trực quan gì cho biến "floors"? Bình luận
kết quả trực quan (nếu có)?
Câu 3. Có thể dùng loại trực quan gì cho biến "waterfront"? Bình
luận kết quả trực quan (nếu có)?
Câu 4. Sử dụng trực quan regplot để đánh giá, kiểm tra thử ảnh
hưởng của các biến loại diện tích (sqft_...) so với giá. Phác
họa trên cùng một hình. Sau đó, bình luận các kết quả?
Câu 5. Xây dựng mơ hình thích hợp dự đốn giá nhà từ các biến
sau "floors", "view", "waterfront", "bedrooms", "grade",
"bathrooms", "sqft_living15", "sqft_above", "sqft_living",
"sqft_basement". (Yêu cầu: phải áp dụng kỹ thuật Pipeline
và thang đo thích hợp nhất).