Tải bản đầy đủ (.docx) (2 trang)

Bai tap

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (66.58 KB, 2 trang )

MƠ TẢ
Cột

Mơ tả ngắn

id

ID nhà

date

Ngày bán nhà

price

Giá nhà - biến target cần dự đốn

bedrooms

Số phịng ngủ

bathrooms

Số phịng tắm (Xem lại)

sqft_living

Diện tích nhà. Đơn vị tính là Foot vng <1
foot vng = 0.092903 mét vng>, một đơn
vị đo lường diện tích của Anh-Mỹ)


sqft_lot

Diện tích của cả lơ đất bao gồm nhà

floors

Tổng số tầng của nhà, nếu có 0.5 thì là
penthouse

waterfront

Nhà có view ra bờ sơng

view

Nhà có wiew

condition

Thang đo đánh giá điều kiện sống tại khu
vực

grade

cấp loại nhà

sqft_above

Diện tích nhà ngồi tầng hầm


sqft_basemen
t

Diện tích tầng hầm

yr_built

Năm xây dựng nhà

yr_renovated

Năm cải tạo lại nhà


zipcode

Mã bưu chính

lat

Tọa độ kinh tuyến

long

Tọa độ vĩ tuyến

sqft_living15

Diện tích phịng khách vào năm 2015 (sau
khi cải tạo nhà). Nó khơng ảnh hưởng đến

diện tích lơ đất

sqft_lot15

Diện tích lơ đất vào năm 2015

Yêu cầu:
Câu 1. Xử lý giá trị bị khuyết:
- Biến
"bedrooms",
"bathrooms",
"view",
"sqft_basement", "sqft_lot" tự chọn phương pháp điền
khuyết, giải thích cách chọn phương pháp.
- Nếu còn lại các biến khác bị khuyết thì loại bỏ mẫu dữ
liệu.
Câu 2. Có thể dùng loại trực quan gì cho biến "floors"? Bình luận
kết quả trực quan (nếu có)?
Câu 3. Có thể dùng loại trực quan gì cho biến "waterfront"? Bình
luận kết quả trực quan (nếu có)?
Câu 4. Sử dụng trực quan regplot để đánh giá, kiểm tra thử ảnh
hưởng của các biến loại diện tích (sqft_...) so với giá. Phác
họa trên cùng một hình. Sau đó, bình luận các kết quả?
Câu 5. Xây dựng mơ hình thích hợp dự đốn giá nhà từ các biến
sau "floors", "view", "waterfront", "bedrooms", "grade",
"bathrooms", "sqft_living15", "sqft_above", "sqft_living",
"sqft_basement". (Yêu cầu: phải áp dụng kỹ thuật Pipeline
và thang đo thích hợp nhất).




Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×