Tải bản đầy đủ (.ppt) (26 trang)

Hồi quy dữ liệu khai phá dữ liệu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (556.28 KB, 26 trang )

1
Chương 3: Hồi qui dữ liệu
Chương 3: Hồi qui dữ liệu
Khai phá dữ liệu
(Data mining)
Học kỳ 1 – 2009-2010
Khoa Khoa Học & Kỹ Thuật Máy Tính
Khoa Khoa Học & Kỹ Thuật Máy Tính
Trường Đại Học Bách Khoa Tp. Hồ Chí Minh
Trường Đại Học Bách Khoa Tp. Hồ Chí Minh

2
Nội dung

3.1. Tổng quan về hồi qui

3.2. Hồi qui tuyến tính

3.3. Hồi qui phi tuyến

3.4. Ứng dụng

3.5. Các vấn đề với hồi qui

3.6. Tóm tắt

3
Tài liệu tham khảo

[1] Jiawei Han, Micheline Kamber, “Data Mining:
Concepts and Techniques”, Second Edition, Morgan


Kaufmann Publishers, 2006.

[2] David Hand, Heikki Mannila, Padhraic Smyth,
“Principles of Data Mining”, MIT Press, 2001.

[3] David L. Olson, Dursun Delen, “Advanced Data Mining
Techniques”, Springer-Verlag, 2008.

[4] Graham J. Williams, Simeon J. Simoff, “Data Mining:
Theory, Methodology, Techniques, and Applications”,
Springer-Verlag, 2006.

[5] ZhaoHui Tang, Jamie MacLennan, “Data Mining with
SQL Server 2005”, Wiley Publishing, 2005.

[6] Oracle, “Data Mining Concepts”, B28129-01, 2008.

[7] Oracle, “Data Mining Application Developer’s Guide”,
B28131-01, 2008.

4
3.0. Tình huống 1
Ngày mai giá
cổ phiếu STB
sẽ là bao
nhiêu???

5
3.0. Tình huống 2
x

y
y = x + 1
X1
Y1
Y1’
Mô hình phân bố dữ liệu của y theo x???

6
3.0. Tình huống 3
Bài toán phân tích giỏ hàng thị
trường (market basket analysis)
 sự kết hợp giữa các mặt hàng?

7
3.0. Tình huống 4

Khảo sát các yếu tố tác động đến xu hướng
sử dụng quảng cáo trực tuyến tại Việt Nam

Sự giải trí cảm nhận (+0.209)

Chất lượng thông tin (+0.261)

Chất lượng thông tin cảm nhận (+0.199)

Sự khó chịu cảm nhận (-0.175)

Sự tin cậy cảm nhận

Thái độ về tính riêng tư


Sự tương tác (+0.373)

Chuẩn chủ quan (+0.254)

Nhận thức kiểm soát hành vi (+0.377)

8
3.0. Tình huống …

Hồi qui (regression)

Khai phá dữ liệu có tính dự báo (Predictive data
mining)

Tình huống ???

Khai phá dữ liệu có tính mô tả (Descriptive data
mining)

Tình huống ???

9
3.1. Tổng quan về hồi qui

Định nghĩa - Hồi qui (regression)

J. Han et al (2001, 2006): Hồi qui là kỹ thuật
thống kê cho phép dự đoán các trị (số) liên tục.


Wiki (2009): Hồi qui (Phân tích hồi qui –
regression analysis) là kỹ thuật thống kê cho phép
ước lượng các mối liên kết giữa các biến

R. D. Snee (1977): Hồi qui (Phân tích hồi qui) là
kỹ thuật thống kê trong lĩnh vực phân tích dữ liệu
và xây dựng các mô hình từ thực nghiệm, cho
phép mô hình hồi qui vừa được khám phá được
dùng cho mục đích dự báo (prediction), điều khiển
(control), hay học (learn) cơ chế đã tạo ra dữ liệu.

10
3.1. Tổng quan về hồi qui

Mô hình hồi qui (regression model): mô hình mô tả mối
liên kết (relationship) giữa một tập các biến dự báo
(predictor variables/independent variables) và một hay
nhiều đáp ứng (responses/dependent variables).

Phân loại

Hồi qui tuyến tính (linear) và phi tuyến (nonlinear)

Hồi qui đơn biến (single) và đa biến (multiple)

Hồi qui có thông số (parametric), phi thông số
(nonparametric), và thông số kết hợp (semiparametric)

Hồi qui đối xứng (symmetric) và bất đối xứng (asymmetric)

×