ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
BÁO CÁO MÔN HỌC
KHO DỮ LIỆU
Nhóm 6
Phùng Việt Tiến
Trần Ngọc Minh
Phạm Văn Tuân
Nguyễn Văn An
Đỗ Việt Hưng
HÀ NỘI – 2018
Mục Lục
2
1. Sơ lược về project.
Dự án: Xây dựng DWH Customer relationship management (CRM)
Công cụ hỗ trợ: SQL Server, tableau
Những công việc đã làm
o Cài đặt một hệ quản trị cơ sở dữ liệu tùy chọn (SQL Server)
o Đọc tài liệu, xác định ứng dụng cần làm
o Xây dựng cơ sở dữ liệu tương ứng với ứng dụng đó
o Nhập dữ liệu mẫu tương ứng
o Convert dữ liệu từ cơ sở dữ liệu sang kho dữ liệu
o Xây dựng một số câu hỏi và dùng kho dữ liệu để trả lời những câu hỏi ấy
2. Cơ sở dữ liệu.
Cơ sở dữ liệu gồm 9 bảng:
•
•
•
•
•
•
•
•
•
Customers(customerID, lastName, firstName, phone, gender,
territoryID, countryDemographicID)
OrderHeades(orderID, orderDate, requiredDate, shipperDate,
customerID)
OrderDetails(orderID, productName, quantityOrdered, priceEach,
priceDiscount)
Reviews(customerID, score, date)
countryDemographics(countryDemographicID, nameCountry,
totalPopulation, femalePopulation, malePopulation)
Territorys(territoryID, district, city, [group], country, postalCode)
Status(customerID, status, orderDate)
Products(productID, productName, quantityInStock, buyPrice,
productlineID)
Productlines(productlineID, name, description)
3
Mô hình:
4
3. Xây dựng cấu trúc kho dữ liệu
-
Gồm 3 bảng fact và 7 dimension.
Mơ hình:
a. Phân tích đơn hàng được đặt theo khách hàng, sản phẩm, giới tính, vị trí khách
hàng
b. Phân tích chỉ số sự hài lịng của khách hàng theo khách hàng và thời gian
c. Phân tích cảnh báo gian lận theo khách hàng và thời gian
5
4. Thủ tục đồng bộ dữ liệu từ nguồn sang kho dữ liệu
Hình 1. Thủ tục tổng hợp CountryDemographicDimension
6
Hình 2. Thủ tục tổng hợp CustomerDimension
Hình 3. Thủ tục tổng hợp DateDimension
7
Hình 4. Thủ tục tổng hợp GenderDimension
Hình 5. Thủ tục tổng hợp ProductDimension
8
Hình 6. Thủ tục tổng hợp ScoreFact
Hình 7. Thủ tục tổng hợp StatusDimension
9
Hình 8. Thủ tục tổng hợp StatusFact
Hình 9. Thủ tục tổng hợp TerritoryDimension
10
Hình 10. Thủ tục tổng hợp OrderFact
11
5. Trình diễn trên Tableau
Khu vực nào có lượng khách hàng mua hàng với giá trị lớn nhất
Lọc tất cả các khách hàng đã chi tiêu nhiều hơn 1 số tiền nhất định trong năm
ngối Ví dụ 5000.
12
Có bao nhiêu khách hàng mua hàng trong tháng này nhiều hơn trung bình hàng
tháng từ đầu năm đến giờ
Khoảng cách 2 lần đặt hàng lâu nhất của khách hàng
13
Sự chênh lệch mua hàng giữa nam và nữ theo số lượng mua? (Từng sản phẩm)
14
Sự chênh lệch mua hàng theo khu vực, thời gian khác nhau như thế nào?
Khoảng thời gian nào khách hàng mua hàng nhiều nhất (tổng khách hàng, thời
gian, tổng tiền)
15
Phân tích sản phẩm theo doanh số bán ra, thời gian
Đưa ra chỉ số hài lòng của khách hàng theo khách hàng, thời gian
16
Đưa ra giá trị trung bình chỉ số hài lòng của khách hàng theo tháng
Bao nhiêu lần khách hàng đã bị cảnh báo gian lận theo tháng?
17
18