Tải bản đầy đủ (.pdf) (3 trang)

DSpace at VNU: Ứng dụng kỹ thuật OLAP trong khai phá dữ liệu sinh viên tại Học viện Ngân hàng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (82.47 KB, 3 trang )

Ứng dụng kỹ thuật OLAP trong khai phá dữ liệu
sinh viên tại Học viện Ngân hàng
Nguyễn Tuấn Minh
Trường đại học Công nghệ
Luận văn ThS. Hệ thống thông tin; Mã số: 60 48 01 04
Người hướng dẫn: PGS.TS. Đỗ Trung Tuấn
Năm bảo vệ: 2014
Abstract. Luận văn đã trình bày được một cách tổng quan về Khai phá dữ liêu và kỹ
thuật OLAP trong khai phá dữ liệu, các công nghệ hỗ trợ xây dựng kho dữ liệu, OLAP
trong SQL Server 2008 và cách thức áp dung các công cụ vào xây dựng kỹ thuật OLAP.
Về phần tổng quan về khai phá dữ liệu và phát hiện tri thức luận văn đã trình bày tóm tắt
các khái niệm, các kỹ thuật khai phá dữ liệu, kiến trúc tổng thể của kỹ thuật OLAP, mô
hình dữ liệu. Luận văn cũng đã trình bày một số công cụ và dịch vụ chính hỗ trợ cho việc
triển khai kỹ thuật của SQL Server 2008. Cụ thể đã trình bày các công cụ và dịch vụ sau:
• Hệ Quản trị CSDL SQL Server 2008
• Dịch vụ tích hợp dữ liệu SSIS
• Dịch vụ báo cáo SSRS
• Dịch vụ phân tích SSAS
• Công cụ quản lý SSMS
• Công cụ phát triển kho dữ liệu BIDS
• Công cụ phân tích dữ liệu PivotTable của Excel
• Công cụ quản lý báo cáo
Cuối cùng, luận văn đã trình bày cách thức áp dụng các công cụ và dịch vụ của SQL
Server 2008 trong việc xây dựng thử nghiệm khai phá dữ liệu sinh viên bằng kỹ thuật
OLAP cho Học viện Ngân hàng, bước đầu kết quả của việc phân tích dữ liệu đạt được
khá khả quan, đáp ứng được một số yêu cầu mong muốn đề ra. Mặc dù chỉ mới tập trung
xây dựng khai phá dữ liệu học tập của sinh viên, nhưng luận văn đã thực hiện đầy cả các
bước của qui trình triển khai kỹ thuật OLAP, đủ để đưa vào áp dụng chạy thử nghiệm
trong thực tế. Các bước thực hiện khi xây dựng dữ liệu thử nghiệm như sau: xây dựng
cấu trúc các CSDL, làm sạch và tích hợp dữ liệu, tạo khối dữ liệu đa chiều, tạo các báo
cáo mẫu, tạo các phân tích mẫu và chia sẻ báo cáo.




Keywords. Khai phá dữ liệu; Kỹ thuật OLAP; Cơ sở dữ liệu; Công nghệ thông tin
Content.
1. Chương 1. Phần này giới thiệu một cách tổng quát về quá trình pháthiện tri thức nói chung và
khai phá dữ liệu nói riêng.
2. Chương 2. Giới thiệu về kỹ thuật OLAP, chương này trình bày một cáchtổng thể về các khái
niệm OLAP, kiến trúc OLAP, qui trình triển khaikỹ thuật OLAP, và cách thức khai thác dữ liệu.
Liên quan đến tìm hiểukỹ thuật OLAP trong SQL Server, chương này trình bày giải pháp công
nghệ kho dữ liệu và kỹ thuật OLAP của Microsoft, mà đặc biệt là củaSQL Server 2008. Ngoài ra
cũng trình bày một số công cụ được sử dụngtrong việc xây dựng kho dữ liệu như: SSIS dùng cho
tích hợp, SSRSdùng cho báo cáo, SSAS dùng cho phân tích dữ liệu và SSMS dùng choviệc theo
dõi và quản lý.
3. Chương 3. Chương này trình bày một số kết quả đã đạt được khi tiếnhành áp dụng kỹ thuật
OLAP vào khai phá dữ liệu sinh viên của Họcviện Ngân hàng. Chương này tóm tắt các phần đã
được cài đặt và chạythử nghiệm như: dữ liệu nguồn và đích, các mẫu phân tích và báo cáo.
Phần kết luận trình bày tổng hợp các kết quả thực hiện luận văn cũng như cácphần cần mở rộng
khi áp dụng cho thực tế.
References.
Tiếng Việt
[1] Trịnh Thế Tiến (2009), Giáo trình học nhanh SQL Server 2008, Nhà xuất bảnHồng Đức.
[2] Viện Công nghệ Thông tin, Viện Khoa học và Công nghệ Việt Nam (1999),Thiết kế hệ thống
trong xây dựng Data Warehouse và Hệ thống Thông tin lớn,Hà Nội.
Tiếng Anh
[3] Tom Mitchell (1999), Machine Learning and Data Mining, Communications ofthe ACM,
Vol. 42, No. 11, pp. 30-36.
[4] U. M. Fayyad, G. Piatetsky-Shapiro, P. Smyth and R. Uthurusamy (1996)Advances in
Knowledge Discovery and Data Mining, AAAI Press, Menlo Park,CA).
[5] D. Pyle (2003), Business Modeling and Data Mining, Morgan Kaufmann, San Francisco, CA.
[6] Joy Mundy and Warren Thornthwaite (2011), The Microsoft Data WarehouseToolkit: With

SQL Server 2008 R2 and the Microsoft Business IntelligenceToolset, Wiley Publishing, Inc.
[7]Microsoft, SQL Server 2008 Books Online.


[8] Rob Vieira (2009), Professional Microsoft SQL Server 2008 Programming,Wiley Publishing,
Inc.
[9] Trang web: 2011.
[10] Real-Time Data Integration for Data Warehousing and Operational BusinessIntelligence An
Oracle White Paper, 2010.
[11] J. Grabmeier, and A. Rudolph (2002), Techniques of Clustering Algorithms inData Mining,
Data Mining and Knowledg



×