Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (11.93 MB, 100 trang )
<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">
<b> TRƯỜNG ĐẠI H</b>ỌC SƯ PHẠ<b>M KỸ THUẬT TP. HCM KHOA CÔNG NGH THÔNG TIN </b>Ệ
ĐỒ<b> ÁN H C PHẦN </b>Ọ TÊN HỌC PH N: Ầ <b>Kho dữ liệu (DWH) </b>
MÃ SỐ L P HP:Ớ <b> DAWH430784_010 </b>
<b>Tên đề tài Nhóm: PHÁT TRI N MƠ HÌNH KHO D</b>Ể <b>Ữ LIỆU TUY</b>ỂN SINH ĐẠ<b>I HỌC KHAI THÁC S DỬ ỤNG TẠI TRƯỜNG ĐẠI HỌC C A VI T NAM</b>Ủ Ệ
</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">2. Nguy n Thanh Sang ễ [44] Thành phần đăng ký d ự thi theo nhóm ngành nghề 3. Lê Th Nhung [38] Thành phị ần đăng ký dự thi theo khối thi
4. Nguy n Hoài Nam [33] Thành phễ ần đăng ký dự thi theo phương thức 5. Nguyễn Vũ Lực [30] Thành phần đăng ký dự thi theo dạng trường ph ổ thông 6. Lưu Gia Bảo [01] Thành phần đăng ký dự thi theo cơ sở đào tạo
7. Nguy n Qu c Vi t [63] Thành phễ ố ệ ần đăng ký dự thi theo nhóm tư vấn tuy n sinh cể ủa cơ sở đào tạo
8. Lê Phương Nam [32] Thành phần đăng ký dự thi theo đối tượng ưu tiên
9. Nguy n Ph m Duy Khiêm [24] Thành phễ ạ ần đăng ký dự thi theo k t quế ả trúng tuy n và ể nhập học
</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">6. Lưu Gia Bảo [01]:………….(………)………..
7. Nguyễn Quốc Việt [63]:………….(………)………..
8. Lê Phương Nam [32]:………….(………)………..
9. Nguyễn Phạm Duy Khiêm [24]:………….(………)………..
<b>Ngày 30/05/2022 </b>
<b>Giảng viên </b>
<b>Ký tên </b>
</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">- 4 -
TRƯỜNG ĐẠ<b>I H</b>ỌC SƯ PHẠ<b>M KỸ THUẬT TP.HCM KHOA CÔNG NGH THÔNG TIN </b>Ệ
ĐỀTÀI ĐỒ<b> ÁN H</b>Ọ<b>C PHẦN </b>
TÊN HỌC PH N: Ầ <b>Kho dữ liệu (DWH) </b>
MÃ SỐ L P HP:Ớ <b> DAWH430784_01 </b>
<b>Tên đề tài Nhóm: PHÁT TRI N MƠ HÌNH KHO D</b>Ể <b>Ữ LIỆU TUY</b>ỂN SINH ĐẠ<b>I HỌC KHAI THÁC S DỬ ỤNG TẠI TRƯỜNG ĐẠI HỌC C A VI T NAM </b>Ủ Ệ
<b>Giảng viên gi ng d y: VÕ XUÂN TH _ Gi ng viên chính </b>ả ạ Ể ả
</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">- 5 - LỜI CẢM ƠN
Ban giám hiệu trường Đại Học Sư phạm kỹ thuật Thành phố ồ Chí Minh vì đã tạo điề H u kiện về cơ sở vật chất với hệ thống thư viện hiện đại, đa dạng các loại sách, tài liệu thuận lợi cho việc tìm kiếm, nghiên c u thông tin. ứ
Xin cảm ơn giảng viên bộ môn Thầ- y Võ Xuân Thể đã giảng d y t n tình, chi tiạ ậ ết để chúng em có đủ kiến thức và v n d ng chúng vào bài tiậ ụ ểu lu n này. ậ
luận ch c chắ ắn sẽ không tránh kh i nh ng thi u sót. R t mong nhỏ ữ ế ấ ận đượ ực s nh n xét, ý ki n ậ ế đóng góp, phê bình từ phía Thầy để bài tiểu luận được hoàn thiện hơn.
Lời cuối cùng, chúng em xin kính chúc th y nhi u sầ ề ức khỏe, thành công và hạnh phúc.”
</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">Công c hụ ỗ trợ ổ chứ t c, qu n lý và khai thác kho dả ữ liệu (H ệ thống tổ chức dữ ệu thông minh cho các doanh nghi p): li ệ Business Intelligence Development Studio của Microsoft DWH Kho dữ u (Nhà kho dliệ ữ liệu): Data WareHouse ERD Sơ đồ thực thể kết hợp: Entity Relationship Diagram
NF Dạng chu n c a CSDL: Normal Form ẩ ủ
SQL Ngơn ngữ v n tin có c u trúc: Structured Query Language ấ ấ
</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">Tài khoản (Account)
Là m t quy n làm vi c trên h ộ ề ệ ệ thống ph n mầ ềm được cấp phát cho một cá nhân thông qua tên tài kho n (username) và m t kh u ả ậ ẩ (password).
BigData <sup>Dữ liệu l n: là m t t p h p d</sup><sub>xử lý dữ liệu b</sub><sup>ớ</sup> <sub>ằng các phương pháp truyề</sub><sup>ộ ậ</sup> <sup>ợ</sup> <sup>ữ liệu r t l n và ph c t p, không th </sup><sup>ấ ớ</sup><sub>n th</sub><sub>ống. </sub><sup>ứ ạ</sup> <sup>ể</sup>
</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">1.6. Bố cục của báo cáo ... 14
Chương 2. CƠ SỞ LÝ THUY T CẾ ỦA H C PHỌ ẦN ... 16
2.1. Tổng quan v kho dề ữ liệu (DWH) ... 16
2.1.1. Các khái niệm cơ bản về Kho dữ liệ u ... 16
2.1.1.1. Kho dữ liệu (DWH)? 16 2.1.1.2. Nguyên lý hình thành DWH 16 2.1.1.3. Các đặc điểm cơ bản của DWH 16 2.1.1.4. Phân bi t [SS] DWH vệ ới CSDL truy n th ng ề ố 16 2.1.2. Kiến trúc cơ bản của kho dữ liệu: ... 18
2.1.2.1. Tầng đáy: nạp dữ liệu 18 2.1.2.2. Tầng gi a: OLAP (OLAP server): x lý DWH ữ ử 18 2.1.2.3. Tầng trên cùng: ng d ng = khai thác s d ng DWH ứ ụ ử ụ 18 2.1.3. Mơ hình CSDL đa chiều (Dimensional Modeling) ... 18
2.2. Phân tích và thiết kế Kho d u ... 18ữ liệ 2.2.1. Phân tích và thiết kế kho d ữ liệu theo hướng mơ hình hóa nhi u chi u (Dimensional ề ề Modeling) ... 18
</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9">- 9 -
2.2.2. Các dạng (phương pháp) tích hợp d u ... 19ữ liệ 2.2.3. Các bước cơ bản trong tiến trình tích hợp dữ liệu ... 20 2.2.4. Các cơng cụ tích hợp d u: ... 20ữ liệ 2.2.5. Lập các lu ng cơng viồ ệc tích hợp d u (Data Integration Workflows) ... 20ữ liệ 2.2.6. Hệ thống OLTP (On-Line Transaction Processing = X l giao dử ý ịch trực tuyến) .... 20 2.3. Vấn tin khai thác s d ng Kho d u ... 21ử ụ ữ liệ 2.3.1. Vấn tin với các phép toán tổng hợp c a SQL trên kho dủ ữ liệu ... 21 2.3.2. Vấn tin với các hàm phân tích của SQL trên kho d u ... 21ữ liệ 2.3.3. Vấn tin dùng Materialized View để phân tích trên kho dữ liệu ... 21 2.3.4. Hệ thống OLAP ... 22 Chương 3. TỔNG QUAN VỀ KHO D Ữ LIỆU TUYỂN SINH ĐẠI HỌC SỬ DỤNG TẠI TRƯỜNG ĐẠI HỌC VIỆT NAM ... 23 3.1. <b>Ý tưởng hình thành DWH Tuyển sinh Đại học sử dụng tại trư</b>ờng Đạ<b>i học Việt Nam:</b>
23
3.2. Giới thiệu chung v Kho d ề ữ liệu ... 24 3.2.1. Mô tả t ng quan v DWH ... 24ổ ề 3.2.2. Các d u nguữ liệ ồn hình thành DWH ... 24 3.3. Xác định nhu c n t ầ ổ chức và phân tích dữ liệu của tồn bộ DWH ... 25 3.4. Các thành ph n thành ph n Kho d u phân công các cá nhân ph trách ... 25ầ ầ ữ liệ ụ Chương 4. PHÂN TÍCH, THI T K VÀ KHAI THÁC S D NG CÁC THÀNH Ế Ế Ử Ụ PHẦN KHO DỮ LIỆU TUYỂN SINH ĐẠI HỌC SỬ Ụ D NG TẠI TRƯỜNG ĐẠI HỌC 4.1.2. Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u ... 27ầ ữ liệ 4.1.3. Thiết lập CSDL ngu n cồ ủa thành phần c a Kho dủ ữ liệu ... 28 4.1.4. Mơ tả các Dim = Tiêu chí phân tích ... 30
</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">- 10 -
4.1.5. Mô tả cá Facts = S u phân tích c a thành ph n ... 31ố liệ ủ ầ 4.1.6. Lập các Views tính tốn các Facts trên CSDL ngu n liên quan thành ph n DWH ồ ầ tuyển sinh đại học ... 32 4.1.7. Phân phân tích các DB gốc xác định yêu c u phân tích DWH c a thành ph n ... 34ầ ủ ầ 4.1.8. Triển khai thành ph n DWH lên BIDS ... 36ầ 4.2. 44_Nguyễn Thanh Sang _Thành phần đăng ký dự thi theo nhóm ngành nghề ... 40 4.2.1. Mô tả t ng quan v thành phổ ề ần DWH đăng ký dự thi theo nhóm ngành ngh ... 40ề 4.2.2. Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u ... 40ầ ữ liệ 4.2.3. Xác định ý tưởng hình thành thành phần của Kho dữ liệu ... 41 4.2.4. Mô tả các DIM = tiêu chí phân tích ... 42 4.2.5. Mơ tả cá Facts = S u phân tích c a thành ph n ... 43ố liệ ủ ầ 4.2.6. Lập các View tính tốn ... 43 4.2.7. Thiết kế DB mới tổ chức phân tích Kho dữ liệ u cho thành ph n ... 44ầ 4.2.8. Triển khai thành ph n DWH trên BIDS ... 46ầ 4.3. 38_ Lê Thị Nhung _ Thành phần đăng ký dự thi theo khối thi ... 47 4.3.1. Mô tả t ng quan v thành ph n DWH : Thành phổ ề ầ ần đăng ký dự thi theo khối thi .... 47 4.3.2. Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u ... 47ầ ữ liệ 4.3.3. Thiết lập CSDL ngu n cồ ủa thành phần c a Kho dủ ữ liệu ... 48 4.3.4. Mô tả hệ thống các Dim = Tiêu chí phân tích (đánh giá) của thành phần đăng ký dự thi theo khối thi ... 49 4.3.5. Mô tả cá Facts = S u phân tích c a thành ph n ... 49ố liệ ủ ầ 4.3.6. Thiết kế DB mới tổ chức phân tích Kho dữ liệ u cho thành ph n ... 49ầ 4.3.7. Phân phân tích các DB gốc xác định yêu c u phân tích DWH c a thành ph n khầ ủ ầ ối thi
50
4.3.8. Triển khai thành ph n DWH lên BIDS ... 51ầ 4.4. 33_ Nguy n Hoài Nam _ Thành Phễ ần Đăng Ký Dự Thi Theo Phương Thức ... 52 4.4.1. Mô tả t ng quan v thành ph n DWH : Thành phổ ề ầ ần đăng ký dự thi theo phương thức :
52
4.4.2. Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u ... 53ầ ữ liệ
</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11">- 11 -
4.4.3. Xác định ý tưởng hình thành thành phần của Kho dữ liệu ... 54 4.4.4. Mơ tả các Dim = Tiêu chí phân tích ... 54 4.4.5. Mô tả cá Facts = S u phân tích c a thành ph n ... 55ố liệ ủ ầ 4.4.6. Lập các Views tính tốn các Facts trên CSDL ngu n liên quan thành ph n DWH ồ ầ tuyển sinh đại học ... 55 4.4.7. Phân phân tích các DB gốc xác định yêu c u phân tích DWH c a thành ph n ... 56ầ ủ ầ 4.4.8. Triển khai thành ph n DWH lên BIDS ... 56ầ 4.5. 30 _ Nguyễn Vũ Lực _ Thành phần đăng ký dự thi theo dạng trường phổ thông (trường chuyên, phổ thông, quố ế, GDTX ,...) ... 57 c t 4.5.1. Mô tả t ng quan v thành phổ ề ần DWH đăng ký dự thi theo dạng trường phổ thông (trường chuyên, phổ thông, quốc tế, GDTX ,...) ... 57 4.5.2. Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u ... 58ầ ữ liệ 4.5.3. Thiết lập CSDL ngu n cồ ủa thành phần c a Kho dủ ữ liệu ... 58 4.5.4. Mô tả các Dim = Tiêu chí phân tích ... 60 4.5.5. Mô tả cá Facts = S u phân tích c a thành ph n ... 61ố liệ ủ ầ 4.5.6. Lập các Views tính tốn các Facts trên CSDL ngu n liên quan thành ph n DWH ồ ầ tuyển sinh đại học ... 63 4.5.7. Phân tích các DB gốc xác định yêu c u phân tích DWH cầ ủa thành phần ... 65 4.5.8. Triển khai thành ph n DWH lên BIDS ... 65ầ 4.6. 01 _ Lưu Gia Bảo _ Thành phần đăng ký dự thi theo cơ sở đào tạo ... 68 4.6.1. Mô tả t ng quan v thành ph n DWH ổ ề ầ thành phần đăng ký dự thi theo cơ sở đào tạo68 4.6.2. Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u tuyầ ữ liệ ển sinh đại học khai thác sử d ng tụ ại trường đạ ọc c a Vii h ủ ệt Nam ... 68 4.6.3. Thiết lập CSDL nguồn của thành phần của Kho dữ liệu tuyển sinh đạ ọc khai thác i h sử d ng tụ ại trường đạ ọc c a Vii h ủ ệt Nam ... 70 4.6.4. Mô tả các Dim = tiêu chí phân tích (đáng giá) của thành phần đăng ký dư thi theo cơ sở đào tạo ... 70 4.6.5. Mô tả các Facts ... 71 4.6.6. Lập các Views tính toán các Facts trên CSDL nguồn liên quan thành phần DWH ... 72 4.6.7. Phân phân tích các DB gốc xác định yêu cầu phân tích DWH của thành phần ... 73
</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12">- 12 -
4.6.8. Triển khai thành ph n DWH lên BIDS ... 74ầ 4.7. 63_ NGUY N QU C VI T_ Thành phỄ Ố Ệ ần đăng ký dự thi theo nhóm tư vấn tuy n sinh ể của cơ sở đào tạo. ... 75 4.7.1. Mô tả t ng quan v thành ph n DWH: Thành phổ ề ầ ần đăng ký dự thi theo nhóm tư vấn tuyển sinh của cơ sở đào tạo ... 75 4.7.2. Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u ... 75ầ ữ liệ 4.7.3. Thiết lập CSDL ngu n cồ ủa thành phần c a Kho dủ ữ liệu ... 76 4.7.4. Mô tả hệ thống các Dim = Tiêu chí phân tích ... 77 4.7.5. Mơ tả các Facts = S u phân tích c a thành ph n ... 78ố liệ ủ ầ 4.7.6. Lập các Views tính tốn các Facts trên CSDL nguồn liên quan thành phần DWH ... 79 4.7.7. Phân phân tích các DB gốc xác định yêu cầu phân tích DWH của thành phần ... 83 4.8. 32_ Lê Phương Nam_ Thành Phần Đăng Ký Dự Thi Theo Đối Tượng Ưu Tiên ... 84 4.8.1. Mô tả t ng quan v thành phổ ề ần DWH đăng ký dự thi theo đ i tưố ợng ưu tiên ... 84 4.8.2. Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u ... 85ầ ữ liệ 4.8.3. Xác định ý tưởng hình thành thành phần của Kho dữ liệu ... 86 4.8.4. Mơ tả các Dim = tiêu chí phân tích... 86 4.8.5. Mô tả các Fact = số liệu phân tích c a thành ph n ... 86ủ ầ 4.8.6. Lập các Views tính tốn các Facts trên CSDL nguồn liên quan thành phần DWH tuyển sinh đại học ... 87 4.8.7. Phân phân tích các DB gốc xác định yêu c u phân tích DWH c a thành ph n ... 89ầ ủ ầ 4.8.8. Triển khai thành ph n DWH lên BIDS ... 89ầ 4.9. <b>24_ Nguyễn Phạm Duy Khiêm_ Thành ph</b>ần đăng ký dự<b> thi theo kết quả trúng tuyển và nhập học ... 90 </b>
4.9.1. Mô tả t ng quan v thành phổ ề ần DWH đăng ký dự thi theo kết qu trúng tuy n và nh p ả ể ậ học 90
4.9.2. Xác định ngu n dồ ữ liệu tích hợp thành ph n Kho d u ... 90ầ ữ liệ 4.9.3. Thiết lập CSDL ngu n cồ ủa thành phần kho d ữ liệu ... 91 4.9.4. Mô tả các Dim = Tiêu chí phân tích ... 92 4.9.5. Mơ tả cá Facts = S u phân tích c a thành ph n ... 93ố liệ ủ ầ
</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">- 13 -
4.9.6. Thiết lập các Views tính tốn c n thiầ ết để ạ n p d ữ liệu t ừ DB gốc vào các Factors của thành phần DWH ... 93 4.9.7. Phân phân tích các DB gốc xác định yêu c u phân tích DWH c a thành ph n ... 96ầ ủ ầ 4.9.8. Triển khai thành ph n DWH lên BIDS ... 96ầ Chương 5. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN CỦA ĐỒ ÁN HỌC PHẦN ... 97
</div><span class="text_page_counter">Trang 14</span><div class="page_container" data-page="14">- 14 -
Chương 1. GIỚI THIỆU VỀ ĐỒ ÁN HỌC PHẦN 1.1. Tổng quan về ĐỒ ÁN HỌC PHẦN
Đồ án H c phần DAWH430784 ọ
1.2. Nội dung chun mơn chính của ĐỒ ÁN HỌC PHẦN
Mơn học cung c p nh ng ki n thấ ữ ế ức cơ bản v kho d u, ki n trúc kho d u và các ề ữ liệ ế ữ liệ mơ hình đa chiều. Thực hành về thi t kế kho dữ liệu và sử dụng các công cụ phổ biến tạo các ế luồng cơng vi c tích h p dệ ợ ữ ệu. Bên cli ạnh đó, cung cấp ki n th c v ph n m r ng c a SQL ế ứ ề ầ ở ộ ủ được h ỗ trợ b i các h qu n tr ở ệ ả ị cơ sở d ữ liệu quan h ệ để trả lời các câu h i phân tích trong kinh ỏ doanh.
1.3. Mục tiêu của ĐỒ ÁN HỌC PHẦN
- Trình bày được các khái ni m và thu t ngệ ậ ữ cơ bản c a kho dủ ữ liệu và phân tích đượ ầm c t quan tr ng cọ ủa nó.
- Khả năng phân tích, thiết kế ộ m t kho d u cho m t yêu c u c ữ liệ ộ ầ ụ thể.
- Khả năng sử ụ d ng cơng c tích h p dụ ợ ữ liệu để triển khai vi c tích h p dệ ợ ữ liệu cho m t kho ộ dữ liệu c ụ thể.
- Khả năng sử ụ d ng ph n m r ng cầ ở ộ ủa SQL để trả ờ l i các câu h i v phân tích kinh doanh. ỏ ề - Khả năng thuyết trình và làm vi c nhóm. ệ
1.4. Công cụ và nền tảng kỹ thuật thực hiện ĐỒ ÁN HỌC PHẦN Các công c chính s dụ ử ụng trong đồ án này là
+ Microsoft SQL Server + Microsoft Visual Studio 2019 + BIDS
1.5. Sản phẩm của ĐỒ ÁN HỌC PHẦN - Tuyển Sinh Đại Học
1.6. Bố cục của báo cáo
Báo cáo gồm những nội dung như sau: Chương 1: Giới thiệu đồ án của h c phần DWH ọ
Chương 2: Các cơ sở lý thuyết của HP phục việc thực hiện đề tài HP
</div><span class="text_page_counter">Trang 15</span><div class="page_container" data-page="15">- 15 -
Chương 3: Giới thiệu tổng quan về Kho dữ liệu (DWH) Kho dữ liệu Tuyển sinh Đại Học tại các trường đại học
Chương 4: Phân tích, thiết kế và tổ chức khai thác sử dụng từng thành phần của Kho dữ liệu Chương 5: Tổng kết các kết quản đạt được và còn hạn chế của đ ồán, đồng thời đề xuất
hướng khắc phục hạn chế và phát triển Đồ án.
</div><span class="text_page_counter">Trang 16</span><div class="page_container" data-page="16">- 16 -
Chương 2. CƠ SỞ LÝ THUYẾT CỦA HỌC PHẦN 2.1. Tổng quan về kho dữ liệu (DWH)
2.1.1. Các khái niệm cơ bản về Kho dữ liệu 2.1.1.1. Kho dữ liệu (DWH)?
Kho d ữ liệu (data warehouse), g i mọ ột cách chính xác hơn là kho thông tin (information warehouse), là một cơ sở dữ liệu hướng đối tượng được thiết kế với việc tiếp cận các ý kiến trong mọi lĩnh vực đặc biệt là trong lĩnh vực kinh doanh. Nó cung c p các công c ấ ụ để đáp ứng thông tin c n thi t cho các nhà qu n tr kinh doanh t i m i cầ ế ả ị ạ ọ ấp độ ổ chức t - không nh ng là ữ những yêu c u d ầ ữ liệu ph c hứ ợp, mà còn là điều ki n thu n ti n nhệ ậ ệ ất để đạt được vi c l y thông ệ ấ tin nhanh, chính xác. M t kho dộ ữ liệu được thiế ế t k để ngườ ử d ng có th nh n ra thơng tin i s ụ ể ậ mà họ muốn có và truy cập đến b ng nh ng công cằ ữ ụ đơn giản.
2.1.1.2. Nguyên lý hình thành DWH
Một kho dữ liệu là một s pha trự ộn của nhiều công ngh , bao gệ ồm các cơ sở ữ liệu đa d chiều và m i quan hố ệ giữa chúng, ki n trúc ch khách, giao diế ủ ện người dùng đồ ọ h a và nhi u ề nữa. Nguyên nhân chính cho s phát tri n m t kho dự ể ộ ữ liệu là hoạt động tích hợp dữ liệu từ nhiều nguồn khác nhau vào m t kho dộ ữ liệu đơn lẻ và dày đặc mà kho này cung c p cho viấ ệc phân tích và ra quyết định trong cơng vi c kinh doanh, qu n lý. ệ ả
2.1.1.3. Các đặc điểm cơ bản của DWH
*Tính hướng chủ đề (Object Oriented): Dữ liệu được tập hợp, phân lớp, lưu trữ và x ử lý theo t ng ch ừ ủ đề, để ễ dàng xác đị d nh được nh ng thông tin c n thi t trong t ng hoữ ầ ế ừ ạt động. Các dữ liệu c a m i chủ ỗ ủ đề chính trong tổ chức được liên k t vế ới các khóa đại diện và đưa vào cùng một vị trí.
*Tính tích h p (Integration); Dợ ữ liệ ậu t p h p t nhi u nguợ ừ ề ồn khác nhau. Điều này s ẽ dẫn đến việc quá trình tập hợp phải thực hiện việc làm s ch, xắp xếp, rút gọn dữ liệu. ạ
*Dữ liệu g n thắ ời gian và có tính lịch s . Các dử ữ liệu đế ừn t quá trình kinh doanh của cơng ty có th có tể ừ nhiều năm trướ c.
*Dữ liệu có tính ổn định (non volatility): Khi m t Transaction hoàn ch nh, d ộ ỉ ữ liệu không thể t o thêm hay sạ ửa đổ i.
2.1.1.4. Phân biệt [SS] DWH v i CSDL truy n thớ ề ống
</div><span class="text_page_counter">Trang 17</span><div class="page_container" data-page="17">- 17 -
Mục đích Được thiết kế lưu lại bản ghi Đượđể c thiế ết k phân tích để
Xử lý Online Transactional Processing tạp, m i quan h , chu n hóa ố ệ ẩ
Khơng được chuẩn hóa
Được làm m i khi cần thiết từ nhiều nguồn ớ khác nhau, c n thì phầ ải đợi hệ thống ch y t o ạ ạ lại dữ liệu định kì cần thiết
Sử dụng Kỹ thuật mơ hình ER được sử
dụng <sup>Kỹ thuật mơ hình dữ liệu được sử d ng </sup><sup>ụ</sup> Kỹ thuật Capture dữ liệu Analyze dữ liệu
Sử dụng phương pháp tiếp cận đa chiều và chuẩn hóa cho c u trúc d u. Ví dấ ữ liệ ụ: Lược đồ sao và bông tuyết.
</div><span class="text_page_counter">Trang 32</span><div class="page_container" data-page="32">- 32 -
- Từ hai b ng này kả ết v i bớ ảng ThiSinh để ấ l y thơng tin thí sinh
- Thông qua hàm aggr count để đếm số lượng thí sinh thơng qua groupby maKhuVuc Tổng thí sinh đăng ký theo Tỉnh:
- Xuất phát từ table T nh ỉ
- Kết với bảng địa phương thông qua maTinh
- Từ hai b ng này kả ết v i bớ ảng ThiSinh để ấ l y thơng tin thí sinh
- Thơng qua hàm aggr count để đếm số lượng thí sinh thông qua groupby maTinh.
<b>4.1.6. Lập các Views tính tốn các Facts trên CSDL ngu n liên quan thành ph n DWH </b>ồ ầ tuyển sinh đại học
-- VIEW: Thống kê số lượng thí sinh theo khu vực ưu tiên
CREATE VIEW view_ThongKeKV_TS ([Mã Khu Vực],[Số lượng thí sinh])AS SELECT k.maKhuVuc as [Mã Khu V c], ự COUNT(t.maThiSinh) as [Số lượng thí sinh]
</div><span class="text_page_counter">Trang 33</span><div class="page_container" data-page="33">- 33 - FROM dbo.ThiSinh as t INNER JOIN
dbo.DiaPhuong as d ON t.maDiaPhuong = d.maDiaPhuong INNER JOIN dbo.KhuVucUuTien ask ON d.maKhuvuc = k.maKhuVuc
GROUP BY k.maKhuVuc;
-- View: Thống kê số lượng thí sinh theo tỉnh
CREATE VIEW view_ThongKeTinh_TS ([Tỉnh], [Số lượng thí sinh]) AS SELECT k.tenTinh as [Tỉnh], COUNT(t.maThiSinh) as [Số lượng thí sinh] FROM dbo.ThiSinh as t INNER JOIN
dbo.DiaPhuong as d ON t.maDiaPhuong = d.maDiaPhuong INNER JOIN dbo.Tinh ask ON d.maTinh = k.maTinh
GROUP BY k.tenTinh;
-- View: thống kê số lượng phiếu đăng ký theo khu vực
CREATE VIEW view_ThongKeKV_PhieuDK ([Mã Khu Vực],[S lượng phiếu])AS ố SELECT k.maKhuVuc as [Mã Khu V c], ự COUNT(p.maPhieu) as [Số lượng phiế u] FROM dbo.ThiSinh as t INNER JOIN
dbo.DiaPhuong as d ON t.maDiaPhuong = d.maDiaPhuong INNER JOIN dbo.KhuVucUuTien ask ON d.maKhuvuc = k.maKhuVuc INNER JOIN dbo.PhieuDangKy as p ON t.maThiSinh = p.maThiSinh
</div><span class="text_page_counter">Trang 34</span><div class="page_container" data-page="34">- 34 - GROUP BY k.maKhuVuc;
GO
-- View: Thống kê số lượng phiếu đăng ký theo tỉnh
CREATE VIEW view_ThongKeTinh_PhieuDK ([Tỉnh], [Số lượng phi u]) ế AS SELECT k.tenTinh as [Tỉnh], COUNT(p.maPhieu) as [Số lượng thí sinh] FROM dbo.ThiSinh as t INNER JOIN
dbo.DiaPhuong as d ON t.maDiaPhuong = d.maDiaPhuong INNER JOIN dbo.Tinh ask ON d.maTinh = k.maTinh INNER JOIN
dbo.PhieuDangKy as p ON t.maThiSinh = p.maThiSinh GROUP BY k.tenTinh;
<b>4.1.7. Phân phân tích các DB g</b>ốc xác định yêu c u phân tích DWH cầ ủa thành phần
+ Tỉnh
</div><span class="text_page_counter">Trang 35</span><div class="page_container" data-page="35">- 35 - + DiaPhuong
+ KhuVucUuTien
</div><span class="text_page_counter">Trang 36</span><div class="page_container" data-page="36">- 36 -
<b>4.1.8. Triển khai thành phần DWH lên BIDS </b>
- Triển khai view lên DWH + View Số lượng thí sinh theo t nh ỉ
+ View số lượng thí sinh theo khu vực ưu tiên
</div><span class="text_page_counter">Trang 37</span><div class="page_container" data-page="37">- 37 - + View Số lượng thí sinh theo t nh ỉ
+ View Số lượng phiếu đăng ký:
</div><span class="text_page_counter">Trang 38</span><div class="page_container" data-page="38">- 38 - - Triển khai tính tốn theo measure + Measure Phiếu đăng ký theo Tỉnh
+ Measure Thi Sinh theo mã Tỉnh
</div><span class="text_page_counter">Trang 39</span><div class="page_container" data-page="39">- 39 -
</div><span class="text_page_counter">Trang 40</span><div class="page_container" data-page="40">- 40 -
4.2. 44_Nguyễn Thanh Sang _Thành phần đăng k dự thi theo nhóm ngành nghề
<b>4.2.1. Mô tả tổng quan về thành ph</b>ần DWH đăng k dự thi theo nhóm ngành nghề
. Fact: FACT theo t ng sổ ố lượng đơn dự tuyển theo nhóm ngành . Nguồn: Cơ sở đào tạo đại học
<b>4.2.2. Xác định nguồn dữ liệu tích hợp thành phần Kho dữ liệu </b>
Thành phần đăng ký dự thi theo nhóm ngành nghề (Cơng nghệ thông tin, Sư phạm,..): .CSDL đăng ký dự thi do trường đại học quản lý:
- Lưu thơng tin thí sinh, ngành và nhóm ngành.
</div>