Tải bản đầy đủ (.pdf) (7 trang)

ĐỀ CƯƠNG CHI TIẾT HỌC PHẦN: KHAI KHOÁNG DỮ LIỆU

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (598.1 KB, 7 trang )

<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">

<b><small>TRƯỜNG ĐH NGOẠI NGỮ - </small></b>

<b><small>TIN HỌC TP.HCM </small><sup>CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM </sup><small>Khoa CÔNG NGHỆ THÔNG TIN Độc Lập - Tự Do - Hạnh Phúc </small></b>

<b>CHƯƠNG TRÌNH GIÁO DỤC ĐẠI HỌC </b>

<b>Trình độ đào tạo: Đại học Ngành: Cơng nghệ thông tin Mã số: 7480201 </b>

<b>ĐỀ CƯƠNG CHI TIẾT HỌC PHẦN </b>

<i><b>1. Thông tin chung về HP </b></i>

- Danh sách giảng viên cùng giảng dạy:

<b>1.8 Điều kiện tham gia học phần: </b>

<b>2. Mục tiêu HP 2.1. Mục tiêu chung </b>

- Môn học này nhằm cung cấp cho sinh viên những kiến thức cơ bản về lĩnh vực Khai thác dữ liệu và những ứng dụng của nó vào các ngành khoa học khác.

- Môn học này bao gồm các nội dung tổng quát liên quan đến quy trình khám phá tri thức từ dữ liệu và các nội dung chuyên sâu liên quan đến các kỹ thuật thông dụng trong khai thác dữ liệu như khai thác tập phổ biến và luật kết hợp, phân loại, gom cụm, biểu diễn và đánh giá tri thức.

<b>2.2. Mục tiêu HP cụ thể 2.2.1. Về kiến thức: </b>

- Kiến thức nền tảng: Các khái niệm về lĩnh vực khai thác dữ liệu và các vấn đề liên quan.

- Hiểu được ý nghĩa và ứng dụng của các bài toán trong khai thác dữ liệu đối với các vấn đề thực tế.

<b>2.2.2. Về kỹ năng: </b>

- Xây dựng được một số thành phần của một hệ thống khai thác dữ liệu ở quy mô nhỏ. - Vận dụng được một số vấn đề và các cách tiếp cận trong khai thác dữ liệu.

<b>2.2.3. Về thái độ </b>

- Có thái độ làm việc khoa học, trung thực, rõ ràng.

- Chuẩn bị bài trước khi đến lớp. Đi học đầy đủ. Tham gia tích cực trong giờ học. - Làm tất cả các bài tập lý thuyết và thực hành.

</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">

<b>3. Chuẩn đầu ra của HP “Khai khoáng dữ liệu” </b>

<b>Bảng 3.1. Chuẩn đầu ra (CĐR) của HP </b>

Sau khi học xong học phần, SV có khả năng:

<b>Ký hiệu CĐR HP </b>

<b>Nội dung CĐR HP (CLO) </b>

CLO1 Nắm vững các kiến thức về khai thác dữ liệu trong khai thác mẫu, luật, phân nhóm, gom cụm, biểu diễn và đánh giá tri thức.

CLO2 Có trách nhiệm trong học tập, trung thực và sử dụng phần mềm hợp pháp. CLO3 Có khả năng sử dụng các công cụ hỗ trợ các giai đoạn trong việc khai thác dữ

liệu.

CLO4 Có khả năng đọc tài liệu và tự nghiên cứu những giải thuật cơ bản.

CLO5 Vận dụng các thuật toán khai thác dữ liệu và cài đặt bổ sung vào các công cụ hỗ trợ khai thác dữ liệu

<b>4. Mối liên hệ giữa CĐR HP (CLO) với CĐR CTĐT (PLO) </b>

Mức độ đóng góp của CLO vào PLO được xác định cụ thể:

<i><small>1 – CLO có đóng góp vừa vào PLO 2 – CLO có đóng góp nhiều vào PLO </small></i>

<i>Chú thích: 2 - Cao, 1 - Thấp - phụ thuộc vào mức hỗ trợ của CLO đối với PLO ở mức bắt đầu (1) hoặc mức nâng cao hơn mức bắt đầu, có nhiều cơ hội được thực hành, thí nghiệm, thực tế,…(mức 2) </i>

<b>Bảng 4.1. Mối liên hệ của CĐR HP (CLO) đến CĐR của CTĐT (PLO) <small>PLO </small></b> <small>(1) (2) (3) (4) (5) (6) (7a,b,c,d) (8b, c,d) (9b,c,d) (10b,c,d) (11b,c,d) </small>

<i><b>a. Phương pháp, hình thức kiểm tra - đánh giá của HP </b></i>

<b>Bảng 5.1. Phương pháp, hình thức kiểm tra - đánh giá kết quả học tập của SV ở HP </b>

<b><small>Th/phần </small></b>

<b><small>đánh giá </small><sup>Trọng </sup><small>số </small><sup>Bài đánh giá </sup><sup>Trọng số </sup><small>con </small></b>

<b><small>Rubric Lquan đến CĐR nào ở bảng 3.1 </small></b>

<i><b><small>HD PP đánh giá </small></b></i>

<small>A1. Kiểm tra thường xuyên (KTTX) </small>

<small>20% </small>

<small>A1.1. Từng buổi học </small>

<small>10% </small>

<small>R1 CLO 1 - Điểm danh </small>

<small>- Đánh giá hoạt động trên lớp </small>

<small>A1.2. Tuần 4: Làm bài </small>

<small>tập về khai thác mẫu 30% </small>

<small>CLO3 CLO4 </small>

<small>- Đánh giá khả năng đọc tài liệu và nghiên cứu giải thuật </small>

<small>A1.3. Tuần 6: Làm bài tập về khai thác luật </small>

<small>CLO3 CLO4 </small>

<small>A1.4. Tuần 8: Làm bài tập về phân lớp </small>

<small>CLO3 CLO4 </small>

<small>A2. Đánh giá phần thực hành </small>

<small>30% </small>

<small>Sinh viên hoàn thành bài thực hành trong buổi thực hành </small>

<small>CLO 4 </small>

<small>- GV giao bài thực hành vào đầu mỗi buổi thực hành </small>

<small>- GV chấm kết quả vào cuối buổi thực hành </small>

</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">

<small>CLO 4 </small>

<i><b>b. Chính sách đối với HP </b></i>

<b>6. Kế hoạch và nội dung giảng dạy HP </b>

<b>Bảng 6.1. Kế hoạch và nội dung giảng dạy của HP theo tuần <small>Tuần/ </small></b>

<b><small>TT) </small></b>

<b><small>CĐR của bài học (chương)/ </small></b>

<b><small>chủ đề </small></b>

<b><small>Lquan đến CĐR nào ở bảng 3.1 </small></b>

<b><small>PP giảng dạy đạt </small></b>

<b><small>CĐR </small></b>

<b><small>Hoạt động học của </small></b>

<b><small>SV(*) </small></b>

<b><small>Tên bài đánh </small></b>

1.1. Nhu cầu KPDL 1.2. Các khái niệm KPDL

1.3. Một số ứng dụng 1.4. Các vấn đề chính trong KPDL

<small>giảng </small>

<small>1.2. Đặt câu hỏi gợi mở để sinh viên trả lời 1.3. Liên hệ với những kiến thức đã học trước đó và kinh nghiệm đã có </small>

<small>CLO1 CLO2 </small>

<small>- GV sử dụng tài liệu [1] và projector để thuyết giảng </small>

<small>- Phần chuẩn bị ở nhà: </small>Đọc trước Cuốn [1]: Phần 1; Cuốn [2]: Chương 1, 2

<small>- Ghi chú, tham gia các hoạt động trên lớp 2 </small> <i><b>Chương 2. Tiền xử lý </b></i>

<i><b>dữ liệu </b></i>

2.1. Vấn đề về dữ liệu 2.2. Phân tích cấu trúc và thuộc tính dữ liệu 2.3. Tiền xử lý dữ liệu

<small>giảng </small>

<small>2.2. Đặt câu hỏi gợi mở để sinh viên trả lời 2.3. Cách đánh giá giải thuật </small>

<small>CLO1 CLO2 CLO3 </small>

<small>- GV sử dụng tài liệu [1] và projector để thuyết giảng </small>

<small>- Phần chuẩn bị ở nhà: </small>Đọc trước Cuốn [1]: Phần 1; Cuốn [2]: Chương 3 <small>- Ghi chú, tham gia các hoạt động trên lớp 3 </small> <i><b>Chương 3. Khai phá </b></i>

<i><b>luật kết hợp </b></i>

3.1. Các khái niệm cơ bản

3.2. Kỹ thuật khai thác mẫu phổ biến

<small>giảng </small>

<small>3.2. Đặt câu hỏi gợi mở để sinh viên trả lời 3.3. Trình bày ví dụ minh họa </small>

<small>CLO1 CLO2 CLO3 </small>

<small>- GV sử dụng tài liệu [1] và projector để thuyết giảng </small>

<small>- Phần chuẩn bị ở nhà: </small>Đọc trước Cuốn [1]: Phần 2; Cuốn [2]: Chương 6 <small>- Ghi chú, tham gia các hoạt động trên lớp 4 Bài tập về khai thác mẫu 3 4.1. Giao bài </small>

<small>tập </small>

<small>4.2. Mô tả các yêu cầu thực hiện </small>

<small>4.3. Đánh giá, hướng dẫn thực hiện và sửa bài </small>

<small>CLO1 CLO3 CLO4 </small>

<small>A1.2. </small>

</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">

<small>tập5 </small> <i><b>Chương 3. Khai phá </b></i>

<i><b>luật kết hợp </b></i>

3.3. Kỹ thuật khai thác luật kết hợp

<small>giảng </small>

<small>5.2. Đặt câu hỏi gợi mở để sinh viên trả lời 5.3. Trình bày ví dụ minh họa </small>

<small>CLO1 CLO2 CLO3 CLO4 </small>

<small>- GV sử dụng tài liệu [1] và projector để thuyết giảng </small>

<small>- Phần chuẩn bị ở nhà: </small>Đọc trước Cuốn [1]: Phần 2; Cuốn [2]: Chương 6 <small>- Ghi chú, tham gia các hoạt động trên lớp 6 Bài tập về khai thác luật 3 6.1. Giao bài </small>

<small>tập </small>

<small>6.2. Mô tả các yêu cầu thực hiện </small>

<small>6.3. Đánh giá, hướng dẫn thực hiện và sửa bài tập </small>

<small>CLO1 CLO3 CLO4 </small>

<small>A1.3. </small>

<small>7 </small> <i><b>Chương 4. Phân lớp </b></i>

4.1. Các khái niệm 4.2. Kỹ thuật phân lớp có giám sát

4.3. Kỹ thuật phân lớp bán giám sát

<small>giảng </small>

<small>7.2. Đặt câu hỏi gợi mở để sinh viên trả lời 7.3. Trình bày ví dụ minh họa </small>

<small>CLO1 CLO2 CLO3 CLO4 CLO5 </small>

<small>- GV sử dụng tài liệu [1] và projector để thuyết giảng </small>

<small>- Phần chuẩn bị ở nhà: </small>Đọc trước Cuốn [1]: Phần 3; Cuốn [2]: Chương 7 <small>- Ghi chú, tham gia các hoạt động trên lớp 8 Bài tập về phân lớp 3 8.1. Giao bài </small>

<small>tập </small>

<small>8.2. Mô tả các yêu cầu thực hiện </small>

<small>8.3. Đánh giá, hướng dẫn thực hiện và sửa bài tập </small>

<small>CLO1 CLO3 CLO4 </small>

<small>A1.4. </small>

<small>9 </small> <b><small>Chương 5. Gom nhóm dữ liệu </small></b>

<small>5.1 Khái niệm cơ bản Các phương pháp gom nhóm </small>

<small>giảng </small>

<small>9.2. Đặt câu hỏi gợi mở để sinh viên trả lời 9.3. Trình bày ví dụ minh họa </small>

<small>CLO1 CLO2 CLO3 CLO4 CLO5 </small>

<small>- GV sử dụng tài liệu [1] và projector để thuyết giảng </small>

<small>- Phần chuẩn bị ở nhà: </small>Đọc trước Cuốn [1]: Phần 3; Cuốn [2]: Chương 8 <small>- Ghi chú, tham gia các hoạt động trên lớp 10 </small> <b><small>Chương 5. Gom nhóm </small></b>

<small>- GV sử dụng tài liệu [1] và </small>

<small>- Phần chuẩn bị ở nhà: </small>

</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">

<small>5cấp </small>

<small>5.2.3 Phương pháp dựa trên mật độ</small>

<small>gợi mở để sinh viên trả lời 9.3. Trình bày ví dụ minh họa </small>

<small>CLO4 CLO5 </small>

<small>projector để thuyết giảng 11 </small> <b><small>Chương 5. Gom nhóm </small></b>

<b><small>dữ liệu (tt) </small></b>

<small>5.2.4 Phương pháp dựa trên mơ hình </small>

<small>5.3 Phân tích cá biệt </small>

<small>giảng </small>

<small>9.2. Đặt câu hỏi gợi mở để sinh viên trả lời 9.3. Trình bày ví dụ minh họa </small>

<small>CLO1 CLO2 CLO3 CLO4 CLO5 </small>

<small>- GV sử dụng tài liệu [1] và projector để thuyết giảng </small>

Đọc trước Cuốn [1]: Phần 3; Cuốn [2]: Chương 8

<small>12 </small> <b>Chương 6. Phát hiện dữ liệu bất thường </b>

6.1 Thế nào là dữ liệu bất thường

6.2 Phân loại dữ liệu bất thường 6.3 Thách thức khi

phát hiện dữ liệu bất thường

6.4 Phương pháp phát hiện

6.4.1 Phương pháp giám sát, bán giám sát

<i><b>và không giám sát </b></i>

<small>được các khái niệm và cơ chế hoạt động của giải thuật phân lớp dữ liệu</small>

<small>CLO1 CLO2 CLO3 CLO4 </small>

<i><small>CLO5 </small></i>

<small>- GV sử dụng tài liệu [1] và projector để thuyết giảng </small>

<small>- Phần chuẩn bị ở nhà: Đọc trước nội dung ở chương 9 cuốn [1] - Ghi chú, tham gia các hoạt động trên lớp </small>

<small>13 </small> <b>Chương 6. Phát hiện dữ liệu bất thường (tt) </b>

6.4.2 Phương pháp thống kê, dựa trên xấp xĩ, dựa trên gom

<i><b>nhóm </b></i>

<small>dụng sáng tạo các kỹ thuật đã học vào các vấn đề thực tế.</small>

<small>CLO1 CLO2 CLO3 CLO4 CLO5 </small>

<small>- GV sử dụng tài liệu [1] và projector để thuyết giảng </small>

<small>- Phần chuẩn bị ở nhà: Đọc trước nội dung ở chương 1-3 cuốn [2] - Thuyết trình 14 </small> <b>Chương 6. Phát hiện </b>

<b>dữ liệu bất thường (tt) </b>

6.5 Khai thác các dữ liệu bất thường có ngữ cảnh

Khai thác nhóm dữ

<i><b>liệu bất thường </b></i>

<small>được các khái niệm và cơ chế hoạt động của giải thuật phân lớp dữ liệu</small>

<small>CLO1 CLO2 CLO3 CLO4 CLO5 </small>

<small>- GV sử dụng tài liệu [1] và projector để thuyết giảng </small>

<small>- Phần chuẩn bị ở nhà: Đọc trước nội dung ở chương 9 cuốn [1] - Ghi chú, tham gia các hoạt động trên lớp </small>

<small>kiến thức 15.2. Rút tỉa bài học kinh nghiệm từ các bài tập </small>

<small>- Ôn tập nội dung lý thuyết - Thảo luận và ghi chú </small>

<b>- Các học phần thực hành: được tổ chức thực hiện vào tuần thứ 4 của học kỳ, có nội dung thuyết </b>

<b>giảng và chuẩn đầu ra tương quan với nội dung bài giảng lý thuyết. </b>

<i> </i>

<b>Buổi/ </b>

<b>Số tiết (TH) </b>

<b>Hoạt động của </b>

<b>giảng viên <sup>Lquan đến </sup>CĐR nào ở bảng 3.1 </b>

<b>Hoạt động học của </b>

<b>SV </b>

<b>Tên bài đánh giá </b>

1 Bài 1: Cài đặt và các thao tác 3 TH - Thuyết giảng CLO1 - Nghe A2

</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">

trên Weka - Hướng dẫn sinh viên thực hiện

CLO3 giảng, ghi chú - Trả lời

câu hỏi - Thực

hành trên máy 2 Bài 2: Sử dụng Weka trong

phân tích và thực thi các thuật tốn phân lớp

3 TH - Thuyết giảng - Hướng dẫn

sinh viên thực hiện

CLO1 CLO3

- Nghe giảng, ghi chú - Trả lời

câu hỏi - Thực

hành trên máy

A2

3,4 Bài 3: Cài đặt thuật toán tiền xử lý dữ liệu cơ bản

6 TH - Thuyết giảng - Hướng dẫn

sinh viên thực hiện

CLO1 CLO3

- Trả lời câu hỏi - Thực

hành trên máy

A2

5 Bài 4: Cài đặt thuật toán khai

thác mẫu <sup>3 TH - Thuyết giảng </sup>- Hướng dẫn sinh viên thực hiện

CLO1 CLO3

- Trả lời câu hỏi - Thực

hành trên máy

A2

6 Bài 5: Cài đặt thuật toán khai thác luật kết hợp

3 TH - Thuyết giảng - Hướng dẫn

sinh viên thực hiện

CLO1 CLO3

- Trả lời câu hỏi - Thực

hành trên máy

A2

7 Bài 6: Cài đặt thuật toán phân lớp

3 TH - Thuyết giảng - Hướng dẫn

sinh viên thực hiện

CLO1 CLO3

- Trả lời câu hỏi - Thực

hành trên máy

A2

8 Bài 7: Cài đặt thuật toán phân cụm

3 TH - Thuyết giảng - Hướng dẫn

sinh viên thực hiện

CLO1 CLO3

- Trả lời câu hỏi - Thực

hành trên máy

A2

9 Bài 8: Nhúng source code vào Weka

3 TH - Thuyết giảng - Hướng dẫn

sinh viên thực hiện

CLO 1 CLO 2 CLO 3 CLO 4

- Trả lời câu hỏi - Thực

hành trên máy

A2

10 Bài 9: Thi thực hành 3 TH - Giao bài thi CLO 1 CLO 2 CLO 3 CLO 4

- Thực hiện trên máy

A2

<b>7. Học liệu: </b>

<b>Bảng 7.1. Sách, giáo trình, tài liệu tham khảo </b>

<b>XB </b>

<b>Tên sách, giáo trình, tên bài báo, văn bản </b>

<b>NXB, tên tạp chí/ nơi ban hành VB Giáo trình chính </b>

1 Nguyễn Đức Thuấn 2013 Nhập mơn- Giáo trình phát hiện tri thức NXB Thông tin và

</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">

<b>Sách, giáo trình tham khảo </b>

2 Jiawei Han and Micheline Kamber

2000 Data Mining: Concepts and Techniques

<b>( </b>

Morgan Kaufmann Publishers

3 Ullman Jeffrey D. 2000 Nguyên lý các hệ cơ sở dữ liệu và cơ sở

tri thức: Các hệ cơ sở tri thức <sup>NXB Thống kê </sup>

<b>Bảng 7.2. Danh mục địa chỉ web hữu ích cho HP </b>

3 Data Mining Lecture Notes <i><b>20/07/2019 </b></i>

<i><b>8.Cơ sở vật chất phục vụ giảng dạy: </b></i>

<b>Bảng 8.1. Cơ sở vật chất giảng dạy của HP TT </b>

<b>Tên giảng đường, PTN, xưởng, cơ sở </b>

<b>mềm,… </b>

<b>Số lượng </b>

<i>1 </i> <small>Phòng máy Khoa CNTT Phần mềm Weka 3 </small>

<small>Eclipse IDE for Java Developers/ IntelliJ IDEA </small>

</div>

×