Tải bản đầy đủ (.pdf) (6 trang)

ĐỀ CƯƠNG CHI TIẾT HỌC PHẦN: PHÂN TÍCH DỮ LIỆU

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (470.46 KB, 6 trang )

<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">

<b>ĐẠI HỌC ĐÀ NẴNG CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG ĐH CNTT & TT VIỆT-HÀN Độc Lập - Tự Do - Hạnh Phúc </b>

<b>ĐỀ CƯƠNG CHI TIẾT HỌC PHẦN </b>

Trình độ đào tạo: <b>Đại học Chương trình đào tạo: Kỹ sư Ngành: Công nghệ thông tin Chuyên ngành: Khoa học dữ liệu và Trí tuệ nhân tạo </b>

<b>1. Thơng tin chung về học phần </b>

<b>1.1 Mã học phần: AI20271.2 Tên học phần: Phân tích dữ liệu 1.3 Loại học phần: </b>

◻ Bắt buộc

X Tự chọn bắt buộc ◻ Tự chọn tự do

<b>1.4 Tên tiếng Anh: </b>Data analysis

TS.Nguyễn Sĩ Thìn TS. Nguyễn Thu Hương - Bộ môn phụ trách giảng dạy: Trí tuệ nhân tạo

<b>1.8 Điều kiện tham gia học phần: - Học phần tiên quyết: </b>

Sau khi kết thúc học phần, sinh viên có khả năng:

- CO1: Học phần trang bị cho sinh viên kiến thức tởng quan và các bài tốn cơ bản về phân tích dữ liệu

- CO2: Giúp người học có thể vận dụng các kỹ thuật phân tích bằng ngơn ngữ Python để áp dụng giải quyết các bài toán khoa học dữ liệu cụ thể

</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">

- CO3: Giúp người học có thể vận dụng được các kỹ thuật xử lý dữ liệu dùng trong phân tích dữ liệu của ngơn ngữ lập trình Python.

- CO4: Phát triển các kỹ năng trong môi trường làm việc chuyên nghiệp.

<b>4. Chuẩn đầu ra của học phần (Course Learning Outcome – viết tắt là CLO) </b>

<b>Sau khi kết thúc học phần, sinh viên có khả năng: </b>

<b>Bảng 4.1. Chuẩn đầu ra của học phần (CLO) </b>

CLO1 Hiểu các khái niệm cơ bản: khoa học dữ liệu, phân tích dữ liệu, ngơn ngữ lập trình Python

CLO2 Hiểu và áp dụng được các kỹ thuật phân tích dữ liệu từ các thư viện hỗ trợ của Python

CLO3 Áp dụng các thuật toán vào bài toán phân tích dữ liệu cụ thể CLO4 Phát triển các kỹ năng trong môi trường làm việc chuyên nghiệp.

<b>5. Ma trận thể hiện sự đóng góp của các chuẩn đầu ra học phần (CLO) vào việc đạt được các chuẩn đầu ra của CTĐT (PLO) và các chỉ số PI (Performance Indicator) </b>

<i><b>Bảng 5.1. Mối liên hệ giữa CLO và PLO/PI </b></i>

<b>CLO </b>

<b>PLO và chỉ số PI </b>

PI 1

PI 2

PI 3

PI 1

PI 2

PI 3

PI 1

PI 2

PI 3

PI 1

PI 2

PI 1

PI 2

PI 1

PI 2

PI 3

PI 1

PI 2

PI 1

PI 2

<b>6. Đánh giá học phần </b>

<b>Sinh viên được đánh giá kết quả học tập trên cơ sở điểm thành phần như sau: </b>

<b>Bảng 6.1. Phương pháp, hình thức kiểm tra - đánh giá kết quả học tập của SV </b>

<b>Thành phần đánh giá </b>

<b>Trọng số (%) </b>

<b>CLO </b>

<b>Hình thức kiểm tra đánh giá </b>

<b>Công cụ đánh giá </b>

<b>Trọng số CLO trong thành phần đánh giá </b>

<b>(%) </b>

<b>Lấy dữ liệu đo lường mức độ đạt </b>

<b>PLO/PI </b>

A1. Đánh giá quá trình

30%

CLO1 CLO2

Thực hành trên máy

tính

Bài tập

A2. Đánh giá giữa kỳ

A3. Đánh giá cuối kỳ

CLO2

Dự án theo nhóm

Sản phẩm

</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">

<b>7. Kế hoạch và nội dung giảng dạy học phần </b>

<b>Bảng 7.1. Kế hoạch và nội dung giảng dạy của học phần theo tuần </b>

<b>Tuần </b>

<b>(2 tiết) <sup>Nội dung chi tiết </sup><sup>Hoạt động dạy và học </sup></b>

<b>Bài đánh </b>

<b>giá </b>

<b>CĐR học phần </b>

<b>1 </b>

<b>Chương 1: Overview Statistical Learning </b>

1. What Is Statistical Learning? 1.1. Why Estimate f?

1.2. How Do We Estimate f? 1.3. The Trade-Off Between Prediction Accuracy and Model Interpretability

1.4. Supervised Versus Unsupervised Learning 1.5. Regression Versus Classification Problems 2. Assessing Model Accuracy 2.1. Measuring the Quality of Fit

2.2. The Bias-Variance Off

Trade-2.3. The Classification Setting

<b>Dạy: </b>

- Giảng viên giới thiệu về môn học: chuẩn đầu ra, hình thức đánh giá, nội dung các bài học.

- Giảng bài kết hợp chiếu slide, code. - Đặt câu hỏi, sinh viên suy nghĩ, trả lời.

<b>Học ở lớp: </b>

- Nghe giảng.

- Trả lời câu hỏi của giảng viên

- Đặt câu hỏi về vấn đề liên quan bài học.

<b>Học ở nhà: </b>

- Ôn lại lý thuyết, làm bài tập.

- Đọc tài liệu, tìm hiểu nội dung bài mới.

A1 CLO1 CLO4

<b>2 </b>

<b>Chương 2: Linear Regression </b>

1. Simple Linear Regression 2. Multiple Linear Regression 3. Other Considerations in the Regression Model

- Trả lời câu hỏi của giảng viên

- Đặt câu hỏi về vấn đề liên quan bài học.

<b>Học ở nhà: </b>

- Ôn lại lý thuyết, làm bài tập.

- Đọc tài liệu, tìm hiểu nội dung bài mới.

A1 A2 A3

CLO1 CLO2 CLO4

<b>3 </b>

<b>Chương 2: Linear Regression </b>

4. Comparison of Linear Regression with K-Nearest Neighbors

- Trả lời câu hỏi của giảng viên

- Đặt câu hỏi về vấn đề liên quan bài học.

<b>Học ở nhà: </b>

- Ôn lại lý thuyết, làm bài tập.

- Đọc tài liệu, tìm hiểu nội dung bài mới.

A1 A2 A3

CLO1 CLO2 CLO4

<b>4 </b>

<b>Chương 3: Classification </b>

1. An Overview of Classification

2. Why Not Linear Regression? 3. Logistic Regression

- Trả lời câu hỏi của giảng viên

- Đặt câu hỏi về vấn đề liên quan bài học.

A1 A2 A3

CLO1 CLO2 CLO4

</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">

4. Linear Discriminant Analysis

5. A Comparison of Classification Methods

<b>Học ở nhà: </b>

- Ôn lại lý thuyết, làm bài tập.

- Đọc tài liệu, tìm hiểu nội dung bài mới.

<b>5 </b>

<b>Chương 4: Resampling Methods </b>

1. Cross-Validation 1.1. The Validation set Approach

1.2. Leave-One_out Cross_Validation

1.3. k-Fold Croos-Validation 2. The Bootstrap

- Trả lời câu hỏi của giảng viên

- Đặt câu hỏi về vấn đề liên quan bài học.

<b>Học ở nhà: </b>

- Ôn lại lý thuyết, làm bài tập.

- Đọc tài liệu, tìm hiểu nội dung bài mới.

A1 A2 A3

CLO1 CLO2 CLO4

<b>6 </b>

<b>Chương 5: Linear Model selection and Regularization </b>

1. Subset selection 2. Shrinkage Methods

- Trả lời câu hỏi của giảng viên

- Đặt câu hỏi về vấn đề liên quan bài học.

<b>Học ở nhà: </b>

- Ôn lại lý thuyết, làm bài tập.

- Đọc tài liệu, tìm hiểu nội dung bài mới.

A1 A2 A3

CLO1 CLO2 CLO4

<b>7 </b>

<b>Chương 5: Linear Model selection and Regularization </b>

3. Dimension reduction Methods

4. Consideration in High Dimensions

- Trả lời câu hỏi của giảng viên

- Đặt câu hỏi về vấn đề liên quan bài học.

<b>Học ở nhà: </b>

- Ôn lại lý thuyết, làm bài tập.

- Đọc tài liệu, tìm hiểu nội dung bài mới.

A1 A2 A3

CLO1 CLO2 CLO4

<b>8 Kiểm tra giữa kỳ </b>

<b>9 </b>

<b>Chương 6: Moving Beyond Linearity </b>

1. Polynomial Regression 2. Step Function

- Trả lời câu hỏi của giảng viên

- Đặt câu hỏi về vấn đề liên quan bài học.

<b>Học ở nhà: </b>

- Ôn lại lý thuyết, làm bài tập.

- Đọc tài liệu, tìm hiểu nội dung bài mới.

A1 A2 A3

CLO1 CLO3 CLO4

<b>10 </b>

<b>Chương 6: Moving Beyond Linearity </b>

4. Regression splines 5. Smoothing splines 6. Local Regression

- Trả lời câu hỏi của giảng viên

- Đặt câu hỏi về vấn đề liên quan bài học.

<b>Học ở nhà: </b>

- Ôn lại lý thuyết, làm bài tập.

- Đọc tài liệu, tìm hiểu nội dung bài mới.

A1 A2 A3

CLO1 CLO3 CLO4

<b>11 </b>

<b>Chương 7: Tree-Based Methods </b>

1. The Basics of Decision Tree 1.1. Regression Tree

CLO1 CLO3 CLO4

</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">

1.2. Classification Tree 1.3. Trees Versus Linear Models

2. Bagging Random Forest, Boosting

2.1. Bagging

<b>2.2. Random Forests </b>

- Đặt câu hỏi về vấn đề liên quan bài học.

<b>Học ở nhà: </b>

- Ôn lại lý thuyết, làm bài tập.

- Đọc tài liệu, tìm hiểu nội dung bài mới.

<b>12 </b>

<b>Chương 8: Support vector machines </b>

1. Maximal margin classification

2. Support vector classification

- Trả lời câu hỏi của giảng viên

- Đặt câu hỏi về vấn đề liên quan bài học.

<b>Học ở nhà: </b>

- Ôn lại lý thuyết, làm bài tập.

- Đọc tài liệu, tìm hiểu nội dung bài mới.

A1 A2 A3

CLO1 CLO3 CLO4

- Trả lời câu hỏi của giảng viên

- Đặt câu hỏi về vấn đề liên quan bài học.

<b>Học ở nhà: </b>

- Ôn lại lý thuyết, làm bài tập.

- Đọc tài liệu, tìm hiểu nội dung bài mới.

A1 A2 A3

CLO1 CLO3 CLO4

<b>14 </b>

<b>Chương 9: Unsupervised learning </b>

1. The challenge of unsupervised learning 2. Principal components analysis

- Trả lời câu hỏi của giảng viên

- Đặt câu hỏi về vấn đề liên quan bài học.

<b>Học ở nhà: </b>

- Ôn lại lý thuyết, làm bài tập.

- Đọc tài liệu, tìm hiểu nội dung bài mới.

A1 A2 A3

CLO1 CLO3 CLO4

- Trả lời câu hỏi của giảng viên

- Đặt câu hỏi về vấn đề liên quan bài học.

<b>Học ở nhà: </b>

- Ôn lại lý thuyết, làm bài tập.

- Đọc tài liệu, tìm hiểu nội dung bài mới.

A1 A2 A3

CLO1 CLO3 CLO4

<b>8. Học liệu </b>

<b>Bảng 8.1. Sách, giáo trình, tài liệu tham khảo </b>

<b>XB </b>

<b>Tên sách, giáo trình, tên bài báo, văn bản </b>

<b>NXB, tên tạp chí/ nơi ban hành VB Giáo trình chính </b>

</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">

1

Kelleher, John D., and Brendan Tierney

2 Grus, Joel. 2019 Data science from scratch: first principles with python

<b>9. Cơ sở vật chất phục vụ giảng dạy </b>

<b>Bảng 9.1. Cơ sở vật chất giảng dạy của HP T</b>

<b>Bài học </b>

Thiết bị, phần mềm Số lượng

<b> Đà Nẵng, ngày 02 tháng 8 năm 2022 Trưởng Khoa </b>

TS.Nguyễn Đức Hiển

<b>Người biên soạn </b>

TS. Nguyễn Thanh

</div>

×