Tải bản đầy đủ (.doc) (19 trang)

SÁNG KIẾN KINH NGHIỆM XÂY DỰNG HỆ THỐNG DỰ ĐOÁN KẾT QUẢ HỌC TẬP CỦA HỌC SINH

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (487.12 KB, 19 trang )


Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam
SỞ GIÁO DỤC VÀ ĐÀO TẠO ĐỒNG NAI
Đơn vị: Trung Tâm GDTX Nhơn Trạch
Mã số: ……………………………
(Do HĐKH sở GD&ĐT ghi)
SÁNG KIẾN KINH NGHIỆM
XÂY DỰNG HỆ THỐNG DỰ ĐOÁN KẾT QUẢ
HỌC TẬP CỦA HỌC SINH
Người thực hiện: Nguyễn Bảo Nam
Lĩnh vực nghiên cứu :
Quản lý giáo dục: 
Phương pháp dạy học bộ môn: 
Phương pháp giáo dục: 
Lĩnh vực khác: Tin học 
Có đính kèm:
 Mô hình  Phần mềm  Phim ảnh  Hiện vật khác

Năm học: 2012 – 2013
Trang 1
Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam
SƠ LƯỢC LÝ LỊCH KHOA HỌC
I. THÔNG TIN CHUNG VỀ CÁ NHÂN
1. Họ và tên: Nguyễn Bảo Nam
2. Ngày tháng năm sinh: 21/03/1975
3. Nam, nữ: Nữ
4. Điạ chỉ: Xã Hiệp Phước, Huyện Nhơn Trạch, Tỉnh Đồng Nai
5. Điện thoại: (CQ): (NR) ĐTDĐ: 0909269820
6. Fax: E-mail:
7. Chức vụ: Giáo viên
8. Đơn vị công tác: Trung Tâm GDTX Nhơn Trạch


II. TRÌNH ĐỘ ĐÀO TẠO
- Học vị: Thạc sĩ
- Năm nhận bằng: 2013
- Chuyên ngành đào tạo: Tin học
III. KINH NGHIỆM KHOA HỌC
- Lĩnh vực chuyên môn có kinh nghiệm: Tin học
- Số năm có kinh nghiệm: 15
- Các sáng kiến kinh nghiệm đã có trong 5 năm gần đây:
Trang 2
Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam
ĐỀ TÀI:
XÂY DỰNG HỆ THỐNG DỰ ĐOÁN KẾT QUẢ HỌC TẬP
CỦA HỌC SINH
I. LÝ DO CHỌN ĐỀ TÀI
Hiện nay các trường Trung học phổ thông và Trung tâm GDTX việc tính
toán và lưu trữ điểm của học sinh được tiến hành đều đặn vào cuối học kỳ. Công
việc này chủ yếu dùng để đánh giá học lực của từng học sinh theo qui định của Bộ
Giáo Dục & Đào Tạo, đánh giá tương đối chính xác học lực của từng học sinh, kết
quả chất lượng đào tạo của trường thể hiện qua tỉ lệ phần trăm được thống kê từ
bảng điểm tổng kết. Đánh giá chất lượng giáo dục là công việc mà ngành giáo dục
rất quan tâm việc đánh giá trên còn thiên về cảm tính và mang tính bình quân,
tương đối. Các phương pháp đánh giá truyền thống hiện nay có nhiều ý kiến cho
rằng chưa được chặt chẽ và chưa đánh giá đúng thật chất kết quả học tập, rèn luyện
của học sinh. Nếu đưa được phương pháp cho phép cung cấp các thông tin giúp
cho việc đánh giá dự đoán kết quả giáo dục chặt chẽ đạt độ tin cậy cao bằng những
tính toán khoa học sẽ giúp đỡ cho các nhà quản lý rất nhiều trong việc hoạch định
những chiến lược giáo dục trong tương lai.
Để khai thác các thông tin hữu ích từ nguồn dữ liệu to lớn chúng ta cần công
cụ và kỹ thuật thích hợp. Những kỹ thuật truyền thống trước đây không thể khai
thác triệt để những thông tin hữu ích mà cơ sở dữ liệu mang lại. Trong những năm

gần đây nhiều nhà nghiên cứu đã đề xuất những phương pháp, kỹ thuật mới nhằm
phân tích xử lý một cách hiệu quả trên các cơ sở dữ liệu để tìm các thông tin tìm
ẩn, tuy rất ít so với khối lượng dữ liệu rất lớn nhưng rất quan trọng.
Có thể xem cơ sở dữ liệu điểm học sinh như là một cơ sở dữ liệu chuỗi thời
gian. Kết quả học tập của học sinh được đánh giá theo từng học kỳ từ lớp 6 đến lớp
12 theo thứ tự thời gian, kết quả học tập của học sinh toàn trường là một cơ sở dữ
liệu chuỗi thời gian. Sau đó sử dụng kỹ thuật khai phá dữ liệu để khám phá tri thức
từ cơ sở dữ liệu điểm học sinh.
Đây chính là mục tiêu của đề tài : “Xây dựng hệ thống dự đoán kết quả học
tập của học sinh”.
II. TỔ CHỨC THỰC HIỆN ĐỀ TAI
1. Cơ sở lý luận
- Huyện Nhơn Trạch, tỉnh Đồng Nai là huyện có 10 trường trung học cơ sở, 3
trường trung học phổ thông và 1 Trung tâm GDTX, huyện có tỷ lệ đậu tốt nghiệp
trung học phổ thông rất thấp so với các huyện trong tỉnh Đồng Nai. Đa số các em
có học lực từ yếu đến trung bình ở những năm học cấp hai. Làm thế nào đó để sau
khi học xong chương trình phổ thông các em có thể đậu tốt nghiệp trung học phổ
thông đó là đều rất mong muốn của phụ huynh cũng như những nhà quản lí giáo
dục ở địa phương.
- Với mong muốn được giúp đỡ cho các em và phụ huynh thấy được con
đường học vấn trong tương lai, đó là khả năng đậu tốt nghiệp của mình như thế nào
để ngay từ ban đầu học sinh có ý thức hơn trong việc học. Cùng với sự cố gắng của
Trang 3
Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam
học sinh, không thể thiếu sự quan tâm, tạo điều kiện thuận lợi từ phía phụ huynh.
Hơn nữa, về phía lãnh đạo nhà trường cũng đề ra các biện pháp nhằm giúp đỡ các
em có một kết quả học tập tốt hơn trong tương lai.
- Một trong các cách đó là chúng ta cần cho học sinh thấy trước kết quả học
tập trong tương lai dựa vào một hệ thống có khả năng dự đoán khả năng đậu tốt
nghiệp trung học phổ thông của các em. Ứng dụng trên cơ sở dữ liệu điểm học sinh

cho phép ta dự đoán kết quả đạt được trong học kỳ tiếp theo hay năm học tiếp theo
từ kết quả học tập của học kỳ trước đó. Với kết quả hiện tại thì kết quả đạt được
tiếp theo như thế nào? Chương trình giúp đưa ra các thông tin cho phép dự đoán
kết quả căn cứ vào kết quả của từng học kỳ để dự đoán học kỳ tiếp theo hay năm
học tiếp theo, cũng có thể dựa vào dự đoán đó mà các nhà quản lý giáo dục có thể
có các quyết định như: đào tạo học sinh giỏi, tổ chức lớp học và phân loại học sinh
cá biệt, . . . Qua mỗi năm học phổ thông học sinh sẽ biết được khả năng lên lớp ở
năm học tiếp theo hoặc đậu tốt nghiệp của mình ở mức nào trong kỳ thi tốt nghiệp
trung học phổ thông. Từ dữ liệu đã lưu trữ ở những năm trước, ứng dụng luật kết
hợp để khai phá dữ liệu, tìm ra các luật có ích cho hệ thống dự đoán.
2. Nội dung, biện pháp thực hiện các giải pháp của đề tài
a. Nội dung thực hiện
Bài toán dự đoán kết quả học tập của học sinh được trình bày theo các bước
sau:
- Đầu vào là các bảng điểm tổng kết của học sinh theo từng học kỳ và điểm
tổng kết từng học kỳ của các môn học: Toán, Lý, Anh văn, . . . trong suốt 7 năm
học phổ thông.( Từ lớp 6 đến lớp 12, có 14 học kỳ)
- Xử lý các dữ liệu điểm được lưu trữ trong 7 năm học phổ thông để được cơ
sở dữ liệu phù hợp cho mục tiêu dự đoán. Kết quả của mỗi môn học được chứa
trong một bảng được sắp xếp theo thứ tự thời gian. Các bảng của các môn học đều
giống nhau. Như vậy từ cơ sở dữ liệu điểm tổng kết thông thường ta chuyển về
dạng cơ sở dữ liệu theo thời gian. Trong cơ sở dữ liệu này kết quả của mỗi học
sinh được sắp xếp theo thứ tự chuỗi thời gian là các học kỳ trong bảy năm học phổ
thông. Cấu trúc cơ sở dữ liệu được trình bày như sau:
MaSV Toan1 Ly1 AV1 HK1 … … Toan14 Ly14 AV14 HK14
1 3.5 4.0 4.2 4.6 … … 5.3 5.4 5.3 5.3
2 5.0 5.1 6.0 5.8 6.4 6.5 6.5 6.5
3 5.0 5.2 5.3 5.4 5.6 6.0 6.4 5.6
4 4.0 4.1 4.4 4.5 5.7 6.0 6.1 5.7
5 4.0 4.1 4.4 4.3 4.3 4.6 4.6 4.6

6 4.0 3.5 4.5 4.9 6.5 6.6 6.5 6.5
7 5.0 5.2 6.0 5.6 6.0 6.1 5.9 6.0
8 3.6 4.0 4.2 4.5 6.0 5.7 6.0 5.7
9 3.5 3.7 4.0 4.5 4.8 4.8 4.4 4.8
… … … … … … … … … … …
- Sử dụng các kỹ thuật khai phá trên cơ sở dữ liệu chuỗi thời gian để khám
phá tri thức trên cơ sở dữ liệu mới nhận được dạng này.
Trang 4
Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam
- Kết quả nhận được là các luật biểu diễn mối quan hệ giữa các kết quả theo
thời gian. Với kết quả hiện có thì kết quả đạt được tiếp theo là gì?
Kết quả nhận được như sau:
If HK1, Toán = Kém  HK2, Toán = Kém, . . .  HK14, Toán = Kém
If HK1, Lý = TB  HK2, Lý = TB, . . .  HK14, Lý = TB
If HK1, AnhVan = K  HK2, AnhVan = K, . . .  HK14, Anh văn = Khá
. . .
If HK1, DiemTB = G  HK2, DiemTB = G, . . .  HK14, DiemTB = G
Mục tiêu là đưa ra thông tin của các luật sẽ hữu dụng cho quá trình quản lý
giáo dục, nhất là dự đoán và hoạch định phương pháp nâng cao chất lượng trong
trường phổ thông.
b. Biện pháp thực hiện
Dữ liệu sử dụng trong chương trình được thu thập trên 10 trường THCS, 3
trường trung học phổ thông và 1 Trung tâm GDTX trong huyện Nhơn Trạch. Do
các kết quả tổng kết điểm của học sinh trong các trường phổ thông được thực hiện
và lưu trữ bằng nhiều phần mềm khác nhau như Microsoft Access, Excel, Foxpro,
…nên ta cần chuyển dữ liệu về một dạng thống nhất là SQL Server. Trong các
bảng điểm tổng kết này thứ tự các môn học được thực hiện theo qui định của Bộ
giáo dục. Các bảng điểm thì có nhiều cột điểm như: điểm miệng, 15 phút, 1 tiết và
điểm thi, ta cần lọc các thông tin này. Trên cơ sở dữ liệu, mỗi dòng biểu diễn kết
quả của một học sinh. Kết quả của mỗi học kỳ được lưu trữ trong một bảng, có tất

cả 14 học kỳ được lưu trữ trong 14 bảng là kết quả điểm của học sinh trong quá
trình học tập từ lớp 6 đến lớp 12. Dữ liệu dự đoán sẽ được đưa vào chung một bảng
để tiện xử lý. Vì các trường có thể lưu trữ điểm bằng các phần mềm khác nhau nên
ta cần đưa các điểm về dạng thống nhất.
Ta chia công việc này thành hai bước:
- Ta cần chuyển các dữ liệu thu thập được về một dạng thống nhất trên SQL
Server và xóa đi các thông tin không phù hợp như các giá trị trống, các cột không
cần thiết, . . .
- Tiếp theo đặt tên các học kỳ theo các năm học phổ thông lần lượt Toan1,
Ly1, AV1, HK1, Toan2, Ly2, AV2, HK2, . . . ,Toan14, Ly14, AV14, KH14 dữ liệu
khi đưa vào chương trình phải được sắp xếp lại theo cấu trúc sau:
MaSV Toan1 Ly1 AV1 HK1 … … Toan14 Ly14 AV14 HK14
1 3.5 4.0 4.2 4.6 … … 5.3 5.4 5.3 5.3
2 5.0 5.1 6.0 5.8 6.4 6.5 6.5 6.5
3 5.0 5.2 5.3 5.4 5.6 6.0 6.4 5.6
4 4.0 4.1 4.4 4.5 5.7 6.0 6.1 5.7
5 4.0 4.1 4.4 4.3 4.3 4.6 4.6 4.6
6 4.0 3.5 4.5 4.9 6.5 6.6 6.5 6.5
7 5.0 5.2 6.0 5.6 6.0 6.1 5.9 6.0
8 3.6 4.0 4.2 4.5 6.0 5.7 6.0 5.7
9 3.5 3.7 4.0 4.5 4.8 4.8 4.4 4.8
… … … … … … … … … … …
Trang 5
Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam
Ví dụ: Toan1, Ly1, AV1, HK1_Lop6, Toan2, Ly2, AV2, HK2_Lop6, . . .,
Toan13, Ly13, AV13, HK13_Lop12, Toan14, Ly14, AV14, HK14_Lop12.
Có tất cả 13 môn học theo thứ tự Toán, Lý, Hóa, Sinh, Tin, Văn, Sử, Địa,
Ngoại ngữ, GDCD, Công nghệ, Thể dục và GDQP được đưa vào một bảng tổng
hợp các dữ liệu để thuận tiện cho việc dự đoán. Quá trình dự đoán sẽ tiến hành trên
các môn học để dự đoán các thông tin về mối quan hệ giữa các kết quả theo thời

gian thể hiện sự biến động về năng lực học sinh. Việc dự đoán tiến hành trên toàn
bộ cơ sở dữ liệu cho thông tin về dự báo kết quả học tập của học sinh.
Trong đề tài này chỉ tập trung dự đoán điểm tổng kết theo từng học kỳ của
ba môn học Toán, Lý, Anh văn và điểm tổng kết từng học kỳ của 13 môn học.
Kết quả học tập của học sinh được được đánh giá làm 5 loại: Giỏi, Khá, TB,
Yếu, Kém.
Tiêu chuẩn xếp loại như sau:
DiemTB>=8.0: Xếp loại Giỏi
DiemTB>=6.5 và DiemTB<8.0: Xếp loại Khá
DiemTB>=5.0 và DiemTB<6.5: Xếp loại TB
DiemTB>=3.5 và DiemTB<5.0: Xếp loại Yếu
DiemTB<3.5: Xếp loại Kém
Ta chỉ cần duyệt qua cơ sở dữ liệu một lần, mỗi lần gặp một giá trị điểm ta
thay nó bằng loại tương ứng. Sau bước này ta xây dựng được cơ sở dữ liệu có
dạng:
MaSV Toan1 Ly1 AV1 HK1 … … Toan14 Ly14 AV14 HK14
1 Y TB K Kem … … K TB G G
2 TB K Kem TB G K Y K
3 Y TB Kem K G TB K TB
… … … … … … … … … … …
Khi cài đặt chương trình dùng các số nguyên để ghi nhận các giá trị phân
loại như sau: Số 1 đại diện loại Kém, số 2 đại diện loại Yếu, số 3 đại diện loại TB,
số 4 đại diện loại Khá, số 5 đại diện loại Giỏi.
MaSV Toan1 Ly1 AV1 HK1 … … Toan14 Ly14 AV14 HK14
1 2 3 4 1 … … 4 3 5 5
2 3 4 1 3 5 4 2 4
3 2 3 1 4 5 2 4 3
… … … … … … … … … … …
Toàn bộ kết quả phân loại đặt trong một mảng 2 chiều và được sử dụng cho
nhiều thuật toán khác nhau.

3. Chương trình mô phỏng dự đoán học sinh
a. Môi trường làm việc
- Máy tính cần cài đặt các chương trình sau:
+ SQL Server 2008
+ Visual Studio 2010 (C#).
Trang 6
Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam
+ Dữ liệu điểm học sinh được lưu trữ trên Microsoft Excel tên là
DLHS1.xls cần Import vào SQL Server 2008 và đặt tên là QLHS.(Hướng dẫn
phần phụ lục)
- Số học sinh đưa vào để dự đoán khoảng 3000 học sinh.
- Chương trình dự đoán kết quả học tập của học sinh được viết bằng ngôn
ngữ Visual Studio 2010 (C#).
b. Khởi động chương trình
- Vào thư mục Thu nghiem, chọn thu nghiem.sln
- Chọn biểu tượng Start Debugging trên thanh công cụ hoặc nhấn
phím F5.
c. Các chức năng chính của chương trình
- Màn hình chính của chương trình:
+ Chức năng Hiển thị: Dùng để kết nối dữ liệu
+ Chức năng Cluster Data: Dùng để gom cụm dữ liệu
+ Chức năng Apriori: Tìm tất cả các luật
+ Chức năng Quit: Thoát chương trình khai phá
Hình 1 Giao diện màn hình chính
Trang 7
Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam
- Màn hình hiển thị (kết nối) :
Trang 8
Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam
Hình 2. Hiện dữ liệu khai phá

- Để thực hiện quá trình dự đoán, ta chọn chức năng Hiển thị dữ liệu rồi mới
thực hiện các công việc khác chương trình sẽ liệt kê như sau:
+ Dữ liệu gốc là các điểm tổng kết từng học kỳ của 3 môn học Toán, Lý,
Anh văn và điểm tổng kết theo từng học kỳ (từ lớp 6 đến lớp 12).
+ Dữ liệu đã qua biến đổi được phân loại như sau: Kém (số 1), Yếu( số 2),
TB(số 3), Khá(số 4), Giỏi(số 5).
Trang 9
Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam
- Màn hình gom cụm (Cluster):
Hình 3. Giao diện gom cụm dữ liệu
- Chọn “Cluster Data” để gom cụm dữ liệu, nhập số lượng cần gom cụm (tùy
ý), sau đó chọn chức năng “Gom cụm”.
- Kết quả xuất là trọng tâm của nhóm là 14 học kỳ, gồm điểm TB, Toán, Lý,
Anh văn sau khi gom cụm và tỉ lệ phần trăm của chúng trong cơ sở dữ liệu.
Trang 10
Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam
- Màn hình dự đoán kết quả:
- Chọn chức năng “Dự đoán TB”: Xuất kết quả dự đoán điểm trung bình
của học sinh qua 14 học kỳ.
Hình 4. Giao diện dự đoán điểm trung bình
Trang 11
Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam
- Chọn chức năng “Dự đoán Toán”: Xuất kết quả dự đoán điểm Toán của
học sinh qua 14 học kỳ.
Hình 5. Giao diện dự đoán điểm toán
Trang 12
Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam
- Chọn chức năng “Dự đoán Lý”: Xuất kết quả dự đoán điểm Lý của học sinh qua
14 học kỳ.
Hình 6. Giao diện dự đoán điểm lý

Trang 13
Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam
- Chọn chức năng “Dự đoán AV”: Xuất kết quả dự đoán điểm Anh văn của
học sinh qua 14 học kỳ.
Hình 7. Giao diện dự đoán điểm Anh văn
- Màn hình khai phá luật bằng thuật toán Apriori
- Các tham số nhập vào chương trình: HK Vào, HK tiếp theo, Minsupp(Độ
hỗ trợ tối thiểu) và Minconf(Độ tin cậy tối thiểu).
- Ví dụ: HK vào là HK=1, Dự đoán HK tiếp theo=1, Minsupp= 10 và
Minconf = 50( Ta có thể chọn tùy ý).
- Chọn chức năng “Rules”: Tìm tất cả các luật thỏa mãn điều kiện ở trên.
Trang 14
Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam
Hình 8. Giao diện tìm luật thuật toán Apriori
III. HIỆU QUẢ CỦA ĐỀ TÀI
a. Kết quả đạt được
- Chương trình dự đoán kết quả học tập của học sinh trong suốt 7 năm học
phổ thông( Từ lớp 6 – lớp 12), cho phép ta dự đoán tương đối chính xác kết
quả học tập của học sinh. Từ đó cho ta thấy được mối quan hệ giữa kết quả của
các học kỳ, từ học kỳ này ta có thể dự đoán học kỳ tiếp theo. Dựa vào kết quả
này từ đó giúp cho các nhà quản lý giáo dục có hướng điều chỉnh nhằm nâng
cao chất lượng học sinh cũng như tỉ lệ đậu tốt nghiệp cao hơn phục vụ cho mục
đích quản lý, điều hành trong trường.
- Chương trình được thiết kế dùng để minh họa cho thuật toán nên dễ sử
dụng và đảm bảo độ tin cậy cao. Chương trình không tìm tất cả các itemset nên tốc
độ xử lý rất nhanh.
- Người dùng có thể thay đổi kích thước các mẫu theo từng năm học, mục
tiêu khi dự đoán để nhận được các thông tin phù hợp.
- Trong quá trình gom cụm có thể chủ động chọn số nhóm gom cụm, điều
này cho phép người dùng nhận các thông tin đa dạng hơn.

- Qua các kết quả gom cụm ta có thể nhận ra các mẫu phổ biến nào chiếm tỷ
lệ cao trong cơ sở dữ liệu, nhờ đó mà giáo viên có thể đánh giá chính xác về tình
hình chất lượng của học sinh để có hướng giảng dạy tốt hơn trong giai đoạn sắp
tới.
Trang 15
Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam
b. Đánh giá kết quả thử nghiệm
Kết quả thử nghiệm dự đoán kết quả học tập của học sinh đã được trình bày
ở trên. Dữ liệu đưa vào khai phá khoảng 3.000 học sinh, ta thu được kết quả như
sau:
Dùng thuật toán K-Mean để gom cụm dữ liệu học sinh:
Dữ liệu đầu vào:
- Dữ liệu đưa vào khai phá 3.000 học sinh.
- Số cụm n = 4, thực hiện gom cụm trong 4 lần.
Kết quả:
- Gom cụm theo điểm TB: Nhóm học sinh có kết quả khá, giỏi chiếm tỉ lệ
trong khoảng từ 18% - 19% trong toàn bộ dữ liệu. Nhóm học sinh có kết quả TB,
khá chiếm tỉ lệ trong khoảng 20% trong toàn bộ dữ liệu. Nhóm học sinh có kết quả
kém, yếu, TB chiếm tỉ lệ trong khoảng 9% trong toàn bộ dữ liệu. Nhóm học sinh
có kết quả yếu, TB, khá chiếm tỉ lệ trong khoảng từ 21% - 55% trong toàn bộ dữ
liệu.
- Gom cụm theo điểm Toán: Nhóm học sinh có kết quả khá, giỏi chiếm tỉ
lệ trong khoảng từ 16% - 30% trong toàn bộ dữ liệu. Nhóm học sinh có kết quả
TB, khá chiếm tỉ lệ trong khoảng 35% - 44% trong toàn bộ dữ liệu. Nhóm học sinh
có kết quả kém, yếu, TB chiếm tỉ lệ trong khoảng 10% - 18% trong toàn bộ dữ
liệu. Nhóm học sinh có kết quả yếu, TB, khá chiếm tỉ lệ trong khoảng từ 29% -
55% trong toàn bộ dữ liệu.
- Gom cụm theo điểm Lý: Nhóm học sinh có kết quả khá, giỏi chiếm tỉ lệ
trong khoảng từ 12% - 17% trong toàn bộ dữ liệu. Nhóm học sinh có kết quả TB,
khá chiếm tỉ lệ trong khoảng 41% - 49% trong toàn bộ dữ liệu. Nhóm học sinh có

kết quả kém, yếu, TB chiếm tỉ lệ trong khoảng 9% - 11% trong toàn bộ dữ liệu.
Nhóm học sinh có kết quả yếu, TB, khá chiếm tỉ lệ trong khoảng từ 28% - 32%
trong toàn bộ dữ liệu.
- Gom cụm theo điểm Anh văn: Nhóm học sinh có kết quả khá, giỏi chiếm
tỉ lệ trong khoảng từ 16% - 19% trong toàn bộ dữ liệu. Nhóm học sinh có kết quả
TB, khá chiếm tỉ lệ trong khoảng 42% - 45% trong toàn bộ dữ liệu. Nhóm học sinh
có kết quả kém, yếu, TB chiếm tỉ lệ trong khoảng 10% - 11% trong toàn bộ dữ
liệu. Nhóm học sinh có kết quả yếu, TB, khá chiếm tỉ lệ trong khoảng từ 25% -
28% trong toàn bộ dữ liệu.
Nhận xét chung qua các lần gom cụm khác nhau kết quả học tập của học
sinh thường ít có sự biến đổi đột ngột mà nó thể hiện sự ổn định nói lên năng lực
của bản thân các học sinh trong cả quá trình học tập từ lớp 6 đến lớp 12.
Dùng thuật toán Apriori để tìm các luật:
Dữ liệu đầu vào:
Dữ liệu đưa vào khai phá 3.000 học sinh.
Chọn Minsupp(Độ hỗ trợ tối thiểu) =10, Minconf(Độ tin cậy tối thiếu) = 50%.
Kết quả:
Nếu Học kỳ 1 Giỏi Thì khả năng đạt Giỏi ở học kỳ tiếp theo là (Conf 95,3%).
Nếu Học kỳ 1 Yếu Thì khả năng đạt TB hoặc Khá ở học kỳ tiếp theo là (Conf
35,3%).
Nếu Học kỳ 1 TB Thì khả năng đạt Khá ở học kỳ tiếp theo là (Conf 53,2%)
Trang 16
Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam
Nếu Học kỳ 1 Khá Thì khả năng đạt TB ở học kỳ tiếp theo là (Conf 27.5%)
Nếu Học kỳ 1 TB Thì khả năng đạt Yếu ở học kỳ tiếp theo là (Conf 28.14%)
Nếu Học kỳ 1 Khá Thì khả năng đạt Yếu ở học kỳ tiếp theo là (Conf 8.6%)
Nếu Học kỳ 1 Yếu Thì khả năng đạt TB ở học kỳ tiếp theo là (Conf 49.14%)
Nhận xét chung do quá trình học phổ thông kết quả thường trãi đều từ thấp
đến cao và được chia thành 5 loại ( Kém, Yếu, Khá, TB, Giỏi) , do đó một loại
chiếm tỉ lệ lớn 10% - 20% là tương đối, từ đó việc chọn minsupp 10% - 20% coi

như là phù hợp. Để đạt được độ tin cậy của một số luật cao có thể cung cấp thông
tin hữu ích cho việc dự đoán.
IV. ĐỀ XUẤT, KIẾN NGHỊ KHẢ NĂNG ÁP DỤNG
- Do thời gian thực hiện đề tài có hạn nên mới chỉ tập trung dự đoán một số
môn như: Toán, Lý, Anh văn và điểm TB từng học kỳ( 14 học kỳ) còn các môn
còn lại chưa đưa vào chương trình để dự đoán. Hướng tới có thể dự đoán tất cả các
môn học còn lại.
- Chương trình còn mang tính minh họa cho thuật toán, giao diện chưa được
đẹp mắt, để sử dụng hiệu quả cần cài đặt thêm vài chức năng và các hướng dự
đoán khác để hoàn chỉnh và ứng dụng hiệu quả cho nhiều lĩnh vực khác nhau. Giúp
đỡ rất nhiều cho giáo viên và các nhà quản lý giáo dục trong việc cải thiện chất
lượng đào tạo.
- Bản thân tôi cũng mới bước đầu xây dựng phần mềm này trong quá trình
viết chương trình còn nhiều thiếu sót, nhưng được sự giúp đỡ của các đồng nghiệp
và đặc biệt là được sự hướng dẫn tận tình của PGS. TS Đỗ Phúc Trưởng ban đối
ngoại Đại học Quốc Gia TP. Hồ Chí Minh đến nay phần mềm đã hoàn thành. Cuối
cùng xin chân thành cảm ơn các đồng nghiệp và PGS.TS Đỗ Phúc đã giúp đỡ và
tạo điều kiện thuận lợi cho tôi trong suốt quá trình thực hiện đề tài “Xây dựng hệ
thống dự đoán kết quả học tập của học sinh”. Một lần nữa xin chân thành cám ơn.
V. TÀI LIỆU THAM KHẢO
1. Thông tư số: 58/2011/TT-BGDĐT ngày 12 tháng 12 năm 2011của Bộ trưởng Bộ
Giáo dục và Đào tạo.
2. Quyết định số 02/2007/QĐ-BGDĐT ngày 23/01/2007 của Bộ trưởng Bộ
GD&ĐT V/v ban hành Qui chế đánh giá xếp loại học viên theo học chương trình
GDTX cấp THCS và cấp THPT
3. Nhà kho và khai mỏ dữ liệu, Đỗ Phúc (2003), NXB Đại học quốc gia TP Hồ Chí
Minh.
4. Phát triển một số ứng dụng khai thác dữ liệu vào giáo dục đào tạo, Nguyễn Quốc
Thông (2002), Luận văn thạc sĩ, Trường Đại Học Khoa Học Tự Nhiên TP. Hồ Chí
Minh.

Nhơn Trạch, ngày 8 tháng 05 năm 2013
Người viết
Nguyễn Bảo Nam
Trang 17
Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam
PHỤ LỤC
1. Máy tính cần cài đặt
- SQL Server 2008
- Visual Studio 2010 (C#).
2. Dữ liệu
Dữ liệu điểm học sinh được lưu trữ trên Microsoft Excel tên là DLHS1.xls
được lưu trữ trong thư mục Thu nghiem trong đĩa CD
3. Các bước thực hiện chạy chương trình
- Import dữ liệu từ file Excel DLHS1.xls vào SQL Server 2008
+ Khởi động SQL Server 2008
+ Chọn Connect
+ Chọn Database
+ Chọn New Database
+ Đặt tên Database name: QLHS
+ Chọn Add – Chọn Ok
+ Click phải chuột vào Database QLHS
+ Chọn Task
+ Chọn Import Data – Chọn Next
+ Mục Data Source – Chọn Microsoft Excel
+ Chọn Browse trong mục Excel file path
+ Chọn file Excel QLHS1.xls
+ Chọn Next – Next – Next – Chọn Sheet 1
+ Chọn Finish – Chọn Close
- Khởi động Visual Studio 2010
+ Vào thư mục Thu nghiem, chọn file Thu nghiem.sln

+ Chọn biểu tượng Start Debugging trên thanh công cụ hoặc nhấn phím F5.
Trang 18
Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam
SỞ GD&ĐT ĐỒNG NAI

CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập - Tự do - Hạnh phúc
………, Trạch, ngày tháng … năm 2013
PHIẾU NHẬN XÉT, ĐÁNH GIÁ SÁNG KIẾN KINH NGHIỆM
Năm học: 2012 - 2013
–––––––––––––––––
Tên sáng kiến kinh nghiệm: Xây dựng hệ thống dự đoán kết quả học tập của học sinh
Họ và tên tác giả: Nguyễn Bảo Nam Đơn vị (Tổ): GDTX Nhơn Trạch (Hướng Nghiệp
Nghề)
Lĩnh vực:
Quản lý giáo dục  Phương pháp dạy học bộ môn: ………… 
Phương pháp giáo dục  Lĩnh vực khác: Tin học 
1. Tính mới
- Có giải pháp hoàn toàn mới 
- Có giải pháp cải tiến, đổi mới từ giải pháp đã có 
2. Hiệu quả
- Hoàn toàn mới và đã triển khai áp dụng trong toàn ngành có hiệu quả cao 
- Có tính cải tiến hoặc đổi mới từ những giải pháp đã có và đã triển khai áp dụng trong
toàn ngành có hiệu quả cao 
- Hoàn toàn mới và đã triển khai áp dụng tại đơn vị có hiệu quả cao 
- Có tính cải tiến hoặc đổi mới từ những giải pháp đã có và đã triển khai áp dụng tại đơn vị
có hiệu quả 
3. Khả năng áp dụng
- Cung cấp được các luận cứ khoa học cho việc hoạch định đường lối, chính sách:
Tốt  Khá  Đạt 

- Đưa ra các giải pháp khuyến nghị có khả năng ứng dụng thực tiễn, dễ thực hiện và dễ đi
vào cuộc sống: Tốt  Khá  Đạt 
- Đã được áp dụng trong thực tế đạt hiệu quả hoặc có khả năng áp dụng đạt hiệu quả trong
phạm vi rộng: Tốt  Khá  Đạt 
XÁC NHẬN CỦA TỔ CHUYÊN MÔN
(Ký tên và ghi rõ họ tên)
THỦ TRƯỞNG ĐƠN VỊ
(Ký tên, ghi rõ họ tên và đóng dấu)
Trang 19
BM04-NXĐGSKKN

×