Tải bản đầy đủ (.pdf) (109 trang)

Khóa luận Sử dụng phần mềm xử lý số liệu SPSS và R trong nghiên cứu về khoa học giảng dạy Vật lý

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.55 MB, 109 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM TP. HỒ CHÍ MINH
KHOA VẬT LÝ

KIM VĂN THANH

KHĨA LUẬN TỐT NGHIỆP

SỬ DỤNG PHẦN MỀM XỬ LÝ SỐ LIỆU
SPSS VÀ R TRONG NGHIÊN CỨU VỀ
KHOA HỌC GIẢNG DẠY VẬT LÝ

Chuyên ngành: Sư phạm Vật lý

TP. Hồ Chí Minh, năm 2020


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM TP. HỒ CHÍ MINH
KHOA VẬT LÝ

SỬ DỤNG PHẦN MỀM XỬ LÝ SỐ LIỆU
SPSS VÀ R TRONG NGHIÊN CỨU VỀ
KHOA HỌC GIẢNG DẠY VẬT LÝ

Người thực hiện: Kim Văn Thanh
Người hướng dẫn khoa học: ThS. Tơ Thị Hồng Lan

TP. Hồ Chí Minh, năm 2020



i

LỜI CẢM ƠN
Trong suốt thời gian học tập và hoàn thành khóa luận tốt nghiệp, với sự
cố gắng nỗ lực của bản thân, tôi đã nhận được sự giúp đỡ, hướng dẫn tận tình
của nhiều cá nhân và tập thể. Cho phép tơi được tỏ lịng biết ơn và gửi lời cảm
ơn chân thành tới:
Ban Giám hiệu Trường Đại học Sư phạm Thành phố Hồ Chí Minh cùng
tồn thể cán bộ quản lý và giảng viên của Trường nói chung và của Khoa Vật
lý nói riêng. Với sự giúp đỡ, tạo điều kiện của nhà Trường, tơi đã có một môi
trường thuận lợi để học tập, nghiên cứu và tiếp thu kiến thức cho bản thân.
Đặc biệt, tôi xin bày tỏ lòng biết ơn sâu sắc tới giảng viên hướng dẫn ThS.
Tơ Thị Hồng Lan đã tận tình hướng dẫn, giúp đỡ, quan tâm và động viên tơi
trong q trình tìm hiểu và xây dựng khóa luận tốt nghiệp.
Xin chân thành cảm ơn các tác giả của các tài liệu tham khảo mà tơi đã
trích dẫn trong khóa luận của mình. Đặc biệt là GS. Nguyễn Văn Tuấn bởi
những bài giảng cùng sự tư vấn, giải đáp các khó khăn, khúc mắc mà tơi gặp
phải trong q trình tìm hiểu về phần mềm R.
Xin chân thành cảm ơn sự nhận xét và góp ý tận tình của ThS. Lê Hải Mỹ
Ngân, TS. Phan Thị Ngọc Loan, cùng sự giúp đỡ của bạn Nguyễn Thị Thảo
Trang đã giúp tơi hồn thành sản phẩm cho khóa luận.
Tơi xin chân thành cảm ơn bạn Phan Thanh Trà đã luôn đồng hành, giúp
đỡ, nhận xét và góp ý để giúp tơi hồn thành khóa luận.
Cuối cùng, nhân dịp hồn thành khóa luận tốt nghiệp, cho phép tôi được
gửi lời cảm ơn sâu sắc tới gia đình, người thân cùng bạn bè đã hỗ trợ, động
viên, giúp đỡ và tạo điều kiện thuận lợi cho tơi vượt qua mọi khó khăn trong
q trình học tập kiến thức, tìm hiểu và xây dựng khóa luận tốt nghiệp này.
TP. Hồ Chí Minh, tháng 06 năm 2020
Tác giả


Kim Văn Thanh


ii

DANH MỤC CÁC TỪ VIẾT TẮT
Ý nghĩa

Ký hiệu
XSTK

Xác suất thống kê

VD

Ví dụ


iii

MỤC LỤC
LỜI CẢM ƠN ................................................................................................... i
DANH MỤC CÁC TỪ VIẾT TẮT ................................................................ ii
MỤC LỤC ....................................................................................................... iii
DANH MỤC BẢNG BIỂU ..............................................................................1
DANH MỤC HÌNH ẢNH ................................................................................2
PHẦN MỞ ĐẦU ...............................................................................................5
1. Lý do chọn đề tài ...............................................................................................5
2. Tổng quan nghiên cứu.......................................................................................5
3. Định hướng nghiên cứu của đề tài ....................................................................8

3.1.

Mục tiêu đề tài ............................................................................................8

3.2.

Câu hỏi nghiên cứu ....................................................................................8

4. Phương pháp, đối tượng nghiên cứu .................................................................8
4.1.

Phương pháp nghiên cứu ............................................................................8

4.2.

Đối tượng nghiên cứu.................................................................................9

5. Cấu trúc khóa luận ............................................................................................9
CHƯƠNG 1. SỬ DỤNG PHẦN MỀM SPSS ...............................................11
1. Giới thiệu phần mềm SPSS .............................................................................11
1.1.

Lịch sử hình thành và phát triển ...............................................................11

1.2.

Khả năng của SPSS ..................................................................................11

1.3.


Giao diện ..................................................................................................12

1.4.

Khai báo biến ...........................................................................................12

1.5.

Nhập dữ liệu .............................................................................................13

2. Các chức năng cơ bản của SPSS .....................................................................14
2.1.

Tạo biến mới từ các biến sẵn có ...............................................................14

2.2.

Thống kê mô tả .........................................................................................16

2.3.

Tạo bảng tương quan nhiều chiều ............................................................21

2.4.

So sánh trung bình ....................................................................................22

2.5.

Phân tích tương quan ................................................................................33


2.6.

Kiểm định độ tin cậy của thang đo...........................................................36


iv
2.7.

Phân tích hồi quy ......................................................................................39

2.8.

Biểu đồ .....................................................................................................46

CHƯƠNG 2. SỬ DỤNG PHẦN MỀM R .....................................................48
1. Giới thiệu phần mềm R ...................................................................................48
1.1.

Lịch sử hình thành và phát triển ...............................................................48

1.2.

Khả năng của R ........................................................................................48

1.3.

Giao diện ..................................................................................................49

1.4.


Dẫn nhập ..................................................................................................51

1.5.

Nhập dữ liệu .............................................................................................54

2. Các chức năng cơ bản của R ...........................................................................58
2.1.

Tạo biến mới từ các biến sẵn có ...............................................................58

2.2.

Thống kê mơ tả .........................................................................................61

2.3.

So sánh trung bình ....................................................................................66

2.4.

Phân tích tương quan ................................................................................75

2.5.

Kiểm định độ tin cậy của thang đo...........................................................77

2.6.


Phân tích hồi quy ......................................................................................79

2.7.

Biểu đồ .....................................................................................................84

3. Các lỗi thường gặp trong sử dụng R và RStudio ............................................85
3.1.

Lỗi đọc file ...............................................................................................85

3.2.

Lỗi khơng tìm thấy dataset, khơng tìm thấy lệnh. ....................................85

3.3.

Lỗi trùng tên biến .....................................................................................85

4. Tổng kết các lệnh thường dùng trong R. ........................................................85
CHƯƠNG 3. ỨNG DỤNG PHẦN MỀM XỬ LÝ SỐ LIỆU PHỤC VỤ
NGHIÊN CỨU KHOA HỌC GIẢNG DẠY VẬT LÝ .........................................89
1. So sánh phần mềm SPSS và R ........................................................................89
1.1.

Giống nhau ...............................................................................................89

1.2.

Khác nhau .................................................................................................89


2. Ưu và nhược điểm của phần mềm SPSS và R ................................................90
2.1.

Ưu và nhược điểm của phần mềm SPSS..................................................90

2.2.

Ưu và nhược điểm của phần mềm R ........................................................91

3. Ứng dụng phần mềm SPSS và R vào các nghiên cứu Khoa học giảng dạy Vật
lý .........................................................................................................................92
KẾT LUẬN VÀ KIẾN NGHỊ ........................................................................94


v
TÀI LIỆU THAM KHẢO..............................................................................97
PHỤ LỤC ........................................................................................................99


1

DANH MỤC BẢNG BIỂU

Bảng 1. Thống kê mô tả biến Diemthi..............................................................19
Bảng 2. Bảng chéo Xeploai và Lop ..................................................................20
Bảng 3. Bảng tương quan giữa Xeploai với Gioitinh và Lop. ..........................22
Bảng 4. Kết quả tính giá trị trung bình theo biến định tính ..............................23
Bảng 5. Kết quả kiểm định Paired-Samples T-Test .........................................25
Bảng 6. Kết quả kiểm định One-Sample T Test ...............................................27

Bảng 7. Kết quả so sánh trung bình giữa hai nhóm .........................................29
Bảng 8. Kết quả kiểm định One-Way ANOVA .................................................32
Bảng 9. Kết quả phân tích tương quan đơn ......................................................35
Bảng 10. Đánh giá hệ số Cronbach’s Alpha ....................................................39
Bảng 11. Bảng Model Summary .......................................................................42
Bảng 12. Bảng ANOVA ....................................................................................43
Bảng 13. Bảng Coecients .................................................................................44
Bảng 14. Tổng hợp các lệnh cơ bản thường dùng trong R ...............................88


2

DANH MỤC HÌNH ẢNH

Hình 1. Giao diện làm việc của SPSS ...............................................................12
Hình 2. Cửa sổ khai báo biến ...........................................................................13
Hình 3. Nhập dữ liệu vào SPSS ........................................................................14
Hình 4. Mã hóa biến .........................................................................................15
Hình 5. Mã hóa biến Xeploai ............................................................................15
Hình 6. Cơ sở dữ liệu lớp thực nghiệm và lớp đối chiếu .................................16
Hình 7. Tính tần suất biến Diemthi ..................................................................17
Hình 8. Kết quả tính tần số biến Diemthi .........................................................18
Hình 9. Các tùy chọn trong lệnh Options của Descriptives .............................18
Hình 10. Tạo bảng chéo hai biến ......................................................................19
Hình 11. Đồ thị bảng chéo Xeploai và Lop ......................................................20
Hình 12. Tạo bảng nhiều chiều.........................................................................21
Hình 13. Tính giá trị trung bình theo biến định tính ........................................23
Hình 14. Bảng số liệu so sánh cặp ....................................................................24
Hình 15. Kiểm định Paired-Samples T-Test ....................................................25
Hình 16. Kiểm định One-Sample T Test ..........................................................26

Hình 17. So sánh trung bình giữa hai nhóm .....................................................28
Hình 18. Phân nhóm giá trị so sánh trung bình giữa hai nhóm ........................28
Hình 19. Cơ sở dữ liệu mức tiêu thụ xăng .......................................................30
Hình 20. Kiểm định One-Way ANOVA ............................................................31
Hình 21. Đánh giá kết quả kiểm định One-Way ANOVA. ................................32
Hình 22. Phân tích tương quan đơn ..................................................................34
Hình 23. Đánh giá hệ số Cronbach’s Alpha .....................................................38
Hình 24. Bảng số liệu phân tích hồi quy tuyến tính .........................................40
Hình 25. Phân tích hồi quy tuyến tính bội ........................................................40
Hình 26. Cài đặt thơng số phân tích .................................................................41


3
Hình 27. Cài đặt biểu đồ kiểm tra giả thiết hồi quy .........................................41
Hình 28. Bảng ý nghĩa giá trị Durbin-Watson .................................................43
Hình 29. Đồ thị Histogram ...............................................................................45
Hình 30. Đồ thị Normal P-P Plot .....................................................................45
Hình 31. Đồ thị Scatter Plot .............................................................................46
Hình 32. Vẽ đồ thị với SPSS.............................................................................47
Hình 33. Giao diện sử dụng của R ....................................................................49
Hình 34. Giao diện sử dụng của RStudio .........................................................50
Hình 35. Cài đặt Packages trực tiếp cho R .......................................................53
Hình 36. Cài packages tự động với RStudio ....................................................54
Hình 37. Hợp nhất các biến thành dataset ........................................................55
Hình 38. Nhập dữ liệu trực tiếp ........................................................................56
Hình 39. Đọc file vào RStudio ..........................................................................57
Hình 40. Xem trước dữ liệu trước khi đọc .......................................................57
Hình 41. Cơ sở dữ liệu lớp thực nghiệm và lớp đối chiếu ...............................58
Hình 42. Cơ sở dữ liệu mức tiêu thụ xăng .......................................................59
Hình 43. Tạo biến mới đơn giản .......................................................................59

Hình 44. Lệnh mã hóa biến Xeploai .................................................................60
Hình 45. Mã hóa biến Xeploai ..........................................................................60
Hình 46. Trích dữ liệu từ dataset cũ .................................................................61
Hình 47. Dữ liệu lớp thực nghiệm trích từ dataset Dulieu ...............................61
Hình 48. Thơng báo package và dataset sẽ làm việc. .......................................62
Hình 49. Bảng phân tích tần số biến Diem. ......................................................62
Hình 50. Lệnh vẽ đồ thị phân bố tần số............................................................63
Hình 51. Đồ thị phân bố tần số biến Diem .......................................................63
Hình 52. Lệnh vẽ biểu đồ beeswarm. ...............................................................64
Hình 53. Biểu đồ phân bố điểm theo từng lớp .................................................64
Hình 54. Bảng chéo phân tích hai biến ............................................................66


4
Hình 55. Phân tích tham số thống kê theo nhóm..............................................67
Hình 56. Dữ liệu so sánh cặp............................................................................68
Hình 57. Kiểm định Paired T Test ...................................................................69
Hình 58. Lệnh kiểm định trung bình tổng thể điểm lớp thực nghiệm ..............70
Hình 59. Lệnh kiểm định trung bình tổng thể điểm lớp đối chiếu ...................70
Hình 60. Kiểm định trung bình tổng thể điểm lớp thực nghiệm ......................71
Hình 61. Kiểm định trung bình tổng thể điểm lớp đối chiếu ...........................71
Hình 62. So sánh phương sai giữa điểm của hai nhóm lớp ..............................72
Hình 63. Kiểm định Two Sample T Test giữa điểm của hai nhóm lớp ............73
Hình 64. Cơ sở dữ liệu mức tiêu thụ xăng .......................................................74
Hình 65. Kiểm định ANOVA ............................................................................74
Hình 66. Tương quan giữa mức tiêu thụ xăng và cơng suất động cơ ..............76
Hình 67. Tương quan giữa mức tiêu thụ xăng và khối lượng xe .....................76
Hình 68. Tương quan giữa mức tiêu thụ xăng và số cylinder ..........................77
Hình 69. Tương quan giữa mức tiêu thụ xăng và dung tích động cơ ...............77
Hình 70. Hệ số Cronbach's Alpha của cơ sở dữ liệu mức tiêu thụ xăng .........78

Hình 71. Phân tính hồi quy tuyến tính với R. ...................................................79
Hình 72. Biểu đồ Histogram về phân bố phần dư ............................................81
Hình 73. Biểu đồ Normal Q-Q Plot về phân bố phần dư .................................81
Hình 74. Biểu đồ studentized residuals về phương sai và giá trị tiên lượng....82
Hình 75. Biểu đồ Component + Residual Plot về mối tương quan tuyến tính 83
Hình 76. Kiểm tra giả định độc lập durbinWatsonTest ....................................84


5

PHẦN MỞ ĐẦU
1. Lý do chọn đề tài
Ngày 26/12/2018, Bộ Giáo dục và Đào tạo đã chính thức cơng bố chương trình
giáo dục phổ thơng mới bao gồm chương trình giáo dục tổng thể và chương trình giáo
dục từng bộ mơn. Đây là bước đổi mới tồn điện trên quy mơ cả nước về chương
trình dạy và học ở phổ thơng. Chương trình giáo dục phổ thơng mới sẽ tập trung phát
triển về phẩm chất và năng lực cho các em học sinh. Qua đó, chương trình giáo dục
phổ thơng mới tập trung trả lời câu hỏi: “Học xong chương trình, học sinh làm được
những gì?”. Việc đổi mới chương trình cũng đồng thời đặt ra yêu cầu và thách thức
đối với đội ngũ giáo viên trong việc đổi mới phương pháp dạy học và cách thức tổ
chức dạy học nhằm phát triển tối đa phẩm chất và năng lực cho từng đối tượng học
sinh.
Trong bối cảnh có rất nhiều thay đổi và mới mẻ về tổ chức dạy học các mơn học
ở phổ thơng nói chung và Vật lý nói riêng, cần có những nghiên cứu khoa học trong
lĩnh vực này trở nên là một việc cần thiết và cũng là cơ hội để mở ra nhiều hướng
nghiên cứu trong lĩnh vực khoa học giáo dục mà môn Vật lý là một phần trong đó.
Một trong các phương pháp nghiên cứu trong khoa học giáo dục là Thống kê và sử
dụng phần mềm xử lý số liệu thống kê. Hiện nay, các phần mềm thống kê cũng rất phát
triển với nhiều phần mềm khác nhau có thể tính tốn và xử lý lượng lớn dữ liệu. Tuy
nhiên, được sử dụng rộng rãi trên thị trường có thể kể đến hai phần mềm là SPSS và R

(cùng các gói package của R). Cả hai phần mềm này có đáp ứng được phần lớn nhu cầu
xử lý số liệu trong nghiên cứu khoa học giáo dục hay không? Mỗi phần mềm có ưu điểm
và nhược điểm nào, đặc biệt với đối tượng sử dụng là sinh viên, học viên cao học hoặc
giáo viên phổ thông? Cách sử dụng mỗi phần mềm này ra sao và để cho hiệu quả? Với
các câu hỏi như trên, chúng tôi quyết định chọn đề tài “Sử dụng phần mềm xử lý số
liệu SPSS và R trong nghiên cứu về khoa học giảng dạy Vật lý” để làm đề tài nghiên
cứu.
2. Tổng quan nghiên cứu
Các đề tài nghiên cứu về khoa học dạy học Vật lý đều ít nhiều sử dụng Thống
kê. Những mơ thức phổ biến là sử dụng thống kế mô tả, so sánh trung bình mẫu, kiểm
định giả thuyết thống kê. Có thể thấy rõ mô thức này trong luận văn Thạc sĩ Khoa
học giáo dục của tác giả Hà Thị Trúc Linh (2016). “Xây dựng và sử dụng hệ thống
câu hỏi TNKQ theo định hướng phát triển năng lực chuyên biệt và dạy học chương
“Cảm ứng điện từ” – Vật lý 11”[11]; Banhnalak Bosanthay (2017). “Tổ chức dạy


6
học chương “Dòng điện một chiều” – Vật lý lớp 9 THCS ở nước CHDCND Lào theo
hướng phát huy tính tích cực, tự lực học tập của học sinh”[3]; Bùi Xuân Dương
(2017). “Tổ chức dạy học giải quyết vấn đề một số kiến thức của chương “Các định
luật bảo toàn” – Vật lý 10 với sự hỗ trợ của phần mềm Crocodile PHYsics”[5].
Những số liệu này cần thiết cho việc nghiên cứu mẫu can thiệp và mẫu đối chứng.
Các tham số được sử dụng như điểm trung bình, phương sai, độ lệch chuẩn, tần số
điểm, tần số tích lũy,… của điểm các lớp trước và sau khi áp dụng phương pháp mới.
Các tác giả kết so sánh kết quả, vẽ biểu đồ từ đó kết luận độ hiệu quả của phương
pháp mới được nêu ra.
Nếu chỉ dừng ở thống kê mơ tả thì việc xử lý số liệu khá đơn giản, có thể tính
bằng tay hoặc dùng phần mềm Excel. Tuy nhiên, để xử lý số liệu với các bước phức
tạp hơn thì các đề tài nghiên cứu cần đến phần mềm chuyên dụng xử lý số liệu.
Trước tiên, xét đến phần mềm SPSS. SPSS là một phần mềm thương mại có phí

bản quyền khoảng 99$/tháng. Đó là một khó khăn với sinh viên, học viên cao học
hay giáo viên phổ thông nếu muốn sử dụng phần mềm này cho nghiên cứu của mình.
Tuy nhiên, tính năng của SPSS giúp việc sử lý số liệu phức tạp được tiến hành dễ
dàng và có mức độ sâu hơn là thống kê mô tả. Trong luận văn Thạc sĩ Khoa học giáo
dục của các tác giả: Hoàng Thị Hạnh (2016). “Vận dụng mơ hình PEER
INSTRUCTION trong dạy học một số kiến thức chương “Chất khí” – Vật lý 10”[7],
tác giả đã giới thiệu mơ hình Peer Instruction và phân tích ưu điểm, hạn chế và những
thuận lợi, khó khăn khi áp dụng mơ hình vào dạy học Vật lý phổ thơng ở Việt Nam.
Dựa vào đó tác giả đã phân tích kiến thức và xây dựng tiến trình dạy học chương
“Chất khí” – Vật lý 10 theo mơ hình Peer Instruction. Từ đó tổ chức thực nghiệm sư
phạm và khảo sát số liệu đánh giá kết quả của mơ hình. Tác giả đã dùng SPSS để tính
tốn các tham số của thống kê mơ tả như điểm trung bình, phương sai, độ lệch chuẩn,
tần suất và tần suất tích lũy, … Ngồi ra với số liệu khảo sát là điểm của hai lớp gồm
lớp thực nghiệm và lớp đối chiếu tác giả đã sử dụng kiểm định Independent-Sample
T Test để so sánh trung bình giữa hai nhóm. Từ đó thấy được sự khác nhau về ý nghĩa
thống kê giữa điểm của lớp thực nghiệm và điểm của lớp đối chiếu. Điểm trung bình
của lớp thực nghiệm cao hơn so với lớp đối chiếu nên có thể thấy được độ hiệu quả
của việc áp dụng mơ hình Peer Instruction vào dạy học Vật lý phổ thơng ở nước ta.
Thao tác này sẽ khó khăn hơn nếu không sử dụng một phần mềm chuyên dụng cho
việc xử lý số liệu.


7
Ngồi SPSSI, có thể sử dụng phần mềm Transana để phân tích các đoạn phim
trong q trình giảng dạy. Phần mềm Transana được sử dụng trong luận văn Thạc sĩ
Khoa học giáo dục của tác giả Đinh Vũ Nguyên Chương (2017). “Tổ chức dạy học
chủ đề tích hợp “Năng lượng” cho sinh viên chuyên ngành kỹ thuật”[4]. Trong đó
phần mềm Transana được sử dụng để phân tích các clip được quay lại trong quá trình
giảng dạy bằng phương pháp mới. Từ đó đánh giá được sự tích cực làm việc, hoạt
động của học sinh được nâng cao.

Bên cạnh đó, cũng có những đề tài khơng sử dụng phân tích thống kê để đánh
giá kết quả mà thay vào đó, tác giả chấm điểm sản phẩm của học sinh và thu thập
những nhận xét của học sinh, giáo viên và các chun gia để kết luận độ hiệu quả của
mơ hình. Ví dụ như luận văn Thạc sĩ Khoa học giáo dục của tác giả: Đàm Việt Thắng
(2017). “Tổ chức hoạt động ngoại khóa về ứng dụng kỹ thuật chương “Cơ học chất
lưu” – Vật lý 10 theo hướng phát huy tính tích cực và phát triển năng lực sáng tạo
của học sinh”[15]; luận văn tốt nghiệp của tác giả Nguyễn Thanh Huy (2017). “Xây
dựng cơ sở học liệu cho việc dạy và học học phần thiên văn và quang học trong môn
khoa học tự nhiên ở bậc tiểu học”[9]. Phương pháp đánh giá này không thuyết phục
do đây chỉ là đánh giá trên một mẫu nhỏ và chưa đủ cơ sở để đánh giá độ hiệu quả
của đề tài trên phạm vi quần thể.
Như vậy, qua tìm hiểu và phân tích một vài luận văn, khóa luận về khoa học
dạy học môn Vật lý được bảo vệ tại Khoa Vật lý trường Đại học Sư phạm Tp.HCM
trong khoảng 3 năm trở lại đây các tác giả có sử dụng SPSS và một số phần mềm khác
để xử lý số liệu. Tuy nhiên trong phạm vi tìm hiểu, chúng tơi chưa ghi nhận đề tài
nào có sử dụng phần mềm R để xử lý số liệu.
Trong khi sử dụng SPSS cần phải trả phí bản quyền, R là một phần mềm thống
kê miễn phí. Tuy nhiên R có thể xem như là một ngơn ngữ thống kê vì người dùng
phải lập trình với rất nhiều câu lệnh và nhiều gói Packages khá phức tạp. Điều này
có lẽ là một nguyên nhân dù được sử dụng miễn phí nhưng khơng nhiều đề tài dành
cho sinh viên, học viên cao học sử dụng, mặc dù tìm hướng dẫn sử dụng R khơng
khó. Trong các hướng dẫn chi tiết về R, có thể kể đến sách của Giáo sư Nguyễn Văn
Tuấn (2014). “Phân tích dữ liệu với R”[14]. Trong quyển sách này, tác giả đã trình
bày rất chi tiết về các chức năng và hướng dẫn sử dụng phần mềm R để phân tích số
liệu. Giáo sư đã trình bày rõ ràng và đầy đủ về cách sử dụng kèm theo các ví dụ cụ
thể về các chức năng của R trong sách. Tuy nhiên, chính vì đầy đủ nên tài liệu khá


8
dài, lên đến 517 trang, phù hợp cho học tập và nghiên cứu với R nhưng lại không

thân thiện với một người mới bắt đầu dùng và chỉ dùng như một cơng cụ nghiên cứu.
Chính vì lẽ đó, trong khóa luận này chúng tơi sẽ trình bày cách sử dụng các chức
năng quan trọng, cần thiết cho phân tích số liệu trong lĩnh vực Khoa học giáo dục nói
chung và Khoa học giảng dạy Vật lý nói riêng của phần mềm SPSS và R. Một quyển
cẩm nang vừa phải là rất cần thiết cho những người dùng ban đầu. Đồng thời chúng
tơi cũng phân tích ưu và nhược điểm của từng phần mềm để người dùng có thể lựa
chọn phần mềm nào phù hợp với bản thân.
3. Định hướng nghiên cứu của đề tài
3.1.

Mục tiêu đề tài

Phân tích hai phần mềm xử lý số liệu SPSS và R để phục vụ cho các nghiên cứu
về khoa học giảng dạy Vật lý và tạo ra một quyển cẩm nang sử dụng cho hai phần
mềm này với các chức năng quan trọng và cơ bản nhất.
3.1.1. Mục tiêu cụ thể
- Giới thiệu và phân tích ưu, nhược điểm của phần mềm SPSS.
- Giới thiệu và phân tích ưu, nhược điểm của phần mềm R.
- So sánh sự khác nhau giữa hai phần mềm SPSS và R.
- Phân tích số liệu thực tế để đưa ra sự phù hợp của từng phần mềm với các đề
tài nghiên cứu khác nhau về khoa học giảng dạy Vật lý.
- Thiết kế cẩm nang hướng dẫn sử dụng.
3.2.

Câu hỏi nghiên cứu

- Sử dụng phần mềm SPSS và R trong xử lý số liệu nghiên cứu như thế nào?
- Ưu, nhược điểm của hai phần mềm SPSS và R là gì?
- Đâu là sự khác nhau giữa SPSS và R? Tại sao hai phần mềm này có thể tồn tại
song song với nhau trên trị trường mà không nghiêng hẳn về một phần mềm nào?

- Từng phần mềm SPSS và R phù hợp với đề tài nghiên cứu nào?
4. Phương pháp, đối tượng nghiên cứu
4.1.

Phương pháp nghiên cứu

4.1.1. Phương pháp nghiên cứu lý luận
- Phân tích và nghiên cứu các tài liệu liên quan đến phần mềm SPSS và R.


9
- Nghiên cứu các tài liệu về khoa học giảng dạy Vật lý.
- Mơ hình hóa các hệ thống số liệu thực tế.
- Nghiên cứu các tài liệu về xử lý số liệu, các luận văn, luận án liên quan đến
xử lý số liệu và khoa học giảng dạy Vật lý.
4.1.2. Phương pháp nghiên cứu thực tiễn
- Nghiên cứu các số liệu thực tiễn liên quan đến khoa học giảng dạy Vật lý.
- Nghiên cứu việc xây dựng hướng xử lý và sử dụng phần mềm xử lý số liệu
SPSS và R để phân tích số liệu thực tế liên quan đến khoa học giảng dạy Vật lý.
4.2.

Đối tượng nghiên cứu

Hai phần mềm SPSS và R cùng số liệu của các đề tài nghiên cứu về khoa học
giảng dạy Vật lý.
5. Cấu trúc khóa luận
Để đạt được mục tiêu đã đề ra, khóa luận sẽ nghiên cứu thực tế tình hình sử
dụng phần mềm xử lý số liệu trong các nghiên cứu về khoa học giảng dạy Vật lý; đưa
ra ưu, nhược điểm của hai phần mềm SPSS và R; so sánh đặc điểm khác nhau giữa
hai phần mềm; rút ra nhận xét về sự phù hợp của từng phần mềm với các đối tượng

nghiên cứu khác nhau trong lĩnh vực khoa học giảng dạy Vật lý. Với các nhiệm vụ
như trên khóa luận này được chia làm ba chương không kể phần mở đầu và kết luận.
Chương 1: Sử dụng phần mềm SPSS
Trong chương này khóa luận sẽ giới thiệu phần mềm SPSS, và các chức năng
cơ bản thường dùng cho các nghiên cứu về Khoa học giảng dạy Vật lý. Song song
đó, khóa luận cũng đưa ra các VD cụ thể cho từng chức năng để phân tích mẫu trên
các số liệu thực tế.
Chương 2: Sử dụng phần mềm R
Trong chương này khóa luận sẽ giới thiệu phần mềm R, và các chức năng cơ
bản thường dùng cho các nghiên cứu về Khoa học giảng dạy Vật lý. Song song đó,
khóa luận cũng đưa ra các VD cụ thể cho từng chức năng để phân tích mẫu trên các
số liệu thực tế.
Chương 3: Ứng dụng phần mềm xử lý số liệu phục vụ nghiên cứu khoa học
giảng dạy Vật lý
Trong chương này khóa luận sẽ tập trung vào việc đánh giá hai phần mềm SPSS
và R. Từ kết quả thu được khi phân tích các VD với số liệu thực tế ở Chương 1 và


10
Chương 2 rút ra kết luận về ưu, nhược điểm của hai phần mềm này. Qua đó trình bày
về những đặc điểm giống và khác nhau của hai phần mềm trên để trả lời câu hỏi tại
sao hai phần mềm này lại cùng tồn tại song song với nhau mà không nghiêng hẳn về
một phần mềm nào? Đồng thời đưa ra kết luận về sự phù hợp của từng phần mềm với
các đối tượng sử dụng khác nhau, các đối tượng nghiên cứu khác nhau trong lĩnh vực
khoa học giảng dạy Vật lý.


11

CHƯƠNG 1. SỬ DỤNG PHẦN MỀM SPSS

1. Giới thiệu phần mềm SPSS
1.1.

Lịch sử hình thành và phát triển

SPSS là một phần mềm phổ biết đã được xây dựng từ những năm 1968 và được
hoàn thiện dần theo thời gian.
SPSS (viết tắt của Statistical Package for the Social Sciences) là một
chương trình máy tính phục vụ cho cơng tác phân tích thống kê. SPSS được
sử dụng rộng rãi trong công tác thống kê kinh tế - xã hội và được sử dụng
rộng rãi trong kinh tế lượng.[2]
Thế hệ đầu tiên của SPSS được đưa ra từ những năm 1968 chuyên sử
dụng cho các máy chủ ở Mỹ. SPSS được sử dụng bởi các nhà nghiên cứu
thị trường, nghiên cứu y khoa, công ty điều tra, các nhà nghiên cứu giáo
dục và những lĩnh vực khác. Sau đó phần mềm khơng ngừng cải tiến và
nâng cao các tính năng của mình, ngày càng có nhiều thế hệ mới của SPSS
ra đời, với các tiện ích ngày càng phong phú, đa dạng hơn. Thế hệ mới
nhất cho đến nay được xem là SPSS 22.0 được giới thiệu từ tháng 8 năm
2008, có cả phiên bản cho các hệ điều hành Microsoft Windows, Mac, và
Linux/ UNIX. SPSS 22.0, nhiều chức năng đa dạng và linh hoạt nên được
sử dụng rộng rãi trong nhiều ngành khoa học khác nhau như: Xã hội học,
Y học, Nhân học, Tâm lý học, Kinh tế học, Marketing…[2]
1.2.

Khả năng của SPSS

Phần mềm SPSS cung cấp một hệ thống quản lý dữ liệu và khả năng phân tích
thống kê với giao diện thân thiện cho người dùng trong môi trường đồ hoạ, sử dụng
các trình đơn mơ tả và các hộp thoại đơn giản.
Chức năng cơ bản của SPSS:

+ Thống kê mô tả (Descriptive statistics): tần số (Frequencies), các loại bảng số
liệu tổng hợp (Cross tabulation, Explore, Descriptive Ratio Statistics).
+ Thống kê 2 biến số (Bivariate statistics): trung bình (Means), tương quan
(bivariate, partial, distances), kiểm định phi tham số (Nonparametric tests), kiểm định
sự tin cậy của thang đo bằng Cronbach Alpha phân tích tương quan, kiểm định trung
bình (T-test), kiểm định sự khác nhau giữa các biến phân loại (định danh) bằng phân
tích phương sai (ANOVA), vẽ bản đồ nhận thức (dùng trong marketing).


12
+ Dự báo (Prediction): Hồi quy (regression), phân tích nhân tố (Factor analysis),
cluster analysis (two-step, K-means, hierarchical), biệt thức (Discriminant).
1.3.

Giao diện

Giao diện của SPSS trực quan và quen thuộc nhờ có nét tương đồng với các
phần mềm Office thường dùng, trong đó:

Hình 1. Giao diện làm việc của SPSS
1. Thanh menu chức năng,
2. Biểu tượng một số chức năng thông dụng,
3. Cột hiển thị tên các biến,
4. Số thứ tự các dòng,
5. Data View (cửa sổ nhập liệu và thể hiện dữ liệu). Variable View (cửa sổ khai
báo biến).
1.4.

Khai báo biến


SPSS yêu cầu người sử dụng phải khai báo đầy đủ các biến trước khi thực hiện
các bước tính tốn với dữ liệu. Công việc này được thực hiện trong của sổ Variable
View, với:


13

Hình 2. Cửa sổ khai báo biến
+ Name: tên biên, ký tự liên tục, khơng có khoảng trắng,
+ Type: kiểu dữ liệu, số (numeric), chữ (string), ngày tháng (date), tiền tệ
(dollar),…
+ Width: độ rộng kiểu dữ liệu, nêu type là string thì width là số ký tự tối đa,
+ Decimals: lượng số thập phân,
+ Label: nhãn biến (chú thích cho tên biến, là tên cột hiển thị ở bảng kết quả),
+ Values: giá trị mã hóa dữ liệu: ví dụ 1 là Nam, 2 là Nu,
+ Missing: khai báo giá trị khuyết (khai báo khi bản khảo sát có dữ liệu sai hoặc
không đúng cấu trúc), các giá trị này sẽ bị bỏ đi để tránh làm ảnh hướng tới kết quả,
+ Columns: độ rộng cột tên biến,
+ Align: vị trí hiển thị dữ liệu trong cột (căn lề),
+ Measure: loại thang đo dữ liệu:
• Scale (thang đo tỉ lệ): có thể cộng, trừ, nhân, chia,
• Ordinal (thang đo thứ bậc): có thể cộng, trừ nhưng hạn chế về nhân chia,
ví dụ điểm trung bình,
• Nominal (thang đo định danh): chỉ đếm được tần số chứ không thực hiện
các phép tính được,
+ Role: vai trị của biến.
1.5.

Nhập dữ liệu


SPSS cung cấp nhiều công cụ nhập số liệu khảo sát rất tiện dụng, trong đó phổ
biến là nhập dữ liệu thủ công và nhập từ phần mềm Excel.


14

Hình 3. Nhập dữ liệu vào SPSS
+ Nhập dữ liệu thủ công được thực hiện trực tiếp trên cửa sổ Data View. Thực
hiện khai báo các biến trong cửa sổ Variable View sau đó nhập số liệu cho các biến
trong cửa sổ Data View.
+ Để đọc dữ liệu từ file Excel ta vào File → Open → Data…→ Chọn all file →
Chọn file dữ liệu cần sử dụng. Ngoài ra SPSS còn cho phép sao chép dữ liệu trực tiếp
từ Excel bằng lệnh Copy/Paste.
* Lưu ý: dữ liệu đưa vào SPSS nên là số hoặc ký tự không dấu, không khoảng
trắng để tránh lỗi. Để SPSS có thể mở được file thì tên file và tên đường dẫn đến file
đều phải là ký tự tiếng Anh hoặc tiếng Việt không dấu.
2. Các chức năng cơ bản của SPSS
2.1.

Tạo biến mới từ các biến sẵn có

SPSS cung cấp nhiều tính năng để tạo biến mới trong Menu Transform, trong
đó thường dùng nhất là:
+ Compute Variable…: dùng để tạo một biến mới từ các biến đã có sẵn. VD: có
thể tạo thêm một biến “điểm hệ số 2” = 2* “điểm”.


15
+ Recode into Same Variables…: dùng để mã hóa lại giá trị của biến có sẵn và
thêm điều kiện lọc nếu cần. Biến mới tạo ra sẽ thay thế biến cũ.

+ Recode into Different Variables…: dùng để mã hóa lại giá trị của biến có sẵn
và thêm điều kiện lọc nếu cần. Biến mới tạo sẽ độc lập với biến cũ.
VD: Mã hóa biến Diemthi để tạo biến mới Xeploai

Hình 4. Mã hóa biến
1: Dùng để đặt tên và mơ tả cho biến mới,
2: Dùng để mã hóa các giá trị của biến cũ,
3: Dùng để thêm điều kiện lọc cho biến mới.
Chọn Old and New Values… để mã hóa biến Xeploai với điều kiện mã hóa như
sau:

Hình 5. Mã hóa biến Xeploai


16
Kết quả sẽ xuất ra biến mới Xeploai với các giá trị 1, 2, 3, 4, 5 lọc theo các giá
trị của biến Diemthi. Sau khi có biến mới ta có thể tiếp tục vào cửa sổ Variable View

→ Values để mã hóa tiếp thành các bậc xếp hạng A, B, C, D, F nếu cần.
2.2.

Thống kê mô tả

Thống kê mơ tả gồm các chức năng tính tốn cơ bản như tính tần suất, giá trị
trung bình, phương sai, độ lệch chuẩn,… Các chức năng thống kê mô tả được SPSS
cung cấp trong Menu Analyze → Descriptive Statistics. Để VD cho các chức năng
thống kê chúng ta xét cơ sở dữ liệu là số liệu thống kê về lớp thực nghiệm và lớp đối
chiếu được khảo sát trong luận văn Thạc sĩ Khoa học giáo dục của các tác giả: Hồng
Thị Hạnh (2016). “Vận dụng mơ hình PEER INSTRUCTION trong dạy học một số
kiến thức chương “Chất khí” – Vật lý 10”[7].


Hình 6. Cơ sở dữ liệu lớp thực nghiệm và lớp đối chiếu


17
Trong đó các lệnh thường dùng là:
* Frequencies…: Tính tần suất.

Hình 7. Tính tần suất biến Diemthi
Để lập bảng tần suất ta chọn lệnh Frequencies… → chuyển biến cần tính vào ơ
Variable(s) → OK. Ngồi ra có thể sử dụng các lệnh bên phải để thêm các yêu cầu
cho phép toán, các lệnh thường sử dụng như sau:
+ Lệnh Statistics để tính thêm các tham số thống kê như giá trị trung bình,
phương sai, độ lệch chuẩn, độ nhọn, giá trị lớn nhất, nhỏ nhất, khoảng biến thiên, tính
đối xứng,… Để tính các thơng số này, chúng ta chọn lệnh và tích vào các thơng số
muốn tính.
+ Lệnh Charts để vẽ đồ thị biểu diễn tần suất của các giá trị trong biến đã lựa
chọn, có nhiều dạng đồ thì như cột, tròn, đường. Để sử dụng ta chọn lệnh và chọn
loại đồ thị cần vẽ.
Kết quả:


18

Hình 8. Kết quả tính tần số biến Diemthi
* Descriptives…: Tính các tham số thống kê mơ tả như: giá trị trung bình,
phương sai, độ lệch chuẩn, độ nhọn, giá trị lớn nhất, nhỏ nhất, khoảng biến thiên, tính
đối xứng,…
Để sử dụng ta chọn lệnh Descriptives → chuyển biến cần mô tả vào ô
Variable(s) → chọn Options để tùy chọn các giá trị cần tính → Continue → OK để

phần mềm bắt đầu tính tốn.

Hình 9. Các tùy chọn trong lệnh Options của Descriptives


×