NGUYỄN VĂN KHẢI
PHƯƠNG PHÁP THỐNG KÊ TRONG
NGHIÊN CỨU KHOA HỌC GIÁO DỤC
(ĐỀ CƯƠNG CHUYÊN ĐỀ THẠC SĨ)
TÀI LIỆU THAM KHẢO
1. Nguyễn Văn Khải : Phương pháp thống kê trong nghiên cứu khoa
học giáo dục. Bài giảng- 2010 ĐHSP ĐHThái nguyên
2. Nguyễn Văn Khải (Chủ biên) (1995): Phương pháp nghiên cứu khoa
học giáo dục. ĐHSP ĐHThái nguyên
3. Đàm Hữu Hồ (2008): Giáo trình thống kê xã hội học; NXB Giáo dục
4. Nguyễn Ngọc Anh, Nguyễn Đình Chúc, Đoàn Quang Hưng (2008):
PHÂN TÍCH THỐNG KÊ SỬ DỤNG EXCEL
MỞ ĐẦU
Toán học đã xâm nhập vào nhiều lĩnh vực, trong
đó có NC Tâm lí, Giáo dục học
Đối tượng KHGD phức tạp, thay đổi và có tính
ngẫu nhiên
Các hiện tượng ngẫu nhiên có tính qui luật (xác
suất): Thí dụ: thí nghiệm tung con xúc sắc
Thống kê toán học là một bộ phận của lí thuyết
xác suất: Thu thập, xử lí số liệu, rút ra tính qui
luật,…
KHGD: sử dụng Thống kê toán học như một
công cụ NC
1. MỘT SỐ KHÁI NIỆM
1.1. Thông kê là gì?
Thông kê là một nhánh của Toán học liên quan đến việc
thu thập, phân tích, diễn giải (hay giải thích), trình bày
các dữ liệu và đưa ra các quyêt định.
1.2. Các loại thông kê
THỐNG KÊ MÔ TẢ (descriptive statistics): Thông kê
mô tả bao gôm các phương pháp tổ chức, trình bày và
mô tả dữ liệu bằng viec dùng các bảng, các bieu đồ và
các sô đo tóm lược (summary measures)
THỐNG KÊ SUY DIỄN: (inferential statistics):Thông
kê suy diễn bao gôm các phương pháp nhằm giúp ta
đưa ra các quyêt định, nhận định hoac dự đoán vê
tổng the dựa trên các kết quả tính toán có được từ
mẫu.
1.3. Tổng thể và mẫu:
>Tổng thể (population) bao gôm tât cả các phân tử
(hoặc đôi tượng) mà những đặc trưng (hoac thuộc tính)
của chúng ðang được ta quan tâm nghiên cứu
Một phần của tổng thể được ta chọn ra để xem xét hoặc
nghiên cứu được gọi là mẫu (sample).
Việc thu thập dữ liệu từ các phần tử của tổng thể hay mẫu
được gọi là ðiêu tra khảo sát (a survey).
Nếu việc khảo sát được tiến hành trên mọi phần tử của
tổng thể thì nó được gọi là ðiêu tra khảo sát toàn thể
(census).
Nếu việc khảo sát chỉ được tiến hành trên một phần nào
ðó của tổng thể thì nó được gọi là ðiêu tra khảo sát mâu
(sample survey).
Mục ðích chính của việc ðiêu tra khảo sát mẫu là ðưa ra
những nhận ðịnh hoặc quyêt ðịnh về tổng thể tương ứng
Mẫu mà nó biểu diễn càng gần càng
tốt các ðặc trưng của tổng thể ðược
xem là mẫu mang tính ðại diện, hay
gọi vắn tắt là mẫu ðại diện
(representative sample).
Mẫu ðược gọi là ngẫu nhiên (random
sample) nếu mẫu ðược chọn từ tổng
thể theo cách sao cho mọi phần tử
trong tổng thể ðó ðều có cơ hội ðược
chọn vào mẫu.
• Phần tử, biến, quan sát và tập dữ liệu
Phần tử (element, member) của một mẫu hay tổng
thể là một chủ the hay ðối tượng cụ thể mà ta cần
thu thập thông tin về nó.
Biến (variable) là ðặc trưng, thuộc tính hay tính
chất của phần tử mà ta ðang cần khảo sát. Ðôi với
những phần tử khác nhau, biến có thể mang
những giá trị khác nhau.
Với một phần tử ta có thể quan tâm ðến nhiều
biến khác nhau.
Giá trị của một biến ðối với một phần tử ðược gọi
là một quan sát hay một ðo lường (observation,
measurement).
Tập dữ liệu (data set) là một sự thu thập các quan
sát trên một hay nhiều biến.
2. MỘT SỐ YÊU CẦU VỀ QUAN SÁT THỐNG KÊ
2.1. Yêu cầu về tính đông đảo
- Qui luật thống kê là “định luật các số lớn” > tìm qui
luật qua đông đảo các sự kiện
- Bảng “các số liệu vừa đủ”: ԑ Độ sai lệch tương đối
của ƯL
- Độ tin cậy của ƯL
2.2.Yêu cầu về tính đại diện
- Các nhóm đối tượng được chọn
để QS có tính đại diện cho tổng
thể / toàn bộ đối tượng NC
- Các phương pháp chọn mẫu
ngẫu nhiên:
+ Phi XS:
a) Lấy mẫu thuận tiện: Không chú ý đến tính
đại diện, chỉ cần thuận tiện (dễ, gần,
nhanh) cho nhà nghiên cứu.
b) Lấy mẫu tích lũy nhanh: chọn một số
phần tử ban đầu, từ các phần tử ấy
nhân ra số phần tử thứ cấp. Ví dụ: chọn
10 học sinh trong lớp, yêu cầu 10 học
sinh đó, mỗi em chọn thêm 3 em khác
Tùy theo số phần tử định nghiên cứu, có
thể số phần tử thứ cấp ấy lại tiếp tục
chọn thêm nữa để đủ số lượng phần tử
của mẫu.
+ Chọn mẫu XS:
> Bằng cách rút thăm
> Bằng bảng ngẫu nhiên
3156 5325 6316 2354 8000 6163
7877 8832 5991 5238 0807 5277
2550 1796 4554 6380 1775 1189
5080 2105 9885 3645 6958 1740
3371 7649 9660 4899 6005 4765
> Excel
+ Lấy mẫu theo nhóm ngẫu nhiên:
Khi cuộc điều tra trên diện rộng về địa bàn hoặc nhiều đơn vị khác nhau
Ví dụ: Điều tra về học vấn của mọi người dân của một tỉnh (mẫu tổng thể -
MTT) > chọn mẫu ngẫu nhiên (mẫu nghiên cứu - MNC). Cách chọn: Giả
sử Tỉnh có 3 Huyện, các Huyện có số xã khác nhau (sơ đồ). Nếu 3
Huyện có mọi điều kiện tương đương nhau thì chúng ta có thể chọn 2
hoặc 1 Huyện làm MNC. Tuy nhiên không thể lấy hết tất cả các xã ra
NC. Vậy là phải chọn ngẫu nhiên các xã. Ở mỗi xã cũng chọn ngẫu
nhiên ấp rồi tiếp tục chọn ngẫu nhiên gia đình
2.3. Yêu cầu về tính đồng nhất
Tính đồng nhất:
Phạm trù triết học biểu hiện sự ngang nhau, tính như nhau của đối tượng, của hiện tượng với chính mình hay
sự ngang nhau của một vài đối tượng.
Mỗi sự vật hay khái niệm phải là một với bản thân nó, nguyên là nó, không phải là sự vật khác hay khái niệm
khác.
Nguyên tắc của tính ĐN thể hiện trong công thức A = A hoặc A và B là ĐN nếu như và chỉ nếu như tất cả các
đặc tính và các quan hệ tiêu biểu cho A, cũng là tiêu biểu cho B và ngược lại [quy luật của Laibnit (G. W.
Leibniz)]
Mọi tính ĐN của các sự vật đều là tạm thời, nhất thời, và tương đối, còn sự phát triển, sự thay đổi của chúng là
tuyệt đối.
PP đảm bảo TĐN:
+ San bằng điều kiện (Làm cho các ĐK như nhau/ PP đối xứng
+ Số lượng QS ít: Sử dụng PP bắt chéo (Thay đổi các nhóm thực nghiệm):
Lớp A Lớp B
GIAI ĐOẠN 1: Phương pháp 1 - Phương pháp 2
GIAI ĐOẠN 2: PP 2 PP 1
2.4. Yêu cầu về tính xác định
Cần xác định rõ cần nghiên cứu những biểu
hiện chủ yếu nào của các dấu hiệu, tính
chất, mối quan hệ /các biến
Ba loại biến:
+Biến độc lập: là những dấu hiệu, tính chất… mà trong quá trình thực nghiệm
(QS) ta sẽ thay đổi để xem cái gì sẽ xảy ra khi chúng biến đổi/ Các nhân tố
đưa vào NC: Chương trình, phương pháp,…
+ Biến phụ thuộc: nhứng dấu hiệu, tính chất đặc trưng cho kết quả áp dụng
các nhân tố NC
+ Biến kiểm tra: Các dấu hiệu, tính chất, quan hệ, Của quá trình DH không
đưa vào mục đích NC > Cần giữ như nhau trong các nhóm TN, ĐC
2.5. Yêu cầu về tính đo được
Để đo các biến cần lượng hóa: cho các
biến các đặc trưng số lượng
2.6. Yêu cầu về tính hoàn toàn tương ứng
phù hợp:
Các dấu hiệu ghi được, các đặc điểm định lượng
phải phản ánh một cách hoàn toàn tương ứng,
phù hợp với những tính chất, hiện tượng, quá
trình, /Phản ánh được bản chất của đối tượng
NC
3. VẤN ĐỀ LƯỢNG HÓA
3.1. Làm thế nào để xác định mặt số
lượng của các hiện tượng?
Căn cứ tính chất các hiện tượng, mục
đích NC
Phân tích đối tượng trên cơ sở lí luận
tâm lí, GD học
Xác định các tiêu chí và gán cho
chúng các đặc trưng định lượng
3.2. Đo: Gán số vào các đối tượng và các biến cố tương
ứng theo các qui tắc xác định
PP1: Ghi các đối tượng, hiện tượng được NC/ Tách ra một
dấu hiệu của Đối tượng, Ghi lại mỗi khi dấu hiệu xuất hiện (Ví dụ: 1, 0)
/ Cho phép NC định lượng các tính chất của quá trình GD > phát hiện
qui luật;
PP2: Xếp hạng các đối tượng, hiện tượng NC / Xếp hạng
theo thứ tự tăng hoặc giảm theo một dấu hiệu, sau đó gán cho mỗi đối
tượng một vị trí gọi là hạng của đối tượng/ Thí dụ: xếp hạng HS, bậc
thợ,
PP3: Đo bằng khoảng/ lấy một khoảng xác định các giá trị
của dấu hiệu NC làm đơn vị đo, sau đó biểu diễn giá trị của dấu hiệu
của ĐTNC bằng một số có giá trị bằng bao nhiêu lần (hoặc phần) của
đơn vị đo/ Thí dụ: thời gian làm bài đo bằng phút, số từ của một bài,…
Thang khoảng cách
Thang thứ tự: - Mức độ được học có thí nghiệm, phương tiện trực quan ;
+ đầy đủ : ;không đâỳ đủ : ; rất ít khi : ; không có :
Thang đo Likert:
Đánh giá thái độ
ĐG: sự nhận định có tính chất đo lường về một sự vật
Hướng dẫn: Khoanh tròn vào một nhận định theo ý bạn!
Mỗi năm giáo viên cần phải được tập huấn chuyên môn 1 tuần:
Rất đồng ý Đồng ý Chưa quyết định Không đồng ý Rất không đồng ý
(5) (4) (3) (2) (1)
4. TRÌNH BÀY SỐ LIỆU
1 Hai PP thông dụng
Bảng phân phối
Thí dụ: 1. Chỉ mức độ khó bằng Thời
gian làm bài
2. Có 100 HS làm 5 bài toán, mỗi HS có thể
giải 0 – 5, giả sử kết quả ghi như sau:
8 HS giải 5 bài 15 HS 4
29 HS 3 21 HS 2
17 HS 1 10 HS 0
X
HS 1 2 3
t (ph) 75 80 70
3
X
1
X
2
X
Tần số
Tần suất
0
1
2
3
4
5
10
17
21
29
15
8
0,10
0,17
0,21
0,29
0,15
0,08
i
n
i
n
n
i
i
6
1
100
i
nn
1
i
i
X
> Biểu diễn bằng đồ thị
Đường phân phối tần suất/Tần số
0
5
10
15
20
25
30
35
0 1 2 3 4 5 X
Tần suất (%)/ Tần số
ni
Nếu số liệu nhiều> Ghép thành lớp:
Số các lớp L phụ thuộc hiện tượng NC và
bảng số liệu thu được.
Thông thường chia ra 8 – 12 lớp
Bề rộng của lớp xác định qua dao động
của bảng số liệu:
Bề rộng h của mỗi lớp:
Thí dụ: Cho 100 HS làm 350 bài toán. HS
giỏi làm được 320 bài, HS kém làm 100 bài.
; ;lấy L = 11
Có: h = 20, ta có 11 lớp. Xem bảng
minmax
XXR
L
XX
h
minmax
320
max
X
100
min
X
Số các
lớp
của x
Giá trị trung
tâm của lớp
Tần số Tần
suất
100 – 120
121 – 140
141 – 160
161 – 180
181 – 200
201 – 220
221 – 240
241 – 260
261 – 280
281 – 300
301 - 320
110
130
150
170
190
210
230
250
270
290
310
2
20
60
160
250
240
180
70
15
2
1
n = 1000
0,002
0,020
0,060
0,160
0,250
0,240
0,180
0,070
0,015
0,002
0,001
= 1
i
i
n
0
50
100
150
200
250
300
0
110
130
150
170
190
210
230
250
270
290
310
X
Trình bày số liệu bằng PPchia lớp /PP thực nghiêm
PP Lí thuyết / chuẩn tắc
> Phương pháp xếp hạng
Thí dụ 1:
Kết quả bài kiểm
tra vật lí của 20 HS:
1 HS đạt 1;
3 HS đạt 2;
8 HS đạt 3;
6 HS đạt 4;
2 HS đ 5.
Dãy phân phối:
1
2 2 2
3 3 3 3 3 3 3 3
4 4 4 4
5 5
HS Xếp hạng
về toán
Xếp hạng
về lí
A1
A2
A3
A4
A5
A6
A7
A8
A9
A10
1
2
3
4
5
6
7
8
9
10
1
4
2
3
5
6
8
7
9
10
5. SỬ DỤNG PP THỐNG KÊ
ĐỂ XỬ LÍ VÀ PHÂN TÍCH CÁC DỮ LIỆU
5.1. TÍNH TẦN SỐ, TẦN SUÂT, TẦN SUẤT DỒN (LŨY TÍCH)
Thí dụ: Bảng phân phối tần suất điểm kiểm tra vật lí của 3 trường A (thực nghiệm),B, C
Trường n Số HS đạt điểm Xi
0 1 2 3 4 5 6 7 8 9 10
A
B
C
200
200
200
0
0
0
0
10
16
0
6
14
20
14
20
20
50
30
30
60
50
30
30
30
50
20
30
30
10
10
10
0
0
10
0
0
Trường n Số HS đạt điểm Xi (%)
0 1 2 3 4 5 6 7 8 9 10
A
B
C
200
200
200
0
0
0
0
5
8
0
3
7
10
7
10
10
25
15
15
30
25
15
15
15
25
10
15
15
5
5
5
0
0
5
0
0
Bảng phân bố tần số
Bảng phân bố tần suất
Lũy tích
Trường n Số % HS đạt điểm Xi trở xuống
0 1 2 3 4 5 6 7 8 9 10
A
B
C
200
200
200
0
0
0
0
5
8
0
8
15
10
15
25
20
40
40
35
70
65
50
85
80
75
95
95
90
100
100
95
100
100
100
100
100
Phân phối lũy tích
0
20
40
60
80
100
120
0 1 2 3 4 5 6 7 8 9 10 X
Điểm Xi
% HS đạt điểm Xi trở
xuống
A
B
C
Đường lũy tích
ứng với trường A
nằm bên phải và
về phía dưới
đường lũy tích
ứng với các
trường B,C
5.2. Các tham số đặc trưng bảng phân phối
5.2.1. Giá trị trung bình (Kì vọng mẫu –Mean)) số đại
diện cho bảng phân phối /đặc trưng độ tập trung: Xi là giá trị,
số phần tử lấy giá tri Xi, n số phần tử của mẫu
Công thức tính giá trị trung bình khi chia nhóm:
- Cỡ mẫu lớn ( n > 100): Chia nhóm các số liệu;
- Giả sử có n số liệu X1, X2, , Xn chia thành m khỏang, điểm giữa
các khoảng là t1, t2, …, tm; các khoảng có độ dài như nhau bằng
d. Tần số trong các khoảng là n1, n2, , nm, công thức tính giá
trị trung bình:
n
Xn
X
k
i
ii
1
i
n
Thí dụ:Bảng phân phối tần suất của thời gian đi lại từ nhà đến cơ quan của 25
nhân viên một đơn vị