Tải bản đầy đủ (.pdf) (31 trang)

Bài giảng Thống kê cho khoa học xã hội: Bài 3 - ThS. Nguyễn Thị Xuân Mai

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.08 MB, 31 trang )

GIỚI THIỆU MÔN HỌC

THỐNG KÊ CHO KHOA HỌC XÃ HỘI
Giảng viên: ThS. Nguyễn Thị Xuân Mai


BÀI 3
ƯỚC LƯỢNG VÀ KIỂM ĐỊNH
GIẢ THUYẾT THỐNG KÊ
Giảng viên: ThS. Nguyễn Thị Xuân Mai

2


MỤC TIÊU BÀI HỌC


Trình bày một số vấn đề cơ bản về điều tra chọn mẫu.



Trình bày các yếu tố của ước lượng.



Trình bày phương pháp ước lượng số trung bình của
tổng thể chung.



Trình bày phương pháp ước lượng tỷ lệ của tổng


thể chung.



Trình bày cơng thức xác định cỡ mẫu cần điều tra.



Giới thiệu một số vấn đề về kiểm định giả thuyết thống kê và các khái niệm có
liên quan.



Trình bày phương pháp kiểm định giả thuyết thống kê về giá trị trung bình của một
tổng thể chung.



Trình bày phương pháp kiểm định giả thuyết thống kê về tỷ lệ của một tổng
thể chung.
3


CÁC KIẾN THỨC CẦN CÓ
Kiến thức chung về kinh tế - xã hội.

4


HƯỚNG DẪN HỌC




Đọc tài liệu tham khảo.



Thảo luận với giáo viên và các sinh viên khác về
những vấn đề chưa hiểu rõ.



Trả lời các câu hỏi của bài học.



Đọc và tìm hiểu thêm về điều tra thống kê, điều tra
chọn mẫu và phương pháp thống kê suy luận.

5


CẤU TRÚC NỘI DUNG

3.1

Điều tra chọn mẫu

3.2


Ước lượng số trung bình và tỷ lệ từ kết quả điều tra
chọn mẫu

3.3

Kiểm định giả thuyết thống kê

6


3.1. ĐIỀU TRA CHỌN MẪU

3.1.1. Khái niệm điều tra
chọn mẫu

3.1.2. Ưu nhược điểm
của điều tra chọn mẫu

3.1.3. Sai số trong điều
tra chọn mẫu

7


3.1.1. KHÁI NIỆM ĐIỀU TRA CHỌN MẪU


Điều tra chọn mẫu là một loại điều tra khơng tồn bộ trong đó người ta chỉ chọn ra
một số đơn vị thuộc đối tượng nghiên cứu để tiến hành điều tra thực tế. Các đơn vị
này được chọn theo những quy tắc nhất định để đảm bảo tính đại biểu. Kết quả của

điều tra chọn mẫu được dùng để suy rộng cho tổng thể chung.



Các khái niệm liên quan:
 Chọn mẫu ngẫu nhiên: Là phương pháp tổ chức chọn mẫu một cách hoàn tồn
ngẫu nhiên khơng qua một sự sắp xếp nào. Ví dụ: bốc thăm, quay số hoặc chọn
theo bảng số ngẫu nhiên hay chọn bất kỳ.
Có nhiều phương pháp chọn mẫu ngẫu nhiên: chọn ngẫu nhiên giản đơn, chọn
mẫu hệ thống, chọn mẫu chùm, chọn mẫu phân tầng, chọn mẫu phân tổ.

 X i pháp chọn đơn vị điều
 xphụ
 Chọn mẫu phi ngẫu nhiên: là phương
tra
thuộc vào
i

x
N trên những thông tin đã biết
n về tổng thể.
ý muốn chủ quan của người chọn, dựa
*
*
N
n
Ví dụ: chọn đơn vị trung bình, chọn
p  chuyên gia.
f 
N


2 

n

  Xi  
N

2

S2 



xi  x



2

n 1
8


3.1.1. KHÁI NIỆM ĐIỀU TRA CHỌN MẪU


Tổng thể chung là một tập hợp bao gồm toàn bộ các đối tượng nghiên cứu.
→ Xác định đúng tổng thể nghiên cứu rất quan trọng. Việc xác định sai sẽ dẫn đến
kết quả tính tốn trên mẫu bị chệch và dẫn đến sai số phi chọn mẫu.




Tổng thể mẫu (cịn gọi là mẫu) là một tập hợp con được rút ra từ tổng thể nghiên cứu.
→ Điều tra chọn mẫu là thu thập thơng tin từ các đơn vị trong mẫu.



Suy rộng (ước lượng) từ các tham số (mức độ) tính tốn được trên các đơn vị điều
tra (TTM) suy ra các tham số tương ứng của tồn bộ hiện tượng (TTC).

Qui mơ

Tổng thể chung

Tổng thể mẫu

N

n

hoặc 2 = p(1- p)

hoặc S2 = f(1 – f)

Số trung bình
Tỷ lệ theo một tiêu thức

Phương sai
9



3.1.2. ƯU NHƯỢC ĐIỂM CỦA ĐIỀU TRA CHỌN MẪU


Ưu điểm:
 Tiết kiệm hơn về mặt thời gian và chi phí so với điều tra tồn bộ.
 Do điều tra ít đơn vị nên có thể mở rộng nội dung điều tra đi sâu nghiên cứu chi
tiết nhiều mặt của hiện tượng.
 Tài liệu thu được trong điều tra chọn mẫu có độ chính xác cao hơn do giảm được
sai số phi chọn mẫu.
 Tiến hành nhanh gọn, bảo đảm tính kịp thời của số liệu thống kê. Mặt khác, điều
tra chọn mẫu khơng địi hỏi phải có tổ chức lớn, chỉ cần một cơ quan hoặc một
nhóm người cũng có thể tiến hành điều tra được.



Nhược điểm:
 Khơng cho biết thông tin đầy đủ, chi tiết về từng đơn vị tổng thể, không cho biết
qui mô tổng thể.
 Do chỉ tiến hành điều tra một số đơn vị rồi dùng kết quả để suy rộng cho toàn bộ
tổng thể nên chắc chắn không tránh khỏi sai số khi suy rộng.
 Kết quả điều tra chọn mẫu không thể tiến hành phân nhỏ theo mọi phạm vi và
tiêu thức nghiên cứu như điều tra tồn bộ mà chỉ có thể thực hiện ở một mức độ
nhất định tuỳ thuộc vào quy mô mẫu và cách rải mẫu.
10


3.1.2. ƯU NHƯỢC ĐIỂM CỦA ĐIỀU TRA CHỌN MẪU



Trường hợp vận dụng điều tra chọn mẫu:
 Sử dụng để thay thế cho điều tra toàn bộ trong trường hợp đối tượng nghiên cứu
cho phép vừa có thể điều tra tồn bộ vừa có thể điều tra chọn mẫu hoặc với
những trường hợp khơng cho phép điều tra tồn bộ, hoặc do quy mơ điều tra
tồn bộ q lớn, cần thu thập nhiều chỉ tiêu nhưng khơng đủ kinh phí và nhân lực
để tiến hành điều tra toàn bộ.
 Kết hợp với điều tra toàn bộ để mở rộng nội dung điều tra và đánh giá kết quả
của điều tra toàn bộ.
 Sử dụng để tổng hợp nhanh tài liệu của điều tra tồn bộ phục vụ kịp thời u cầu
thơng tin cho các đối tượng sử dụng.
 Sử dụng trong trường hợp muốn so sánh các hiện tượng với nhau hoặc muốn
đưa ra một nhận định nào đó mà chưa có tài liệu cụ thể (để kiểm tra giả thuyết
thống kê).

11


3.1.3. SAI SỐ TRONG ĐIỀU TRA CHỌN MẪU


Sai số trong điều tra thống kê là chênh lệch giữa giá trị thu được qua điều tra và
giá trị thực tế của nó.
→ là vấn đề khơng thể tránh khỏi trong các cuộc điều tra.
→ gây ảnh hưởng đến độ tin cậy của kết quả điều tra.



Có hai loại sai số trong điều tra thống kê:
 Sai số phi chọn mẫu, xảy ra ở tất cả các cuộc điều tra. Nguyên nhân: xác định

sai mục đích, xác định đối tượng điều tra không phù hợp, đơn vị điều tra không
trả lời hoặc trả lời sai, lỗi trong bảng hỏi, điều tra viên…
→ Nếu sai số là ngẫu nhiên thì khi điều tra một số lớn đơn vị, các sai số sẽ bù trừ
cho nhau. Nếu sai số có hệ thống thì càng điều tra nhiều đơn vị, sai số càng lớn.
 Sai số chọn mẫu, chỉ xảy ra trong điều tra chọn mẫu. Đó là sự khác biệt giữa giá
trị ước lượng của mẫu và giá trị của tổng thể chung. Sai số chọn mẫu cịn gọi là sai
số do tính đại biểu, xảy ra do mẫu điều tra không đại diện cho tổng thể chung.
→ Do sai số phi chọn mẫu khơng tính được nên phần dưới đây chỉ đề cập tới sai
số chọn mẫu.
12


3.1.3. SAI SỐ TRONG ĐIỀU TRA CHỌN MẪU


Các nhân tố tác động đến sai số chọn mẫu, gồm có:
 Số đơn vị tổng thể mẫu n: Khi số đơn vị điều tra tăng lên, tổng thể mẫu sẽ gần
với tổng thể chung, sai số chọn mẫu sẽ giảm.
 Phương pháp tổ chức chọn mẫu: Các phương pháp chọn mẫu khác nhau, tính đại
diện của mẫu chọn ra khác nhau sẽ dẫn đến những sai số chọn mẫu khác nhau.
 Độ đồng đều của tổng thể chung: nếu tổng thể có độ đồng đều cao tức phương
sai tổng thể 2 tương đối nhỏ thì sai số chọn mẫu sẽ nhỏ.



Sai số chọn mẫu không phải là một trị số cố định. Với cùng một hiện tượng nhưng
nếu tiến hành điều tra nhiều lần với các cách chọn mẫu khác nhau, kết cấu của tổng
thể mẫu khác nhau thì sẽ có các sai số chọn mẫu khác nhau.




Giá trị của sai số chọn mẫu ảnh hưởng rất nhiều đến ước lượng khoảng tin cậy của
các tham số.

13


3.2. ƯỚC LƯỢNG SỐ TRUNG BÌNH VÀ TỶ LỆ TỪ KẾT QUẢ ĐIỀU TRA CHỌN MẪU

3.2.1. Các yếu tố của
ước lượng

3.2.2. Ước lượng số trung
bình của tổng thể chung

3.2.3. Ước lượng tỷ lệ của
tổng thể chung

3.2.4. Xác định cỡ mẫu
điều tra
14


3.2.1. CÁC YẾU TỐ CỦA ƯỚC LƯỢNG
Ước lượng khoảng tin cậy là xác định một khoảng giá trị mà tham số của tổng thể
chung rơi vào đó với xác suất nhất định.





Khoảng giá trị này gọi là khoảng tin cậy, được xác định bởi hai giới hạn: giới hạn tin
cậy dưới và giới hạn tin cậy trên.
Thống kê mẫu
Khoảng tin cậy

Giới hạn tin cậy dưới
Giới hạn tin cậy trên
Độ tin cậy là xác suất để tham số của tổng thể chung rơi vào trong khoảng tin cậy
đó, được ký hiệu là (1-α) %, chẳng hạn 90%, 95%, 99%...
→ α chính là xác suất để tham số của tổng thể chung không rơi vào trong khoảng
tin cậy.

15


3.2.2. ƯỚC LƯỢNG SỐ TRUNG BÌNH CỦA TỔNG THỂ CHUNG


Trường hợp đã biết phương sai của tổng thể chung (2)
 Điều kiện: tổng thể chung phân phối chuẩn. Trong trường hợp không phân phối
chuẩn, phải sử dụng mẫu lớn.
 Khoảng tin cậy ước lượng cho số trung bình của tổng thể chung là:

x x    x x

Trong đó:  x là sai số chọn mẫu (sampling error) khi ước lượng số trung bình của
tổng thể chung.

 x  z  / 2 . x  z  / 2
n



Trường hợp chưa biết phương sai của tổng thể chung (2).
 Điều kiện: áp dụng khi tổng thể chung phân bố chuẩn và sử dụng phân
vị Student.
 Khoảng tin cậy ước lượng cho số trung bình của tổng thể chung là:

x x    x x

Trong đó:  x là sai số chọn mẫu khi ước lượng số trung bình của tổng thể chung.

x  t  / 2,(n1) .x  t  / 2,(n1)

s
n

16


3.2.2. ƯỚC LƯỢNG SỐ TRUNG BÌNH CỦA TỔNG THỂ CHUNG
Ví dụ: Một mẫu gồm 20 nhân viên được tiến hành điều tra nhằm thu thập thông tin liên
quan đến một chương trình đào tạo. Người ta tính được thời gian trung bình để hồn tất
chương trình của 20 nhân viên này là 51,5 ngày với độ lệch tiêu chuẩn là 6,84 ngày.
Hãy ước lượng thời gian trung bình để hồn tất chương trình với độ tin cậy 95%.


Do chưa biết phương sai của tổng thể chung nên sẽ dùng phương sai của tổng thể
mẫu để ước lượng.




Tra bảng t-Student với mức ý nghĩa 0,05 và 19 bậc tự do, t0,025;19 = 2,093.



Cơng thức ước lượng:



 6,84 
51,5  2, 093. 
 hay 51,5  3, 2
 20 
Kết luận: Với mẫu đã cho, khoảng tin cậy 95% cho thời gian trung bình để hồn tất
chương trình là:

48,3    54, 7 (ngày)

17


3.2.3. ƯỚC LƯỢNG TỶ LỆ CỦA TỔNG THỂ CHUNG


Theo tiêu thức nghiên cứu, tổng thể chỉ có 2 loại biểu hiện. Khi đó tổng thể chung có
phân phối nhị thức. Phân phối xấp xỉ chuẩn được sử dụng.



Với mẫu đủ lớn (n.p  5 và n(1-p)  5), công thức ước lượng khoảng tin cậy cho tỷ lệ

của tổng thể chung như sau:
Trong đó:

f  f  p  f  f

 f là sai số chọn mẫu khi ước lượng tỷ lệ của tổng thể chung.
f  z / 2 .

f (1  f )
n

 z/2 là giá trị tới hạn của phân phối chuẩn.

18


3.2.4. XÁC ĐỊNH CỠ MẪU ĐIỀU TRA
Cơ sở xác định cỡ mẫu:


Sai số chọn mẫu là nhỏ nhất.



Chi phí điều tra là thấp nhất.
→ Đây là hai yêu cầu đối lập nhau
→ Khi xác định cỡ mẫu thường dựa vào độ chính xác trong ước lượng.




Cỡ mẫu được xác định khi ước lượng số trung bình là:

Z 2/2 2
n
 2x

Ví dụ: Cỡ mẫu là bao nhiêu để khoảng tin cậy 90% khi ước lượng số trung bình nằm
trong phạm vi  5. Một nghiên cứu đã cho rằng độ lệch chuẩn là 45.

Z 2/ 2  2 1, 6452.452
n

 219, 2  220
2
2
5
x

Cỡ mẫu được xác định khi ước lượng tỷ lệ là:

n

Z 2/ 2 p 1  p 
 2f

Lưu ý: Cỡ mẫu ln làm trịn lên.

19



3.2.4. XÁC ĐỊNH CỠ MẪU ĐIỀU TRA
Để xác định cỡ mẫu, cần phải biết 3 yếu tố:


Độ tin cậy mong muốn, được xác định bằng giá trị z/2.



Sai số chọn mẫu có thể chấp nhận được, .



Độ lệch tiêu chuẩn của tổng thể, , là yếu tố thường không biết trong đa phần các
trường hợp. Có một số cách để xác định giá trị  này như sau:
 Lấy phương sai lớn nhất trong các lần điều tra trước (nếu có).
 Lấy phương sai của các hiện tượng khác tương tự (nếu có).
 Điều tra thí điểm để tính phương sai.
 Có thể ước lượng độ lệch tiêu chuẩn qua khoảng biến thiên tùy theo phân phối
của tổng thể. Cụ thể, nếu tổng thể có phân phối chuẩn thì:



R xmax  xmin

6
6

20



3.3. KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

3.3.1. Một số vấn đề
chung về kiểm định giả
thuyết thống kê

3.3.2. Kiểm định giả
thuyết về giá trị trung
bình của tổng thể chung

3.3.3. Kiểm định giả
thuyết về tỷ lệ của tổng
thể chung

21


3.3.1. MỘT SỐ VẤN ĐỀ CHUNG VỀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ


Giả thuyết thống kê là giả thuyết về một vấn đề nào đó của tổng thể chung.
Cặp giả thuyết thống kê gồm:
 Giả thuyết không (H0) là giả thuyết mà ta muốn kiểm định.
 Giả thuyết đối (H1) là giả thuyết đối lập với H0.



Kiểm định thống kê là tìm ra kết luận về việc thừa nhận hay bác bỏ giả thuyết đó dựa
vào thơng tin thực nghiệm của mẫu.
Các loại kiểm định:

 Kiểm định hai phía;
 Kiểm định phía trái;
 Kiểm định phía phải.

22


3.3.1. MỘT SỐ VẤN ĐỀ CHUNG VỀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Kiểm định 2 phía là bác bỏ giả thuyết H0
khi tham số đặc trưng của mẫu cao hơn
hoặc thấp hơn so với giá trị của giả thuyết
về tổng thể chung. Kiểm định 2 phía có 2
miền bác bỏ.

Kiểm định phía trái là bác bỏ giả thuyết
H0 khi tham số đặc trưng của mẫu nhỏ hơn
một cách đáng kể so với giá trị của giả
thuyết H0. Miền bác bỏ nằm ở phía trái của
đường phân phối.

Kiểm định phía phải là bác bỏ giả thuyết
H0 khi tham số đặc trưng của mẫu lớn hơn
một cách đáng kể so với giá trị của giả
thuyết H0. Miền bác bỏ nằm ở phía phải
của đường phân phối.
23


3.3.1. MỘT SỐ VẤN ĐỀ CHUNG VỀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ (tiếp theo)



Sai lầm và mức ý nghĩa trong kiểm định
Khi phải lựa chọn giữa hai giả thuyết H0 và H1, có thể mắc phải:
 Sai lầm loại 1 là bác bỏ giả thuyết H0 khi nó đúng.
 Sai lầm loại 2 là thừa nhận H0 khi nó sai.
Kết luận



Thực tế

Chấp nhận H0

Bác bỏ H0 nhận H1

H0 đúng

Kết luận đúng

Sai lầm loại 1

H0 sai

Sai lầm loại 2

Kết luận đúng




Xác suất mắc sai lầm loại 1 gọi là mức ý nghĩa, được ký hiệu là .



Xác suất mắc sai lầm loại 2 gọi là β; 1- β được gọi là lực của kiểm định.

Tiêu chuẩn kiểm định
Tiêu chuẩn kiểm định là một thống kê nào đó tuân theo quy luật phân phối xác suất
xác định (quy luật phân phối chuẩn, phân phối T-Student, phân phối 2, phân phối
Fisher...) khi giả thuyết không đúng.
 Trong tập hợp các kiểm định thống kê có cùng mức ý nghĩa , kiểm định nào có
xác suất mắc sai lầm loại 2 nhỏ nhất sẽ được xem là “tốt nhất”.
24


3.3.1. MỘT SỐ VẤN ĐỀ CHUNG VỀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ (tiếp theo)


Các bước tiến hành một kiểm định giả thiết thống kế
 Phát biểu giả thuyết H0 và giả thuyết đối H1.
 Định rõ mức ý nghĩa .
 Chọn tiêu chuẩn kiểm định.
 Tính giá trị của tiêu chuẩn kiểm định từ mẫu quan sát.
 Kết luận:
 Nếu giá trị của tiêu chuẩn kiểm định thuộc miền bác bỏ: H0 sai, bác bỏ giả
thuyết H0.
 Nếu giá trị của tiêu chuẩn kiểm định thuộc miền chấp nhận: với mẫu cụ thể
này chưa đủ cơ sở để bác bỏ H0.
t


x  0 1344, 27  1123

 3, 71
S n
231 15

25


×