Tải bản đầy đủ (.ppt) (44 trang)

Kiểm định thống kê pot

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (728.42 KB, 44 trang )

Bài 4
Bài 4
KIỂM ĐỊNH THỐNG KÊ
KIỂM ĐỊNH THỐNG KÊ
1. Kiểm định trung bình
2. Kiểm định phi tham số
3. Kiểm định Khi bình phương
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại
iafi re.com/?1j5bcyb3as c8n
1.1. Kiểm định t-một mẫu
Phương pháp kiểm nghiệp một mẫu được dùng để kiểm định có
hay không sự khác biệt của giá trị trung bình của một biến đơn
với một giá trị cụ thể, với giả thuyết ban đầu cho rằng giá trị
trung bình cần kiểm nghiệm thì bằng với một con số cụ thể nào
đó.
Phương pháp kiểm nghiệm này dùng cho biến dạng thang đo
khoảng cách hay tỉ lệ. Ta sẽ loại bỏ giả thuyết ban đầu khi kiểm
nghiệm chó ta chỉ số Sig. nhỏ hơn mức tinh cậy (0.05).
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại
iafi re.com/?1j5bcyb3as c8n
Compare Mean\One-Sample T Test…
Compare Mean\One-Sample T Test…


Lựa chọn biến cần so sánh bằng
cách di chuyển vệt đen và
chuyển đến vào hộp thoại Test
Variable(s), nhập giá trị cần so
sánh vào hộp thoại Test Value
Options để xác định độ tin cậy
cho kiểm nghiệm, mặc định là


95% và cách xữ lý đối với các
giá trị khuyết
Exclude cases analysis by analysis.
Mỗi kiểm nghiệm T sử dụng toàn bộ
các trường hợp (cases) chứa đựng giá
trị có ý nghĩa đối với biến được kiểm
nghiệm. Đặc điểm là kích thước mẫu
luôn thay đổi.
Exclude cases listwise. Mỗi kiểm
nghiệm T sử dụng chỉ những trường
hợp có giá trị đối với toàn bộ tất cả các
biến được sử dụng trong bất kỳ kiểm
nghiệm T test nào. Kích thước mẫu
luôn không đổi
1.2. Kiểm định t hai mẫu độc lập
Kiểm định này dùng cho hai mẫu độc lập, dạng dữ liệu là dạng
thang đo khoảng cách hoặc tỷ lệ
Đối với dạng kiểm định này, các chủ thể cần kiểm định phải
được ấn định một cách ngẫu nhiên cho hai nhóm dữ liệu cần
nghiên cứu sao cho bất kỳ một khác biệt nào từ kết quả
nghiên cứu là do sự tác động của chính nhóm thử đó, chứ
không phải do các yếu tố khác
Các dữ liệu cần so sánh nằm trong cùng một biến định lượng.
Để so sánh ta tiến hành nhóm các giá trị thành hai nhóm để
tiến hành so sánh. Giả thuyết ban đầu cần kiểm định là giá trị
trung bình của một biến nào đó thì bằng nhau giữa hai nhóm
mẫu và chúng ta sẽ từ chối giả thuyết này khi mà chỉ số Sig.
nhỏ hơn mức ý nghĩa (thường là 0.05)
Compare means\Independent
Compare means\Independent

sample t-test….
sample t-test….


Chuyển biến định lượng cần so
sánh trung bình vào hộp thoại Test
variable(s). Ta có thể chọn nhiều
biến định lượng để so sánh.
Định ra các nhóm cần so sánh với
nhau (thường là biến định danh) di
chuyển vào hộp thoại Gouping
variable.
Công cụ Define Groups… cho
phép ta định ra hai nhóm cần so
sánh với nhau
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại
iafi re.com/?1j5bcyb3as c8n
Independent sample t-test
Independent sample t-test


Có hai cánh định nhóm so sánh:

Sử dụng con số cụ thể, nhập hai giá trị đại diện cho hai nhóm
cần so sánh trong biến vào ô group 1 và group 2

Cách thứ hai sử dụng Cut point, nhập giá tri phân cách các giá
trị trong biến thành hai nhóm. Toàn bộ các trường hợp có giá trị
(con số mã hóa) nhỏ hơn giá trị được nhập vào trong cut point
sẽ định ra một nhóm, và toàn bộ các trường hợp có giá trị mã hóa

lớn hơn hoặc bằng giá trị trong Cut point sẽ tạo ra một nhóm
khác.
Options để xác định độ tin cậy cho kiểm nghiệm, mặc định là
95% và cách xữ lý đối với các giá trị khuyết
1.3. Kiểm định t theo
từng cặp mẫu
Đây là dạng kiểm định dùng cho hai biến trong cùng một mẫu
có liên hệ với nhau, dữ liệu dạng thang đó khoảng cách hoặc
tỷ lệ. Nó tính toán sự khác biệt giữa các giá trị của hai biến
cho mỗi trường hợp và kiểm định xem giá trị trung bình các
khác biệt có khác 0 hay không. Giả thuyết ban đầu được đưa
ra là giá trị trung bình của các khác biệt là bằng 0. Và ta sẽ
loại bỏ giả thuyết này trong trường hợp kiểm định cho kết quả
Sig. nhỏ hơn mức ý nghĩa (0.05)
Điều kiện yêu cầu cho loại kiểm định này là kích cở hai mẫu
so sánh phải bằng nhau. Các quan sát cho mỗi bên so sánh
phải được thực hiện trong cùng những điều kiện giống nhau.
Các khác biệt từ giá trị trung bình của hai mẫu phải là phân
phối chuẩn hoặc số lượng mẫu đủ lớn để xấp xỉ là phân phối
chuẩn
Bài toán tổng quát
Bài toán tổng quát
Bài toán tổng quát như sau: Giả sử có hai tổng thể chung: Tổng thể
chung thứ nhất có các lượng biến của tiêu thức X1 phân phối theo quy
luật chuẩn N (µ1, ) và tổng thể chung thứ hai có các lượng biến của
tiêu thức X2 phân phối theo quy luật chuẩn N (µ2, ). Muốn so sánh sự
khác nhau giữa µ1 và µ2 ta xét độ lệch trung bình µd . Ta chưa biết µd
nhưng nếu có cơ sở để giả thiết rằng giá trị của nó bằng µ0 , ta đua ra
giả thiết thống kê H0 : µd = µ0.
Để kiểm định giả thiết trên, từ hai tổng thể chung người ta rút ra hai

mẫu phụ thuộc được hình thành bởi các cặp n quan sát độc lập của hai
mẫu, từ đó tính là trung bình của các độ lệch giữa các cặp giá trị của
hai mẫu di. Như vậy ta đưa bài toán so sánh về bài toán kiểm định giả
thiết về giá trị trung bình đã xét ở phần I. Tuy nhiên ở đây thường
không biết phương sai của các độ lệch của tổng thể chung nên thay
bằng phương sai của các độ lệch của tổng thể mẫu , và dùng tiêu
chuẩn kiểm định t :
( )
d
S
nd
t
0
µ−
=
Nhận xét
Nhận xét
Phương pháp so sánh từng cặp như trên có ưu điểm hơn phương pháp
so sánh hai mẫu độc lập ở chỗ:
- Nó không cần giả thiết gì về phương sai của hai tổng thể chung

- Nó thường cho kết quả chính xác hơn vì đã bỏ được các nhân tố
ngoại lai ảnh hưởng đến giá trị trung bình. Tuy nhiên nhược điểm của
nó là việc bố trí thí nghiệm (điều tra) phức tạp hơn, chẳng hạn trong
ví dụ trên phương pháp so sánh từng cặp đòi hỏi phải trồng lúa thí
nghiệm trên hai mảnh của cùng một thửa ruộng với hai loại giống
khác nhau.
Compare means\Paired-
Compare means\Paired-
samples t-test

samples t-test


Chọn hai biến ta cần so sánh di
chuyển vào hộp thoại Paired
Variables bằng nút mũi tên.
Paired-samples t test còn cho
ta kết quả về mối tương quan
giữa hai biến đang quan sát. Cho
biết liệu hai biến này có tương
quan với nhau hay không, độ
tương quan và chiều tương quan
(thể hiện ở bảng Paired
samples correlation).
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại
iafi re.com/?1j5bcyb3as c8n
1.4. Phân tích phương sai một
chiều (One way ANOVA)
Phương pháp kiểm định sẽ mở rộng cho trường hợp so sánh trung
bình của nhiều tổng thể được xây dựng trên việc xem xét các biến
thiên (phương sai) của các giá trị quan sát trong nội bộ từng
nhóm (mẫu) và giữa các nhóm (mẫu) với nhau. Ở đây đề cập đến
phân tích phương sai một yếu tố là trường hợp chỉ có một yếu tố
(biến kiểm soát) được xem xét nhằm xác định ảnh hưởng của nó
đến một yếu tố khác. Yếu tố được xem xét ảnh hưởng được dùng
để phân loại các quan sát thành các nhóm nhỏ khác nhau.
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại
iafi re.com/?1j5bcyb3as c8n
Bài toán tổng quát
Bài toán tổng quát

Giả sử ta có k tổng thể chung X1, X2, , Xk có phân phối chuẩn,
trong đó Xi ~ N( µi , ). Các giá trị trung bình µi chưa biết song có cơ
sở giả thiết rằng là chúng bằng nhau, ta có giả thiết cần kiểm định là
H0: µ1 = µ2 = = µk .
Trong thống kê vấn đề trên thường được xem xét dưới góc độ
sau đây: Giả sử chúng ta quan tâm tới một nhân tố X nào đó. Nhân tố
X có thể xem xét ở k mức độ khác nhau. Ký hiệu Xi là hiệu quả của
việc tác động của nhân tố X ở mức i . Như vậy µi là hiệu quả trung
bình của nhân tố X ở mức i. Chúng ta muốn biết khi cho nhân tố X
thay đổi ở các mức khác nhau thì điều đó có ảnh hương hay không tới
hiệu quả trung bình. Chẳng hạn, chúng ta muốn nghiên cứu ảnh
hưởng của giống tới năng suất cây trồng. Nhân tố ở đây là giống, các
loại giống khác nhau là các mức của nhân tố. Hiệu quả của giống lên
năng suất cây trồng được đo bằng sản lượng của cây trồng. Như vậy
Xi chính là sản lượng của giống i và µi là sản lượng trung bình của
giống i.
Trình bày số liệu tổng quát
Trình bày số liệu tổng quát

=
=
k
1j
j
nn

=
=
k
1j

j
TT
1
x
2
x

j
x
k
x
n/Tx =
Các nhân tố
1 2 j k
x
11
x
21
x
i1
x
1k
x
21
x
22
x
2k
x
i1

x
ik

x
n11
x
n22
x
nkk
Tổng số T
1
T
2
T
k
Trung
bình
Các bước kiểm định
Các bước kiểm định
Bước 1: Tính các trung bình.
+ Trung bình của các mẫu:
+ Trung bình chung:
i
n
1j
ji
i
i
i
n

x
n
T
x
i

=
==
n
x
n
T
n
T
x
k
1j
n
1i
ij
k
1j
j
j
∑ ∑∑
= ==
===
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại
iafi re.com/?1j5bcyb3as c8n
Các bước kiểm định

Các bước kiểm định
Bước 2: Tính các tổng bình phương độ lệch.
+ Tổng bình phương chung, ký hiệu là SST (Total Sum of Squares):

+ Tổng bình phương do ảnh hưởng của nhân tố, ký hiệu là SSF
(Sum of Squares for Factor):
+ Tổng bình phương do sai số, ký hiệu là SSE (Sum of Squares for
Error):
Từ các công thức trên, ta thấy:
SST = SSF + SSE
( )
∑∑∑∑
−=−=
i j
2
2
ij
2
i j
ij
n
T
xxxSST
( )
n
T
n
T
n.xxSSF
2

k
1j
j
2
j
j
2
k
1j
j
−=−=
∑∑
==
( )
∑∑ ∑∑∑
−=−=
i j j
j
2
j
2
ij
2
i j
jij
n
T
xxxSSE
Các bước kiểm định
Các bước kiểm định

Bước 3: Tính các phương sai tương ứng.
+ Phương sai do ảnh hưởng của nhân tố (hay phương sai giữa các
mẫu), ký hiệu là MSF (Mean Square for Factor):

trong đó (k - 1) được gọi là bậc tự do của nhân tố.
+ Phương sai do sai số (hay phương sai trong các mẫu), ký hiệu là
MSE (Mean Square for Error):
trong đó (n - k) được gọi là bậc tự do của sai số.
1k
SSF
MSF

=
kn
SSE
MSE

=
Các bước kiểm định
Các bước kiểm định
Bước 4: Kiểm định giả thiết.
Giả thiết H0: µ1 = µ2 = = µk .
H1: Tồn tại ít nhất 1 cặp µj ≠ µj với j ≠ j’ .
Các kết quả nói trên được trình bày trong bảng sau đây và được
gọi là bảng ANOVA (Analysis of Variance : Phân tích phương sai).
MSE
MSF
F =
Nguồn Tổng bình
phương

Bậc tự do Phương sai (TB
bình phương)
Tỷ số F
Nhân tố SSF k - 1 MSF
Sai số SSE n - k MSE
Tổng SST n - 1
Người ta chứng minh được rằng nếu giả thiết H0 đúng thì tỷ số
sẽ có phân phối Fisher với bậc tự do là (k - 1, n - k). Giả thiết H0
sẽ bị bác bỏ ở mức ý nghĩa α, nếu F > Fα, (k-1),( n-k) .
Comapre means\One-
Comapre means\One-
Way ANOVA
Way ANOVA


Chuyển các biến định lượng cần so
sánh sang hộp thoại Dependent List.
Lựa biến kiểm soát tức là biến độc lập
(yêu cầu phải có ba giá trị trở lên trong
biến kiểm soát này) chuyển biến kiểm
soát vào hộp thoại Factor, Biến kiểm
soát này cho phép ta phân các giá trị
trung bình theo từng nhóm để kiểm
định. Thao tác đến đây cho phép ta
đưa ra kết luận liệu các trung bình của
các nhóm có bằng nhau hay không.
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại
iafi re.com/?1j5bcyb3as c8n
Để tiến hành kiểm định so sánh sự khác biệt giữa các nhóm với
nhau ta lựa chọn công cụ Post Hoc và lựa chọn các phương pháp

kiểm định thích hợp
Đối với trường hợp giả thuyết về sự cân bằng phương sai giữa các mẫu
không được chấp nhận ta sẽ sử dụng các phương pháp kiểm định sau để
tiến hành so sánh giá trị trung bình giữa các nhóm:Tamhane’s T2,
Dunnett’s T3, Games-Howell, Dunnett’s C
phương pháp kiểm định thống kê
so sánh các trung bình mẫu

The least significant difference (LSD) là phép kiểm định
tương đương với việc sử dụng phương pháp kiểm định t riêng biệt
cho toàn bộ các cặp trong biến. Yếu điểm của phương pháp này là
nó không chỉnh lý độ tin cậy cho tương thich với việc kiểm định
cho nhiều so sánh cùng một lúc. Do đó dẫn đến độ tin cậy không
cao.

Phương pháp kiểm định Bonferroni và Tukey’s honestly
significant difference thì được sử dụng cho hầu hết các kiểm
định so sánh đa bội. Kiểm định Sidak’s t test cũng được sử dụng
tương tư như phương pháp Bonferroni tuy nhiên nó cung cấp
những giới hạn chặt chẻ hơn. Khi tiến hành kiểm định một số
lượng lớn các cặp trung bình Tukey’s honestly significant
difference test sẽ có tác động mạnh hơn là Bonferroni test. Và
ngược lại Bonferroni thì thích hợp hơn cho các kiểm định có số
lượng cặp so sánh ít.
phương pháp kiểm định thống kê
so sánh các trung bình mẫu

Hochberg’s GT2 thì giống như Tukey’s honestly significant
difference test nhưng thông thường Tukey’s test có tác dụng
tốt hơn. Gabriel’s pairwise comparisons test thì giống như

Hochberg’s GT2 nhưng nó thường được sử dụng hơn khi kích cở
giữa các mẫu kiểm định có sự sai biệt lớn

Phương pháp kiểm định Dunnett’s pairwise được dùng để so
sánh các giá trị trung bình của các mẫu với một gía trị trung bình
cụ thể được lấy từ trong tập các mẫu so sánh.
phương pháp kiểm định thống kê
so sánh các trung bình mẫu

Ryan, Einot, Gabriel, and Welsch (R-E-G-W) đưa ra hai
bước kiểm định. Đầu tiên tiến hành kiểm định có hay không toàn
bộ các giá trị trung bình là ngang bằng nhau hay không. Nếu toàn
bộ các giá trị trung bình là không ngang bằng nhau sau đó bước
thứ hai sẽ kiểm định sự khác biệt giữa các nhóm nhỏ với nhau, để
tìm ra những nhóm nào thật sự khác biệt và không khác biệt về
giá trị trung bình. Tuy nhiên việc kiểm định này không nên thực
hiện đối với trường hợp kích cở mẫu trong các nhóm không ngang
bằng nhau

Thông thường khi kích thước mẫu không ngang bằng giữa các
nhóm. Bonferroni và Scheffé là hai phương pháp kiểm định
được lựa chọn hơn là phương pháp Tukey
phương pháp kiểm định thống kê
so sánh các trung bình mẫu

Duncan’s multiple range test, Student-Newman-Keuls
(S-N-K), and Tukey’s b cũng tương tự tuy nhiên nó ít khi được
sử dụng như các phương pháp trên.

Kiểm định Waller-Duncan t được sử dụng khi kích thước mẫu

là không bằng nhau

Phương pháp kiểm định Scheffé cho phép sự kết hợp tuyến
tính của những giá trị trung bình sẽ được kiểm định, không chỉ là
so sánh giữa các cặp. Chính vì vậy kết quả của kiểm định
Scheffé thì thường thận trọng hơn các phương pháp kiểm định
khác, nó đòi hỏi một sự khác biệt lớn giữa các giá trị trung bình
quan sát được để bảo đảm tính thật sự khác biệt của phép kiểm
định
One-Way ANOVA: Option
One-Way ANOVA: Option
công cụ Options để xác định loại loại thông kê
mô tả (Descriptive) và tính đồng nhất của
phương sai, công cụ để tính hệ số thống kê
Levene để kiểm định sự ngang bằng về phương
sai giữa các nhóm (việc tính toán này quyết
định đến sự lưa chon phương pháp kiểm định
trong phần Post Hoc.
Công cụ Means Plot dùng để hiển thị đồ thị về giá tri trung bình của các
nhóm. Công cụ Missing Values dùng để kiểm soát giá trị khuyết.
Exclude cases analysis by analysis: Những trường hợp có giá trị
khuyết ở trong biến phụ thuộc và cả biến kiểm soát sẽ không được đưa
vào trong kiểm định. Ngoài ra những trường hợp có giá trị quan sát nằm
bên ngoài chuổi đã xác định cho biến kiểm soát cũng không được sử
dụng
Exclude cases listwise. Những trường hợp có giá trị khuyết Cases trong
biến điều khiển hoặc bất kỳ biến phụ thuộc nào được đưa ra hoặc không đưa
ra kiểm định đều bị loại trừ ra khỏi quá trình kiểm định phân tích .
2. Kiểm định phi tham số
2. Kiểm định phi tham số

Các tiêu chuẩn thống kê để kiểm định sự khác nhau giữa hai trung
bình của hai tổng thể chung được trình bày ở trên gọi là kiểm định có
tham số. Khi tiến hành các kiểm định này thường phải dựa trên giả
thiết quan trọng là tổng thể chung đang xét có phân phối chuẩn và
hoặc kích thước mẫu khá lớn. Nếu một trong các điều kiện trên bị vi
phạm thì các tiêu chuẩn đó không thể thực hiện được. Trong tình
huống như vậy ta phải sử dụng các tiêu chuẩn phi tham số. Tiêu
chuẩn này không đòi hỏi phải có các giả thiết về các dạng phân phối
của tổng thể chung và dùng trong các phương pháp kiểm định tự do
(đối với dạng phân phối), đó là các phương pháp kiểm định phi
tham số.

Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×