Tải bản đầy đủ (.ppt) (26 trang)

TIPO DA VARIÁVEL

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (880.2 KB, 26 trang )

TIPO DA VARIÁVEL
NUMÉRICAS
CATEGÓRICAS
(Incluso as “ordinais”) (qualquer var. pode ser
categorizada)
NUMÉRICA
-Coef. de correlaỗóo;
-Anỏlise de regressóo

V
A
R
I

-Testes t;
V
CATEGểRICA -ANOVA
E
-Similares nóo-paraL
mộtricos.

-Teste de proporỗóo
-Testes do Qui-Quadrado


Temos a situaỗóo cujo o objetivo ộ comparar uma proporỗóo (p) de
uma variável categórica ou categorizada, obtida através de uma amostra,
com uma proporỗóo conhecida de uma populaỗóo (situaỗóo anỏloga a
comparar uma média amostral com uma média conhecida)
Portanto a var. em questão deve ser uma variável categórica ou que
foi categorizada.


Exemplos: - A proporỗóo de mulheres ansiosas na pús-graduaỗóo ộ
equivalente proporỗóo de mulheres ansiosas na pop. em geral;
- A proporỗóo de pessoas acima de 50 anos com depressão na zona rural ộ equivalente zona urbana (conhecida);
-A proporỗóo de negros nas universidades ộ equivalente proporỗóo
na sociedade.
Suposiỗóo: As observaỗừes (xi) sóo independentes uma das outras

Teste de hipótese associado:
H0: p = п (prop. conhecida) X H1: p ≠ п; ou simplesmente: H0 : as
proporỗừes sóo equivalentes X H1: as proporỗừes nóo sóo equivalentes


Lembrando que a proporỗóo ộ numero de resultados que interessam, de
respostas de uma categoria, dividido pelo tamanho da amostra (p = x/n).
Teste estatớstico: Teste para a comparaỗóo de uma proporỗóo.

Procedimento: A estatớstica

onde SE

p0 = proporỗóo conhecida; tem distribuiỗóo Z (Normal (0,1)).
Então acho o valor da est. e comparo com o valor da distribuiỗóo Z com
nớvel de significõncia = 0.05. OU (mais comum) verifico qual a probabilidade do valor da est. na distr. Z comparo com = 0.05.
Se for menor rejeito HO.
Exemplo: Uma amostra de 40 alunos de determinada escola foi coletada e
verificou-se que 16 estavam acima do ponto de corte de uma escala de
stress. Sabe que a proporỗóo de alunos estressados na populaỗóo gira em
torno de 27%.
Estes alunos estóo mais ou menos estressados que o normal?



Efetuando os cálculos temos: p =16/40 = 0.40%, SE = (0.40*0.60)/40 =
0.006, cuja raiz quadrada = 0.0775, então 0.40 -0.27 = 0.13, que dividido
por 0.0775 dỏ 1.677, que na distribuiỗóo Z equivale a um p = 0.10, logo
não rejeitamos H0, os alunos não estão mais estressados que a média.
Vejamos no programa estatístico MINITAB como realizá-lo.
Na barra de ferramentas vamos em
´Stat´, depois ´Basic Statistics´ e daí
em ´1 Proportion´.


no ícone ` Options´.

Na tela resultante ativamos a janela
´Summarized data´, em `Number of
trials´ colocamos o tamanho da
amostra (40) e em ´Number of successes´ o número de resultados que
nos interessam (16) e então clicamos
.

Na tela do ´Options´ vamos em `Test proportion:´ e digitamos a proporỗóo conhecida da
populaỗóo (0.27). O default do programa ộ
0.50. A janela Alternative` com a inscriỗóo
not equal refere-se a um teste bicaudal.
Depois OK e OK.

No output temos o teste de hipótese realizado
(bicaudal), o no. de sucessos, o tamanho da
amostra, a proporỗóo estimada, um I.C. de 95
para esta proporỗóo e o p value.



Suponha que os alunos do exemplo anterior fossem de uma escola localiza
da em um bairro conhecido por sua violência, e a pesquisadora estivesse,
a priori, interessada em saber se a taxa de stress era superior à taxa média
de 27%. Neste caso especớfico pode-se optar pela realizaỗóo de um teste
monocaudal: H0: p p0 X H1: p > p0 .
A ỳnica modificaỗóo necessária para este
teste é ir no ´Options´ e na janela do Alternative marcarmos a opỗóo greater than,
que corresponde ao teste monocaudal.

Nos resultados temos o teste monocaudal,
as saídas anteriormente vistas e o valor
de p = 0.05, então no teste monocaudal
rejeitamos que as taxas de stress são equivalentes, diferente do anterior, pois são
testes diferentes
É necessário justificar o uso do teste monocaudal antes da realizaỗóo


Objetivo: Comparar duas proporỗừes oriundas de duas amostras de populaỗừes independentes. Observe que teremos duas vars. no nosso banco de
dados, uma referente s populaỗừes e a outra referente ao que se quer
comparar, por exemplo, comparar o percentual de crianỗas com problemas
de aprendizado entre duas escolas.

Suposiỗừes: 1 - Dentro de cada amostra as observaỗừes (xi) sóo independentes; 2 As amostras sóo independentes entre si; 3 Cada observaỗóo,
cada unidade amostral só pode ser categorizada em uma e somente uma categoria, ou seja, as categorias das variáveis são mutuamente exclusivas.


Teste de hipútese associado
H0: Hỏ associaỗóo entre as variỏveis X H1: Nóo hỏ associaỗóo entre as

variỏveis.
Teste estatớstico: O teste utilizado neste tipo de situaỗóo ộ denominado teste do Qui-Quadrado (), vejamos, utilizando o exemplo anterior, como é
calculada esta estatística.

Vamos em ´ Stats´ , ´Tables’
e daí em ´Cross Tabulations´, que irá cruzar as variáveis, criar uma tabela de contingência.
Na nova tela alocamos as vars.em
‘Classification variables’,
e acionamos ‘Row
percents’ e Chi-Square analysis’
e OK.


Ao lado temos a tabela de contingência
gerada, onde vemos que na escola 0 temos 20 pessoas sem problemas e 12 com
já na escola 1 temos 20 sem e 8 com problemas. Estes valores são ditos frequências observadas.

Temos também os percentuais por linha, 62,5% na escola A não tem
problemas e 37,5% tem; na escola B 71,4% não tem e 28,6% tem.
O fato de calcularmos o percentual nas linhas ou nas colunas nóo altera o
valor do cỏlculo, tanto faz, ộ uma opỗóo de como o pesquisador quer
demonstrar seus resultados
Abaixo da tabela de contingência temos o valor da est. calculada (0,54) e
o p-value correspondente ( p = 0,46), logo não rejeito H0, não hỏ associaỗóo entre escola e problema, pode-se dizer que o percentual de crianỗas com
problemas na escola 0 (37,5%) nóo difere significativamente do percentual de crianỗas com problemas na escola 1 (28,6%).
Podemos entóo verificar que o teste realiza a comparaỗóo entre dois
percentuais em tabelas com duas variáveis com duas categorias.


Além das frequências observadas existem as frequências esperadas, que

são calculadas a partir das marginais das linhas (32 e 26) e das marginais das colunas (40 e 20)

As freq. esperadas para cada casela são estimadas do seguinte modo:
Cas. 1(linha) 1(coluna) = [Marg. linha 1 (32) * Marg. coluna 1 (40)]/ Total
(60) = (32*40)/60 = 21,33.
Cas. 1(linha) 2(coluna) = [Marg. linha 1 (32) * Marg. coluna 2 (20)]/ Total
(60) = (32*20)/60 = 10,67.
E assim por diante para cada uma das caselas da tabela.
O teste do χ² basicamente irá medir se a distância entre o observado e o


esperado ộ grande, se for haverỏ associaỗóo entre as vars. c.c. nóo haverỏ.
Procedimento: A estatớstica

que ộ a soma das diferen-

ỗas entre esperados e observados tem distribuiỗóo com (l-1)*(c-1) graus
de liberdade, onde l é o no. de linhas e c o no. de colunas. Entóo comparo
o valor da distribuiỗóo com o nível de significância adotado.
OU (mais comum) verifico qual a probabilidade do valor da est. na distr.
e comparo com = 0.05. Se for menor rejeito HO.
No nosso exemplo a est. é : (21,33 – 20)²/21,33 + …+ (10,67 – 12)²/10,67
= 0,536 que na dist. χ² com 1 g.l. equivale a um p = 0,46, logo nóo rejeito
H0, nóo hỏ associaỗóo entre as vars.

Porém podemos especificar mais matematicamente nosso teste de hipótese,
e anunciá-lo da seguinte forma:
H0: Todos os percentuais de uma mesma Linha (ou Coluna) são equivalenaos percentuais da outra Linha (ou Coluna) quando na mesma coluna (ou
linha); X H1: Há pelo menos um percentual diferente.



Podemos ser mais específicos ainda no nosso teste de hipótese:
H0: O percentual de crianỗas com problemas entre as duas escolas é equivalente; X H1 Não é equivalente. OU H0: p1 = p2; X H0: p1 p2.
Existe uma restriỗóo uma condiỗóo muito importante para a aplicaỗóo do
: Nóo pode haver mais de 20% das caselas com valor esperado
menor do que 5. Então em um tabela 2X2 basta uma casela.

Quando isto ocorrer (ao menos uma casela com valor esperado < 5) utilizamos outro teste, o teste exato do X2 , cujas as hipúteses e suposiỗừes
sóo as mesmas, exceto a acima exposta. Exemplo em uma tabela 2 X 2:
A seguinte estatística

fornece diretamente o

valor de p a ser comparado com o nível de significância adotado, onde
Imaginemos a seguinte tabela:


Deseja-se verificar se o percentual de resposta entre as 2 drogas é equivalentes, então o cálculo é:
Então p = 0.009, rejeito
H0, as proporỗừes sóo
significativamente diferentes.

Mas como faỗo para saber se a condiỗóo anteriormente vista estỏ sendo satisfeita ? O Minitab avisa-nos automaticamente.
Na tabela ao lado temos as vars. Sexo e
Prática de religião, note que abaixo dos
resultados temos o aviso: 2 cells with
expected counts less than 5: 2 células com
valor esperado abaixo de 5.
Portanto a condiỗóo nóo estỏ satisfeita,
2 de 4 caselas = 50% das caselas, logo o

teste não tem validade, necessário
aplicar o teste exato de Fisher.


O raciocínio do teste do χ² estende-se para tabela 2x3, 3x3, 4x2, 5x3, enfim
para qualquer tabela de contingência LxC.
Abaixo temos uma tabela das vars. Droga X Curso, podemos ver que hỏ
diferenỗa significativa, a proporỗóo de usuỏrios de drogas varia significativamente conforme o curso.

Qual o teste de hipótese aqui??


Mas quem difere de quem ?
Tal qual na Anova, uma saớda ộ particionarmos a tabela e realizarmos
comparaỗừes em tabelas 2x2. Uma boa idộia ộ iniciar as comparaỗừes
pe-los nớveis que apresentarem maior diferenỗa percentual.

Teoricamente e cada vez mais na prỏtica ộ necessário corrigir os resultados
destes testes “post hoc” através de Bonferroni (0.05/no. testes), logo analise a tabela (diferenỗas prỏticas) e defina as comparaỗừes a realizar.

Ao lado temos o cruzamento das
vars. Curso X Relig., note a quantidade de caselas em branco, aqui
não podemos utilizar o teste do χ².

Também não existe um semelhante de Fisher para tabelas diferentes
das 2x2. A ỳnica soluỗóo ộ agrupar níveis, categorias, de uma, ou das
duas vars.. No agrupamento procu re agrupar as categorias que possuem
amostras menores, de modo a eliminá-las. No exemplo provavelmente teríamos teríamos de agrupar as religiões 3, 4 e 7 e o curso 4.



Obviamente que esse agrupamento precisa fazer sentido, ter lógica, não dá
para misturar Comercial e Botafogo (O Botafogo é muiiiito melhor).

Tudo o que foi visto até agora refere-se a amostras independentes, vejamos
um teste para proporỗừes pareadas.
Temos o seguinte experimento: Foi aplicada uma escala de depressão em
um grupo de mães antes do parto (categorizada em 1= Dep. e 2 = Não d.)
e após o parto.
Observe a planilha de dados como fica.


A estatớstica

tem distribuiỗóo com (l-1)(c-1) g.l.
O Minitab nóo realiza o teste conhecido por Teste de McNemar para dados
pareados. Porém como a fórmula é simples, calculamos a tabela do Minitab e a
partir dela efetuamos o cálculo:
Então (21-7)² / 21 = 7; 196/28 = 7
O valor 7 numa distr. χ² com 1 g.l.
equivale a um p aproximado de 0.005
Rejeito HO, há diferenỗa

O teste de McNemar pode ser aplicado quando hỏ mais de 2 categorias:
o desempenho de um grupo de alunos foi classificado em bom, mộdio e
fraco antes e depois da aplicaỗóo de uma intervenỗóo.


Porém a fórmula é bem mais complexa, não dá para calcular na móo,
serỏ necessỏrio um programa que faỗa o cỏlculo
Atenỗóo, o teste de McNemar só é calculado em tabelas simétricas ou

quadradas,ou seja, quando o no. de linhas é igual ao no. de colunas.
Situaỗóo na qual a tabela jỏ esta pronta, calculada:
Quando vc já tem a tabela, alguém calculou, extraiu de um livro, etc ...,
basta inserir colocar a tabela no Minitab.

Então vamos em ‘Tables’ e daí
em Chi-Square Test’:


Na nova tela selecionamos a colunas
que contém a tabela e alocamos em/
‘ Columns containing the tables’ e
OK

No output temos a tabela, abaixo da tabela as
frequências observadas de casela, o cálculo do
χ² para cada casela, a estatística calculada (7,6)
e o p-value correspondente.
Realiza o cálculo para qualquer tabela L x C,
fique atento para o aviso de valores esperados
menores que 5


Algumas estatísticas, medidas, bastante utilizadas em tabelas 2X2
PADRÃO OURO
(Assumido como a verdade)

+
TESTE
(O que estỏ

sendo verificado)

-

+

-

Sensibilidade: Proporỗóo de positivos verdadeiros, detectou o valor quando ele realmente ocorreu = a/(a+c)
Especificidade: Proporỗóo de negativos verdadeiros, detectou a ausência
do valor quando ele realmente estava ausente = d/(b+d)
Valor preditivo positivo: Proporỗóo de positivos verdadeiros em relaỗóo
ao total de positivos indicados pelo teste = a/(a+b)

Valor preditivo negativo: Proporỗóo de negativos verdadeiros em relaỗóo
ao total de negativos indicados pelo teste = d/(c+d)


Uma nova escala está sendo testada para detectar estresse, já existe uma
escala mundialmente consagrada, mas a nova é mais simples de ser apliada e leva menos tempo para ser aplicada.

Temos então:
Sensibilidade = 53/139 = 38,1%
Especificidade = 48/94 = 51,1%
Valor preditivo positivo = 53/99 = 53,5%
Valor preditivo negativo = 48/134 = 35,8%
VC, adotaria ou não o novo teste ??


Risco relativo (RR) = Probabilidade da ocorrência de um evento em um

grupo dividido pela probabilidade de ocorrência do mesmo evento em outro grupo.
a/a+b / c/c+d

A fórmula do cálculo para RR = a*(c+d) , então para a tabela acima temos
c*(a+b)
29(12+60) ÷ 12 (29+20) = 3,55 .
INTERPRETAÇÃO: Quem consome mais de 2 doses diárias de álcool
tem um risco três vezes e meio maior de ter um distúrbio psic. do que
quem não consome mais de duas doses diárias.
Como a fórmula é a uma divisão, se as probabilidades forem iguais o RR
será 1; então se o RR for superior a 1 temos o chamado fator de risco, se
for inferior a 1 temos o fator de prevenỗóo. Por exemplo, numa tabela
com as vars. Atividade Fớsica (S/N) e Depressão (S/N) obteve-se RR =
0.80, então quem pratica atividade física tem 80% da chance de quem


Entretanto o RR é calculado somente em estudos prospectivos (os pacientes são selecionados entre os que têm um fator de risco e os que não têm
e observa-se o desenvolvimento dos mesmos ao longo do tempo.
Quando temos um estudo retrospectivo (os pacientes já desenvolveram o
sintoma e comparam-se os resultados com aqueles que não tiveram o sintoma) a medida semelhante é o ODDS RATIO, cuja fórmula é a*d
b*c

A tabela acima tem as vars. Escola ( 0 = Sem problema e 1 = Com problema) e Depen (0 = pai sem envolvimento com droga e 1 = pai com envolvimento com droga), o odds = (20*15) ÷ (5*14) = 4,3 , portanto os alunos
cujos pais tem envolvimento com droga tem 4,3 vezes mais chance de
apresentar problemas escolares do que aqueles cujos pais não tem envolvimento.


Veremos um programa simples que calcula as estatísticas anteriormente
vistas quando as tabela já estão prontas, o INSTAT.
Na tela inicial do Instat marcamos as opỗừes Analyze a contingency table e Two rows,

Two columns´ e depois a seta
´Next step´.


Na tela seguinte preenchemos a tabela
com os valores e clicamos na seta.

Na nova tela temos vỏrias opỗừes, ou Fisher; mono ou
bicaudal; RR ou ODDS ou
Sensibilidade, especificidade e valores preditivos
Faỗa suas opỗừes e depois
clice na seta


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×