domingo, 25 de setembro de 2011

 
MEDIADAS DE DISPERSÃO

Variação ou dispersão é o grau com que os dados numéricos tendem a se espalhar em torno de um valor médio. Ou seja, medidas de dispersão são indicadores do grau de variabilidade demonstrada pelos indivíduos em torno das medidas de tendência central.
Variância
A variância, representada por s2, e é definida como o "desvio quadrático médio da média".
Note-se que como a variância mede os desvios em relação à média (ou seja, a diferença entre cada dado e a média) e avalia o grau de dispersão de um conjunto de dados.
Exemplos :
• Considere 3 amostras, A, B e C, com médias iguais, em que o comprimento de um órgão (em mm) foi anotado.

amostra soma média
A 160 162 165 168 172 175 1002 167
B 160 161 162 168 170 173 175 1169 167
C 160 162 163 164 165 167 170 171 173 175 1670 167

É importante notar que as amplitudes ( 175-160 = 15 ) e as médias (= 167) são iguais nas 3 amostras.

Para analisar a dispersão dos dados em torno da média, em cada amostra, obtém-se o desvio em relação à média (x – ) e as suas somas.

É importante notar que não há média dos desvios (x- ), porque a sua soma em cada amostra é sempre igual a zero.
Ressalte-se que apesar da dispersão dos dados em torno da média ser a mesma nos 3 grupos, a soma dos quadrados dos desvios (x - )2 é maior no grupo C, pois é o que possui maior número de dados.

Mas, para medir a dispersão dos dados em relação à média, deve-se usar a variância, ( s2), pois o valor obtido leva em consideração o tamanho da amostra.

A fórmula geral da variância é :

( s2) = soma de quadrados dos desvios / ( n - 1).


Como a mostra A tem 6 elementos a variância é assim calculada: 168 / 5 = 33,6.

Do mesmo modo, para a amostra B = 220/ 6 = 36,67 e para a amostra C = 228/9 = 25,33.

Fórmulas
Considerando uma série de N valores de uma variável x ( x1, x2, x3, x4, ... xn ), com média , a variância pode ser determinada por:
s2 = ( xi - )2 / (N - 1)
s2 = (xi2) - N 2 / (N - 1)
s2 = x2 - [( x)2 / N] / (N - 1)
Assim, a variância é a medida que se obtém somando os quadrados dos desvios das observações da amostra, relativamente à sua média, e dividindo pelo número de observações da amostra menos um.

É importante notar que:

a variância nunca é negativa, porque os quadrados são sempre positivos ou nulos. Assim, a unidade de variância é o quadrado da unidade de observação. (Exemplo: a variância de um conjunto de alturas medidas em centímetros será dada em centímetros quadrados).

se todas as médias das amostras forem iguais, o valor da variância da média seria igual a zero.

quanto maior for a variância menor é o grau de concentração dos indivíduos na amostra
Exemplo:
Apenas como exemplo, suponha que duas amostras apresentaram os seguintes valores de largura de um órgão, em cm:
A = 8, 10, 12, 14 e 16
B = 4, 8, 12, 16 e 20
Cálculo da variância de dados puros
Quando se tem todos os dados individuais, ainda sem nenhum tratamento, portanto sem agrupamento em classes, pode-se obter o quadrado dos valores individuais e das duas somatórias.
Exemplo:
Considere 2 amostras, A e B, com 5 dados cada:
Amostras A B
x x2 x x2
8 64 4 16
10 100 8 64
12 144 12 144
14 196 16 256
16 256 20 400
Total 60 760 60 880

Pode-se calcular a variância do seguinte modo:
Variância A = s2A = x2 - [( x)2 / N] / (N - 1) = [760 - (602 / 5)] / 4 =
= (760 - 720) / 4 = 10

Variância B = s2B = x2 - [( x)2/ N] / (N - 1)
= [880 - (602 / 5)] / 4 = (880 - 720) / 4 = 40
Notar que na amostra A os indivíduos estão mais concentrados, distribuindo-se entre o valor mínimo = 8 e o máximo = 16
E, na amostra B estão mais dispersos (distribuindo-se ente 4 e 20).
Assim, na amostra A a variância ( s2A = 10) é menor que a da B ( s2B = 40).

Desvio Padrão
O desvio padrão é obtido simplesmente encontrando-se a raiz quadrada do valor obtido para a variância. É representado por s.
• Utilizando os dados do exemplo anterior:
sA = raiz s2 A = raiz 10 = 3,16
sB = raiz s2 B = raiz 40 = 6,32

No caso da variância lida-se com unidades ao quadrado, representando uma grandeza em duas dimensões.

Para ter uma medida da variabilidade ou dispersão usa-se o desvio padrão que tem a mesma unidade dos dados originais. É um desvio médio em relação à média do conjunto de dados.

É importante notar, portanto, que quando se fala de desvio padrão ou de variância, fala-se de medidas de dispersão, que diferem apenas por uma transformação matemática, ou seja, diferem somente em um ajuste de escala.

Pela sua própria definição nota-se que o desvio padrão é uma medida que só pode assumir valores não negativos e que, quanto maior for, indicará mais variabilidade nos dados e que maior será a dispersão deles...

Nenhum comentário:

Postar um comentário