terça-feira, 6 de dezembro de 2016

Medidas de tendência central e de dispersão

Nesta postagem apresentaremos alguns conceitos e cálculos estatísticos envolvendo referentes às médias que definimos em grupos de amostras ou populações. Diferentemente da postagem anterior, que você pode acessar aqui, optamos por apresentar as equações e numa próxima postagem, resolveremos exercícios com elas.

    Medidas de tendência central

Medidas de tendência central são as medidas que representam fenômenos por mio de seus valore médios, em torno dos quais tende a ocorrer a concentração dos dados estatísticos.


      Média aritmética de dados não agrupados

A medida da tendência central mais comum para um conjunto de dados estatísticos é a média aritmética. Qual estudante na atualidade não sabe que se conseguiu tirar 10 na primeira prova e 4,00 na segunda acabam ficando com uma média aritmética de 6,00. Neste caso apenas somou os dois valores e dividiu-os por dois. Se fossem três avaliações, somaria as três e dividi-las-ia por três, e assim por diante. É a chamada média aritmética simples. A média aritmética de uma amostra de n observações pode ser representada pelo símbolo (lê-se x – barra) e tem seu cálculo obtido pela equação:





Como determina a equação, a soma dos valores de x deve ser dividida pelo número total de elementos da amostra. Vejamos este exemplo: encontrar a média aritmética para p conjunto (1, 2, 3, 4, 5, 6), entendendo que x1 = 1, x2 = 2... = n.
Logo temos que a média aritmética do conjunto (1, 2, 3, 4, 5, 6) é de 3,5.

      Média aritmética com dados agrupados

Quando os valores de xi estão agrupados com suas representações absolutas de , a média aritmética é expressa por:




Sendo que por já termos dados agrupados utilizamos as frequências de cada unidade de x. Por exemplo, para determinar a média aritmética do conjunto (1, 2, 3, 4, 2, 3, 2, 3, 3, 3) fazemos da seguinte forma:
1,00 1,0 1,0 * 1,0 = 1,0
2,0 3,0 2,0 * 3,0 = 6,0
3,0 5,0 3,0 * 5,0 = 15,0
4,0 1,0 4,0 * 1,0 = 4,0
N 10,0

E aplicando os dados à fórmula temos o seguinte:






Assim temos que a média aritmética do conjunto de dados agrupados é de 2,6.

      Média geométrica

Desta vez, em vez de explanar o conceito do tipo de média vamos aplicar imediatamente um exemplo para encontrar a sua definição. Digamos que uma nação apresente uma taxa de inflação de 2% em um ano, 5% no segundo ano e de 12% no terceiro. O que se pede aqui é definir a média geométrica das taxas de inflação destes três anos.
Como se pode notar pode utiliza-se este tipo de média quando se envolve valores correspondentes a taxas ou índices que apresentam algum crescimento exponencial. Para o cálculo utilizamos extraímos a raiz do produto (multiplicação) destes números, a saber:



E simplesmente aplicando os dados à fórmula temos:









Podemos desse modo, afirmar que a taxa média de inflação dessa nação ao longo dos três anos foi de cinco por cento.


      Medidas de dispersão

São medidas estatísticas utilizadas para avaliar a variabilidade, ou dispersão, dos valores em torno da média, servindo assim, para medir a sua representatividade. As medidas de dispersão mais importantes são o desvio médio, a variância e o desvio-padrão.


      Desvio médio

O desvio médio representa a média dos desvios de um conjunto de dados sem consideração do sinal que o acompanha. Sua fórmula básica é representada por:



Por exemplo, tomando x como um número igual a 3,00e os valores de e como:
xi
2,00
3,00
4,00
Total N
Fi
1,00
2,00
1,00
4,00
Aplicando os dados à fórmula teríamos o seguinte desvio médio:





      Variância

Mede a variação de dispersão das observações em torno da sua média aritmética. São duas fórmulas básicas para a obtenção da variância, uma para a amostra e outra para a população.
Para uma amostra utiliza-se a seguinte equação:




E para uma população a equação a ser utilizada é:





      Desvio-padrão

Enquanto que a variância mede a variação das observações ao redor da média, o desvio-padrão mede a dispersão absoluta em termos das unidades originais. Da mesma forma que a variância tem equações para amostras e para populações, a saber:
Equação utilizada em um estudo de uma amostra:






E a equação geral para utilização em uma população:





      Coeficiente de variação


É a razão entre a dispersão absoluta e a sua média aritmética. Com esta razão temos então a dispersão relativa, chamada de coeficiente de variação. Enquanto que na amplitude total, a variância e o desvio-padrão são medidas absolutas de dispersão o Coeficiente de Variação É usado para medir a dispersão relativa. O coeficiente de variação representa a qualidade da amostra. Quanto menor o coeficiente, melhor é a amostra. Assim apresentamos a equação do coeficiente de variação, que tem como resultado um índice em porcentagem:




Ficam aqui algumas dicas empíricas para as interpretações do coeficiente de variação, mas vale lembrar que não são regras, uma vez que nem sempre ocorrem desta forma: