terça-feira, 17 de maio de 2016

Elementos da Amostra


 Ao longo deste poste utilizaremos alguns caracteres que representarão conceitos fundamentais durante os cálculos estatísticos. Lembramos também que uma amostra deve ser entendida como uma diminuição ou parte da população estatística que mantenha suas características fundamentais, mas apenas para reforçar o conceito e auxiliar na simbolização durante a elaboração dos quadros apresentamos o quadro a seguir:



Notação
Nome da relação
Estatística (amostra)
Parâmetro (população)
Tamanho


Conforme o quadro apresentado, se nós tivermos uma população composta de 10 funcionários em um departamento de uma empresa podemos simbolizar por N10, bem como que uma amostra contendo os cinco funcionários com nível superior deste departamento identificaria como n10. Durante a elaboração de uma amostra devemos nos atentar a preservação das variáveis fundamentais da população em questão a ser estudada. Para tanto observamos o tipo da variável, o intervalo de dados e a frequência a ser aplicada e para auxiliar na leitura dos dados a criação de representação gráfica, dos mais diversos tipos.

      Variáveis

Entende-se como variável em estatística qualquer característica essencial associada à população durante a criação da amostra. Há dois tipos de variáveis estatísticas: quantitativas e qualitativas, e como seus nomes sugerem, relacionadas a dados numéricos e de qualidade, respectivamente, tendo cada uma com uma subdivisão. As variáveis quantitativas podem ser divididas em quantitativas descritivas e quantitativas contínuas, ao passo que as qualitativas em variáveis qualitativas nominais ou variáveis qualitativas ordinais. A saber:
  • As variáveis quantitativas descritivas, que se referem à obtenção de números finitos, como resultada (tal como número de filhos de famílias de baixa renda de uma determinada região do Nordeste durante os dois primeiros meses do ano de 2009);
  • As variáveis quantitativas contínuas trabalham com dados dispostos em intervalos, como por exemplo, informações referentes à estatura de um determinado grupo em uma faixa etária que uma região que passou de 0,30 a 0,20 metros.
Na outra ponta, as variáveis qualitativas dizem respeito a dados que qualificam alguma tendência de forma:
  • Qualitativa nominal, sobre informações físicas e geográficas, região de procedência, não tendo uma ordenação específica. Um exemplo poderia ser um estudo feito para se entender melhor como caminha a natalidade de certa região;
  • Ou de maneira qualitativa ordinal, como por exemplo, o grau de instrução de uma determinada área urbana, que apresenta ordenação (ensino fundamental – médio – superior).


      Intervalo de dados estatísticos

Um intervalo resume os dados coletados de uma população ou mesmo de uma amostra de forma ordenada para que se possa tirar conclusões e tomar decisões. Por exemplo, dada a respectiva amostra de notas de uma turma em um curso pré-vestibular 70,00, 70,00, 90,00, 80,00, 50,00, 70,00, 70,00, 90,00, 100,00 e 60,00, vamos elaborar duas tabelas com valor e quantidade, e a outra com o mesmo tipo de informação, mas com a aplicação de intervalos. Para a elaboração da primeira tabela basta colocar todos os números apresentados, excluindo os repetidos na primeira coluna e na segunda, o número de contagem que surgem. Assim:
Valor da nota
Quantidade de notas
50,00
1,00
60,00
1,00
70,00
4,00
80,00
1,00
90,00
2,00
100,00
1,00
Total
10,00
Para a segunda tabela, no entanto, utilizaremos classes ou agrupamento de dados. Mas como agrupar a seqüência de números? Se por exemplo tivéssemos 1,0, 2,0, 3,0, 4,0, 5,0, 6,0 e 7,0 poderíamos fazer “classe de ” (um intervalo aberto), “classe de ” (um intervalo fechado à esquerda), “classe de ” (um intervalo fechado à direita) e “classe de ” (um intervalo fechado). Com a distribuição em classes pegamos os valores e os agrupamos de forma que cada um contenha a mesma distância de um número para o outro. Assim temos, por exemplo, o primeiro intervalo, de 50,00|— 70,00, um intervalo fechado à esquerda que também pode ser apresentado como: [50,00; 70,00[.
Classes
f i


[50,00; 70,00[
2,00
[70,00; 90,00[
5,00
[90,00; 110,00[
3,00
Total
10,00
Como vimos esse agrupamento nos auxilia na elaboração e na visualização dos dados estatísticos, mesmo que possam acabar por diminuir a precisão dos resultados. Veremos melhor esse assunto nos tópicos a seguir, sobre a distribuição de frequências.


      Frequência absoluta

A primeira fase de um estudo estatístico consiste em recolher, contar e classificar os dados sobre uma população estatística. Escolhida uma característica sobre os elementos de uma população estatística, devemos elaborar uma tabela de dados denominada distribuição estatística. Consideremos, então, o quadro seguinte que nos mostra os dados referentes às notas dos alunos de uma oitava série do ensino fundamental na prova de matemática:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Nota
5
4
6
8
3
5
7
6
8
4
6
9
7
5
7
5
6
8
7
9
4
6
6
8
7
Nesse caso temos:
  • População estatística: grupo dos vinte e cinco alunos da oitava série da escola;
  • Unidade estatística: cada um dos respectivos alunos desta oitava série;
  • Variável estatística: as notas de uma prova de matemática aplicada aos alunos desta oitava série.
E a partir desses conhecimentos extraídos vamos elaborar a seguinte tabela de dados:
Notas (xi)
Número de alunos com as respectivas notas (F i)
0,0
0
1,0
0
2,0
0
3,0
1
4,0
3
5,0
4
6,0
6
7,0
5
8,0
4
9,0
2
10,0
0
Total (N)
25
Na primeira coluna aparecem os diferentes valores da variável estatística, que representaremos por xi. Na última coluna aparece o número de vezes que cada nota se repete. Essa é a coluna da frequência absoluta, sendo representada por F i. Daí diferencia-se: frequência (F i) absoluta do valor de (xi) é o número de vezes que a variável estatística assume o valor de xi. Assim, a frequência absoluta da nota 5,0, ou seja, F(5,0) é quatro, da mesma forma que da nota 6,0 é de seis, e assim por diante.
E desta forma, temos o total de frequências absolutas, dado por:
E por dedução temos a fórmula do número de elementos, expressa a seguir:
Conforme a equação expressa, entendemos que o número total da população N encontrado é:
Mais uns exemplos:
Em uma escola, o conceito de cada bimestre é representado por letras: A, B, C, D e letra E. Em um determinado bimestre, os conceitos dos alunos da 6ª série em Ciências foram os seguintes:
N.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Nota
B
A
C
C
D
C
D
A
A
C
E
D
D
C
B
C
B
C
C
B
Nessas condições, elabore um quadro de distribuição de frequências absolutas
Resolução:
Com base nos dados apresentados no enunciado do exemplo temos o quadro a seguir:
Notas
frequência
frequência acumulada
E
Um
Um
D
Quatro
Cinco
C
Oito
Treze
B
Quatro
Dezessete
A
Três
Vinte
N

20,00
Nota-se que na última coluna acrescentamos os valores de frequência Acumulada, conceito que veremos no tópico seguinte.


Um dado foi lançado quinze vezes, tendo-se obtido os seguintes os seguintes pontos: 2, 5, 6, 6, 1, 4, 2, 6, 5, 1, 3, 3, 2, 4 e seis. Construa uma distribuição de frequências absolutas.
Resolução:
Com base nos dados apresentados no enunciado do exemplo temos o quadro a seguir:
Ponto
frequência
frequência acumulada
1,0
2,0
2,0
2,0
3,0
5,0
3,0
2,0
7,0
4,0
2,0
9,0
5,0
2,0
11,0
6,0
4,0
15,0
N

15,0
Nota-se que na última coluna acrescentamos os valores de frequência Acumulada, conceito que veremos no tópico seguinte.


      Frequência absoluta acumulada

A distribuição de frequências absolutas pode ser completada com mais uma coluna, chamada frequência absoluta acumulada , cujos valores são obtidos adicionados adicionando a cada frequência absoluta os valores de frequências anteriores – como foi apresentado nos exemplos anteriores. Para explicar melhor utilizamos o exemplo a seguir:
Notas (xi)
Número de alunos com as respectivas notas (F i)
frequências Acumuladas
0,00
0,00
0,00
1,00
0,00
0,00
2,00
0,00
0,00
3,00
1,00
1,00
4,00
3,00
4,00
5,00
4,00
8,00
6,00
6,00
14,00
7,00
5,00
19,00
8,00
4,00
23,00
9,00
2,00
25,00
10,00
0,00
25,00
Total (N)
25,00
25,00
Pelo quadro anterior e com a utilização da frequência acumulada, podemos afirmar que 14 alunos não obtiveram nota igual ou inferior a sete nesta classe e que onze conseguiram ou passaram deste conceito.
Vamos para outro exemplo: os salários semanais, em reais, de vinte funcionários de uma empresa são de 72,00, 72,00, 80,00, 84,00, 84,00, 72,00, 76,00, 80,00, 92,00, 72,00, 76,00, 80,00, 84,00, 72,00, 68,00, 76,00, 80,00, 72,00, 88,00 e 76,00, tomando como estrutura o menor e o maior valor.
Resolução:
Inicialmente preparamos uma tabela contendo os números não repetidos apresentados no enunciado. Por exemplo, o valor de R$ 68,00 aparece apenas uma vez, ao passo que R$ 72,00 surge seis vezes (seis funcionários). Temos então o quadro a seguir, já completo:
xi
R$ 68,00
1,00
1,00
R$ 72,00
6,00
7,00
R$ 76,00
4,00
11,00
R$ 80,00
4,00
15,00
R$ 84,00
3,00
18,00
R$ 88,00
1,00
19,00
R$ 92,00
1,00
20,00
Total
20,00
20,00
Logo, podemos concluir que nesta empresa um total de onze funcionários ganha menos de R$ 80,00 por semana, bem como que 19 empregados ganham menos de R$ 92,00 semanais.


      frequência relativa e frequência relativa acumulada

Chama-se frequência relativa do valor da variável do quociente entre a frequência absoluta e o número de elementos da população estatística, ou seja, pela fórmula a seguir:
Devemos observar que a frequência relativa é dada na forma de porcentagem (%); o que torna mais clara a análise de certos dados estatísticos. Se tomarmos como exemplo o quadro de frequência das notas de matemática de certa oitava série com vinte e cinco alunos teria:
Notas (xi)
Número de alunos com as respectivas notas (F i)
frequências Acumuladas ( )
N° de alunos com as notas em % (f i)
N° de alunos com as notas (%) acumuladas
0,00
0,00
0,00
0%
0%
1,00
0,00
0,00
0%
0%
2,00
0,00
0,00
0%
0%
3,00
1,00
1,00
4%
4%
4,00
3,00
4,00
12%
16%
5,00
4,00
8,00
16%
32%
6,00
6,00
14,00
24%
56%
7,00
5,00
19,00
20%
76%
8,00
4,00
23,00
16%
92%
9,00
2,00
25,00
8%
100%
10,00
0,00
25,00
0%
100%
Total (N)
25,00
25,00
100%
100%

Observando esta tabela podemos dizer que 20% dos alunos obtiveram média igual a 7,00, 56% dos alunos obtiveram média inferior a 7,00 e que 44% obtiveram média igual ou superior a 7,00.


E da mesma forma que foi feito nos tipos de frequências anteriores faremos a resolução de alguns exemplos:
Um dado foi lançado 20 vezes, sendo obtidos os seguintes pontos: 1, 5, 6, 5, 2, 2, 2, 4, 6, 5, 2, 3, 3, 1, 6, 6, 5, 5, 4 e dois. Elaborar um quadro com a distribuição de frequências absolutas acumuladas, relativas e relativas acumuladas.
Resolução:
Para a criação da tabela entenderemos que os pontos possíveis (1, 2, 3, 4, 5 e seis) serão os valores de xiI e que as quantidades de vezes que se repetem serão os valores de . Logo:
xi
F i
F acumulada
f i
f relativa
1,0
2,0
2,0
10%
10%
2,0
5,0
7,0
25%
35%
3,0
2,0
9,0
10%
45%
4,0
2,0
11,0
10%
55%
5,0
5,0
16,0
25%
80%
6,0
4,0
20,0
20%
100%
Total
20,0
20,0
100,0%
100,0%
Observando a tabela do exemplo anterior responda: Quantas vezes o número dois foi obtido no dado? Quantas vezes o número obtido no dado foi menor que cinco?Qual o índice em percentual em que números maiores que 4,0 foram obtidos com o jogo de dado?Qual o índice em que o número seis foi obtido no dado?
Respostas: segundo a tabela anterior, o número 2,0 foi obtido ao se jogar o dado num total de cinco vezes, o que representa ¼ ou 25% do total de jogadas. E da mesma forma, um total de 55% de todas as jogadas, mais da metade, teve pontuação inferior a cinco, isto é, 11 pontuações inferiores. Jogando os dados obteve-se 45% de pontuações superiores a quatro, o que confere um total de nove jogadas. Ainda conforme a tabela é fácil de afirmar que o número seis foi obtido no dado em um total de quatro vezes, 20% do total de jogadas.
A tabela a seguir mostra a média dos vinte e cinco alunos da primeira série do curso colegial de uma determinada escola na disciplina de Física do primeiro bimestre do ano de 1994. Tomando como extremos para a elaboração da tabela o menor e o maior valor pede-se:
  • Elabore um quadro de frequências absolutas, acumuladas, relativas e de frequências relativas acumuladas;
  • Quantos alunos obtiveram média igual a 6,0?
  • Quantos alunos obtiveram média inferior a 6,0?
  • Quantos alunos obtiveram média de nota superior a 6,0?
  • Qual o índice percentual de reprovação em Física neste bimestre?
  • Qual o índice percentual de alunos que obtiveram média superior a sete no bimestre?
  • Qual o índice percentual de alunos que obtiveram média maior que cinco?
N.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Nt
4,0
7,0
5,0
5,0
5,0
4,0
9,0
4,0
5,0
6,0
6,0
7,0
6,0
6,0
5,0
4,0
4
8,0
7
6,0
6,0
8,0
5,0
5,0
8,0
Resolução: inicialmente, vamos elaborar o quadro com os dados estatísticos e depois resolver as questões propostas.
Nota - xi
frequência - f i
frequência acumulada
frequência relativa
Relativa acumulada
1,0
0,0
0,0
0%
0%
2,0
0,0
0,0
0%
0%
3,0
0,0
0,0
0%
0%
4,0
5,0
5,0
20%
20%
5,0
7,0
12,0
28%
48%
6,0
6,0
18,0
24%
72%
7,0
3,0
21,0
12%
84%
8,0
3,0
24,0
12%
96%
9,0
1,0
25,0
4%
100%
10,0
0,0
25,0
0%
100%
Total
25,0
25,0
100,0%
100,0%
  • Um total de seis alunos obteve média igual a 6,0, o mesmo que 24% da sala;
  • Um total de doze alunos não atingiu a média de 6,0 nesta turma, o 48% da sala;
  • Um total de sete alunos conseguiu superar a média seis nesta turma, 28% do total;
  • Considerando o mínimo para ser aprovada a nota de 5,0 podemos dizer que 20% da sala foram reprovadas na disciplina de Física, um quinto do total de alunos;
  • A sala obteve um índice de aprovação de 16% de notas superiores a 7,0, igual a quatro alunos;
  • Obtiveram média superior a cinco um total de 13 alunos, equivalente a 52% do total.


      Distribuição de frequências com dados agrupados

Observando-se a altura dos alunos de uma série do segundo grau, foram obtidos os seguintes valores em metros: 1,75, 2,01, 1,98, 1,80, 2,05, 1,78, 1,83, 1,70, 1,94, 1,88, 2,02, 1,91, 1,87, 1,76, 1,79, 1,96, 1,82, 1,90, 1,87, 2,04, 1,81, 1,80, 1,79, 1,76, 2,02, 1,96, 1,80, 1,75, 1,92, 1,77, 1,81, 1,84, 1,76, 1,97, 1,81, 1,98, 2,01, 1,75, 1,99 e 2,00. 
Elaboramos o quadro a seguir para demonstra de forma mais clara o grande variedade de dados que poderiam ser estudados:
1,70
1,79
1,87
1,98
1,75
1,80
1,87
1,98
1,75
1,80
1,88
1,99
1,75
1,80
1,90
2,00
1,76
1,81
1,91
2,01
1,76
1,81
1,92
2,01
1,76
1,81
1,94
2,02
1,77
1,82
1,96
2,02
1,78
1,83
1,96
2,04
1,79
1,84
1,97
2,05
Se tentássemos elaborar o quadro de distribuição de frequências utilizando esses dados muito pouco ou mesmo nada poderíamos encontra para tirar conclusões. Nesses casos, é sempre interessante agrupar os diversos valores em intervalos que apresentam determinada amplitude, muito embora haja um sacrifício na precisão dos conhecimentos a extrair da distribuição. Como a menor altura é de 1,70 e a maior é de 2,05 metros, podemos agrupá-las em intervalos de amplitude 0,10, ou seja:
[ [
[ [
[ [
[ ]
A amplitude do intervalo de classe, nesse caso, é dada por:
O ponto médio de cada intervalo recebe o nome de marca da classe, que é considerado como sendo o representante de toda a classe. Assim, no intervalo de [1,70; 1,80[, a marca de classe é dada pela média aritmética simples:
Vejamos agora um quadro já construído de distribuição de frequência.
Classes
F i
F i acumulado
f i (%)
f i (acumulado)
[1,70; 1,80[
11,00
11,00
27,50%
27,50%
[1,80; 1,90[
12,00
23,00
30,00%
57,50%
[1,90; 2,00[
10,00
33,00
25,00%
82,50%
[2,00; 2,10]
7,00
40,00
17,50%
100,00%
Total
40,00
40,00
100,00%
100,00%
Este quadro de distribuição de frequências nos mostra, por exemplo, que 12 alunos desta série medem entre 1,70 e 1,80 metros; que 52,5% dos alunos medem menos que dois metros de altura e que 17,5% dos alunos tem entre 2,00 a 2,05 metros.
Mas como se cria ou se estabelece o tamanho dos intervalos durante a distribuição de frequências? Tomemos o quadro a seguir para explicar a construção dessa distribuição:
10
30
57
52
77
85
15
33
50
66
40
43
21
46
53
72
71
84
23
41
60
75
80
90
27
37
20
99
12
56
94
98
95
97
70
100
Para a criação dos espaços (classes) na distribuição de frequências devemos calcular a amplitude, subtraindo o menor número do maior número da seqüência. Assim a amplitude amostral, ou amplitude da amostra, é obtida fazendo 100 – 10 = 90. Após isso devemos encontrar a quantidade de classes, obtida encontrando-se a raiz quadrada de quantidade de classes (k) da quantidade de elementos (n), que no exemplo é de 36 números.
A amplitude amostral é igual ao maior número menos o menor:
Feito isso encontramos respectivamente os números de 90 e seis e aplicamos a fórmula da amplitude de classe, apresentada a seguir:
Portanto, sabemos que para a formação do tamanho de cada classe na distribuição deveremos utilizar, neste exemplo, as contas: , e assim por diante:
Classes
f i
f i acumulado
f i (%)
f i (acumulado)
[10; 25[
6,00
6,00
17,00%
17,00%
[25; 40[
4,00
10,00
11,00%
28,00%
[40; 55[
7,00
17,00
19,00%
47,00%
[55; 70[
4,00
21,00
11,00%
58,00%
[70; 85[
7,00
28,00
19,00%
77,00%
[85; 100]
8,00
36,00
23,00%
100,00%
Total
36,00
40,00
100,00%
100,00%
Vejamos outros exemplos:
No quadro adiante está à distribuição de salários mensais, agrupados em classes de quarenta empregados de uma empresa.
  • Qual é a amplitude do intervalo a ser criado com base nos dados do enunciado?
  • Complete o quadro de frequências absolutas e frequências acumuladas.
  • Elabore um quadro de distribuição de frequências relativas e de frequências relativas acumuladas referentes aos dados do enunciado.
Classes
f i
f i acumulado
f i (%)
f i (acumulado)
[80; 90[
4,00
x
x
x
[90; 100[
10,00
x
x
x
[100; 110[
18,00
x
x
x
[110; 120[
5,00
x
x
x
[120; 130[
3,00
x
x
x
Total
40,00
40,00
100,00%
100,00%
Resolução: completando as lacunas temos o seguinte quadro:
Classes
f i
f i acumulado
f i (%)
f i (acumulado)
[80; 90[
4,00
4,00
10,00%
10,00%
[90; 100[
10,00
14,00
25,00%
35,00%
[100; 110[
18,00
32,00
45,00%
80,00%
[110; 120[
5,00
19,00
12,50%
47,50%
[120; 130[
3,00
22,00
7,50%
55,00%
Total
40,00
40,00
100,00%
100,00%

  • Um total de seis alunos obteve média igual a 6,0, o mesmo que 24% da sala;
  • Um total de doze alunos não atingiu a média de 6,0 nesta turma, o 48% da sala;
  • Um total de sete alunos conseguiu superar a média seis nesta turma, 28% do total;
  • Considerando o mínimo para ser aprovada a nota de 5,0 podemos dizer que 20% da sala foram reprovadas na disciplina de Física, um quinto do total de alunos;
  • A sala obteve um índice de aprovação de 16% de notas superiores a 7,0, igual a quatro alunos;
  • Obtiveram média superior a cinco um total de 13 alunos, equivalente a 52% do total.