A estatística é um ramo de grande importância da matemática, desenvolvendo técnicas como a coleta de dados e sua organização, interpretação, análise e representação. O uso da matemática para a tomada de decisões vem acompanhando nossa história desde o início das grandes civilizações. Com o passar do tempo, foram criados métodos para facilitar-se esse processo.
A estatística é dividida entre o estudo da coleta de dados, em que conhecemos os princípios da área, como os conceitos de amostra, população, variável e tipo de variável; o estudo da análise desses dados, no qual lidamos com a frequência absoluta e relativa, as medidas centrais e as medidas de dispersão; e a representação e interpretação desses resultados, em que estudamos os tipos de gráficos, a melhor representação para cada caso, e, com base nessa interpretação, gerando-se também as medidas centrais, como a média, a moda e a mediana.
A motivação de desenvolver esse projeto é a VI Gincana de Estatística do IF Goiano Campus Ceres que será realizada no dia 02/12/2022. Considerando que a participação do curso de Bacharelado em Sistemas de Informação é que esse e o primeiro ano em que este curso participa de forma efetiva e pontual. Espera-se que esse trabalho auxilie no aprendizado dos graduandos e possibilite a pontuação máxima na modalidade concorrida na gincana em questão.
O objetivo desse projeto é desenvolver um site educacional de estatística dividido em três módulos, sendo eles, o quiz, a resolução de perguntas e o conteúdo. Esses módulos serão divididos por abas que permitiram que o usuário selecione a de seu interesse.
Será composto de questões referentes ao conteúdo de estatística descritiva. Nele será possível visualizar se a resposta está correta ou não e a justificativa dessa resposta; será composto por um numero X de questões de múltipla escolha sorteadas aleatoriamente; ele permitira que o usuário veja sua pontuação de acordo com suas respostas e junto com a pontuação a porcentagem de acertos; o sistema irá retornar um ranking informando o nome de usuário, sua pontuação e a posição ocupada.
A aba de conteúdo deverá apresentar os conceitos fundamentais (O que é estatística descritiva?, População, Amostra, Elemento, Pesquisa estatística, Amostragem (tipos de amostragem), Conjuntos e subconjuntos (finito e infinito), Dado x Variável, Variável Resposta, Variável Qualitativa (nominal, ordinal, intervalar), Variável Quantitativa (discreta e contínua)).
As tabelas (Conceito, Elementos da tabela, Tabela Simples). A distribuição de frequências (Pontual, sem perda de informação (frequência relativa, relativa em percentual, absoluta acumulada, acumulada relativa) e Em classes, com perda de informações).
Os gráficos (Conceito, Gráficos para variáveis qualitativas (barras, colunas, setores, linhas), Gráficos para variáveis quantitativas discretas (bastões, da frequência acumulada), Gráficos para variáveis quantitativas contínuas (histograma, polígono de frequência, frequências acumulada ou ogiva, ramo e folhas), Box plot ou desenho esquemático,Pictograma).
A medidas descritivas (Conceito, Medida de tendência central, Média aritmética (amostral e populacional), Moda, Mediana). As Medidas Separatrizes (Quartil, Decil, Percentil).
As medidas de dispersão (Conceito, Amplitude total, Amplitude interquartílica, Desvio médio, Variância e desvio padrão, Coeficiente de variação, Medidas de assimetria, Medidas de curtose).Os objetivos adicionais (Inserir alguns mapas mentais para download (imagem ou pdf), para assim apresentarmos inovação no site, Trabalhar algo mais lúdico com imagens e design criativo para incentivar o público, Focar no conteúdo escrito, mas não nos esquecermos de exemplos dados pela professora em sala de aula, Organizar o conteúdo de forma que não fique tão massante).
O espaço para a resolução de questões será utilizado para calcular as funções usando as seguintes:
Distribuição de frequências
• Pontual, sem perda de informação
A construção de uma distribuição de freqüência pontual é equivalente à construção de uma tabela simples, onde se listam os diferentes valores observados da variável, com suas freqüências absolutas, denotadas por Fi, onde o índice i corresponde ao número de linhas da tabela.
• frequência relativa
onde n é o tamanho da amostra, devendo ser substituída por N se os dados forem populacionais. A soma das freqüências relativas de todas as categorias é igual a 1;
• relativa em percentual
representando o percentual de observações que pertencem àquela categoria. A soma das freqüências deve, agora, ser igual a 100%;
• absoluta acumulada
A frequência absoluta acumulada é a soma das frequências absolutas ao decorrer das linhas da tabela. Essa frequência é bastante útil para obter alguns dados de determinada tabela.
• acumulada relativa
A frequência relativa acumulada é o acúmulo da frequência relativa. Para encontrar a frequência relativa acumulada, acrescentamos uma nova coluna à tabela. Copiamos a primeira frequência relativa na primeira linha, a segunda linha será a soma da frequência relativa da linha com a frequência acumulada da linha anterior, e assim sucessivamente.
• Em classes, com perda de informações.
O menor valor da classe é denominado limite inferior (li) e o maior valor da classe é denominado limite superior (Li). O intervalo ou classe pode ser representado das seguintes maneiras:
a) li | ____ Li, onde o limite inferior da classe é incluído na contagem da freqüência absoluta mas o superior não;
b) li ____| Li, onde o limite superior da classe é incluído na contagem mas o inferior não;
c) li | ____| Li, onde tanto o limite inferior quanto o superior são incluídos na contagem;
d) li ____ Li, onde os limites não fazem parte da contagem.
Pode-se escolher qualquer uma destas opções sendo o importante tornar claro no texto ou na tabela qual está sendo usada.
Milone (2004, p.36) apresenta os seguintes critérios para a determinação do número de intervalos, denotado por k:
-
Raiz quadrada: k n =
-
Log (Sturges): k =1+ 3,3log n
-
ln (Milone): k 1 2 ln n =− + ⋅
-
k 1 10 AT d = + ,
onde n é o número de elementos da amostra, AT é a amplitude total dos dados e d é o número de decimais de seus elementos.
Medidas Descritivas
Medidas de tendência central.
• Média aritmética (amostral e populacional).
A Média Aritmética de um conjunto de dados é obtida somando todos os valores e dividindo o valor encontrado pelo número de dados desse conjunto.
• Moda.
Para calcular a moda de um conjunto de dados só é preciso observar os dados que aparecem com maior frequência no conjunto.
• Mediana.
A Mediana (Md) é o valor de centro de um conjunto de dados. Para calcular, primeiro devemos ordenar o conjunto de dados. Para calcular a mediana: • Devemos ordenar o conjunto de dados em ordem crescente; • Se o número de elementos for par, então a mediana é a média dos dois valores centrais. Soma os dois valores centrais e divide o resultado por 2: (a + b)/2. • Se o número de elementos for ímpar, então a mediana é o valor central.
Medidas Separatrizes
• Quartil.
Os quartis dividem o conjunto de dados em quatro partes iguais.
• Decil.
Os decis dividem o conjunto de dados em dez partes iguais.
• Percentil. (cálculo complexo)
Os percentis dividem o conjunto de dados em cem partes iguais.
Medidas de Dispersão
• Amplitude total.
A amplitude total de um conjunto de dados é a diferença entre o maior e o menor valor observado. A medida de dispersão não levar em consideração os valores intermediários perdendo a informação de como os dados estão distribuídos e/ou concentrados.
• Amplitude interquartílica.
A amplitude interquartílica é a diferença entre o terceiro e o primeiro quartil. Esta medida é mais estável que a amplitude total por não considerar os valores mais extremos. Esta medida abrange 50% dos dados e é útil para detectar valores discrepantes. Por outras palavras, é a distância entre o terceiro quartil e o primeiro quartil.
• Desvio médio.
Ao somar todos os desvios, ou seja, ao somar todas as diferenças de cada valor observado em relação a média, o resultado é igual a zero (propriedade 5 da média). Isto significa que esta medida não mede a variabilidade dos dados. Para resolver este problema, pode-se desconsiderar o sinal da diferença, considerando-as em módulo e a média destas diferenças em módulo é denominada desvio médio.
• Variância populacional.
• Variância amostral.
• Desvio Padrão.
• Coeficiente de variação.
• Medidas de assimetria.
• Medidas de curtose.