0115-Podemos confiar nos cálculos estatísticos no Excel?

Recentemente li um artigo que me deixou preocupado: O Excel é um pacote estatístico adequado? (em inglês).
São mostrados diversos trabalhos que apontam incoerências e até alguns erros conceituais nos resultados estatísticos calculados no Excel.
Como já vi muitos usuários lançarem mão das linhas de tendências, suas equações e valores de R2 como critério de decisão, decidi verificar se estes valores podem realmente ser utilizados, ou há algum viés embutido.
Para fazer esta avaliação criei um conjunto de dados para realizar uma análise de regressão, conforme a tabela a seguir:

Sendo a equação da reta definida por y = a + bx, podemos calcular o coeficiente angular (b) por meio da fórmula:

E o coeficiente linear (a) pode ser obtido como:

xm e ym representam os valores médios respectivamente dos valores xi e yi.

Para podermos determinar estes valores vamos criar colunas auxiliares para determinação dos componentes das equações acima. Obtemos então:

Logo abaixo calculamos os somatórios, contagens e valores médios. Estão destacados em amarelo, os valores que são utilizados para os cálculos dos coeficientes.

De posse destes valores, é possível obter os resultados para os coeficientes a e b.

Portanto, temos que a equação da reta que melhor se ajusta a este conjunto de dados, calculada através do método dos mínimos quadrados é y = -0,2355+ 1,9874 x.

Além dos cálculos dos coeficientes, é importante o valor do quadrado do coeficiente de regressão (R2). Este coeficiente permite-nos avaliar o grau de adequação do nosso modelo à curva encontrada.

Fórmula de cálculo:

Ajustando a tabela anterior para calcular os coeficientes de (yi-ym)2, temos:

O valor calculado para R2 foi, portanto, 0,9981.

Uma vez obtidos estes valores, vamos compará-los com aqueles obtidos pelas funções INCLINAÇÃO(), INTERCEPÇÃO() e RQUAD().

Vemos que os valores obtidos são os mesmos. Concluímos então que estas funções realizam os cálculos conforme esperado e fornecem valores confiáveis.

Como última etapa, vamos verificar os valores fornecidos através da equação da reta e do coeficiente R2 fornecidos a partir da linha de tendência de um gráfico de dispersão:

A equação e o valor de R2 são os mesmos obtidos anteriormente.

Após todas estas comparações, podemos concluir que os resultados obtidos para uma regressão linear são confiáveis quando calculados por meio das funções do Excel ou apresentados pela linha de tendência.

Recomendo que repitam este tipo de análise, caso necessitem utilizar outros cálculos estatísticos no Excel para que tenham a certeza, como tenho agora, que os resultados são confiáveis.

Veja os resultados no arquivo: Confiabilidade Estatística

Anúncios

In Excel We Trust

Marcado com: , , ,
Publicado em Nível: Intermediário
7 comentários em “0115-Podemos confiar nos cálculos estatísticos no Excel?
  1. Carlos disse:

    Parabéns pelo artigo, vou até recomendar a vários estudantes com dúvidas à esse respeito.

  2. Marconi Pierre de Vasconcelos disse:

    Adilson, leio todos os seus artigos. São muito bons. Parabéns!

  3. Luiz Daniel de Campos disse:

    Adilson, tenho feito o mesmo teste com funções quadráticas no Excel. Minha experiência com essas funções, principalmente quando uso datas como valores x (convertidos no número serial dessas datas), tenho obtidos resultados extremamente incoerentes no Excel. Se quiser, lhe envio uma série de dados e você pode fazer os testes (talvez eu seja a origem do problema?)

  4. Lucas disse:

    A um tempo atras eu estava fazendo relatorio de um laboratório de fisica no excel e em um determinado momento a celula que continha o desvio padrão de uma série de número identicos deu diferente de 0. a o valor do desvio tinha uma grandeza por volta de 10^-16.
    A principio pensei que o problema era alguma merda que eu tinha feito, ai fiz vários testes com séries de numeros identicos, nas quais o desvio dava 0 para a maioria e o mesmo valor diferente de zero pro restante.
    Parece que uma tese de economia com consideravel impacto foi refutada a um tempo atras, depois que alunos do MIT encontraram alguns erros nos calculos do excel que levaram a valores incorretos na tese.

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s

%d blogueiros gostam disto: