21 maio 2014
Correlação espúria
Quando a correlação espúria aparece na pesquisa, a tendência é tentar criar uma teoria para explicar a existência de relação entre as duas variáveis. E que não possui explicação: a relação estatística deve-se ao acaso.
16 janeiro 2014
Correlação espúria
mostra uma situação onde é possível surgir uma correlação espúria.
Considere que a população de atores que aspiram um papel num filme não possua correlação entre a qualidade como ator e a atração física. É razoável supor que os diretores do cinema possuem uma predileção por atores bonitos e que atuam bem. Observe a figura a seguir:
Cada ponto é um ator, classificado pela sua qualidade em atuar e sua beleza física. Os pontos estão distribuídos, existindo aspirantes a atores de todo tipo (ruins e bons; feios e bonitos). Como os diretores preferem certo padrão de atores, em termos de qualidade e atração física, da população de aspirantes a atores somente alguns serão escolhidos. Na figura, dos inúmeros pontos, os atores que conseguem papel num filme provavelmente estão numa escala superior em termos de qualidade e atração física (os pontos mais escuros da figura).
Suponha que um cientista deseje estudar os atores. Apesar de o conjunto ser cada ponto do gráfico, este cientista provavelmente irá compor sua amostra pelos atores que estão trabalhando, ou seja, os pontos escuros do gráfico. Mas esta amostra não é representativa da população; pelo contrário, é enviesada. Uma pesquisa poderia concluir, por exemplo, que existe uma relação inversa entre atração física e qualidade do ator, baseado nesta amostra (novamente, os pontos mais escuros do gráfico). Temos aqui um típico caso de correlação espúria.
16 março 2010
Correlação espúria
A correlação espúria diz respeito a existência de um vínculo estatístico entre duas variáveis, mas onde não existe nenhuma explicação lógica para tal fenômeno. Em termos mais técnicos, o coeficiente de correlação – medida que mensura a relação existente entre duas variáveis – é elevado, muito embora não seja possível estabelecer uma relação de causa e efeito.
Existem muitos exemplos de correlações espúrias. Entretanto, algumas delas talvez não sejam efetivamente espúrias. Uma delas associa o comportamento do mercado de ações com o tamanho da saias das mulheres. Esta correlação, destaque no livro de Malkiel sobre a irracionalidade dos mercados, é uma das mais clássicas existentes. Entretanto, seria efetivamente espúria? Um ex-aluno apresentou em sala de aula uma explicação interessante para esta relação: as aplicações em ações são investimentos tipicamente de risco, indicando uma confiança na economia. Além disto, a ação é tipicamente um investimento liberal, que nos costumes é refletido por saias menores.
Outra relação interessante refere-se ao consumo de cuecas e crescimento da economia. Existe o consumo de roupas íntimas como aproximação para o comportamento da economia foi proposto pelo ex-presidente do Banco Central dos EUA, Alan Greenspan. Em situações de crise, os homens evitam renovar seu guarda-roupa de cuecas, já que é uma roupa que não "aparece" para o público.
Em outros casos, existe uma explicação bastante razoável para uma pretensa correlação espúria. Existe uma relação entre capa de revista e desempenho de uma empresa. Na realidade, esta relação foi constatada inicialmente nos esportes. Observou-se que os atletas que eram capas nas revistas esportivas tinham um desempenho pior após ser destaque. Quando comento sobre este assunto em sala de aula, digo aos meus alunos que isto se refere ao índice Obina, uma justa homenagem ao artilheiro do Clube Atlético Mineiro. Quando Obina faz quadro gols numa partida torna-se destaque na imprensa esportiva. Mas nos jogos seguintes, o desempenho de Obina volta ao seu normal. Isto é que os estatísticos chamam de "reversão à média". Do mesmo modo, quando uma empresa é destaque na capa de uma revista, provavelmente isto ocorre em razão do desempenho passado. Neste caso, é hora de vender da ação daquela empresa.
Em geral, as correlações espúrias não são consideradas de forma séria pelos pesquisadores. É o caso, por exemplo, da relação entre o preço do ouro e a quantidade de jóias existentes no pescoço de Mr. T. Outros casos mostram que estas correlações podem ser representações de superstições, como as irracionalidades associadas aos números: na China, por exemplo, o número oito é sinal de sorte. Assim, uma empresa que consiga fazer uma associação com este número deverá ter um bom desempenho pela própria crença dos investidores de que o número está associado a uma boa superstição.
29 setembro 2007
Correlação espúria
Uma notícia interessante aqui afirma que a melhor medida de correlação com o índice da bolsa de valores norte-americana (SP 500) é a produção de manteiga em Bangladesh. Este é um exemplo de correlação espúria.
27 fevereiro 2019
Teoria na Era do Big Data
- Na era do Big Data, há um questionamento se a teoria ainda é importante
- A grande presença de dados pode alterar a escolha sobre como fazer uma pesquisa
- O perigo é a possibilidade de correlação espúria
Uma vez que a pesquisa científica está usando cada vez mais dados, em grandes quantidades, há um questionamento se a teoria ainda é importante. Jackson, em The Role of Theory in an Age of Design and Big Data, discussa a questão sob a ótica dos economistas. Mas sua visão pode ser expandida para a contabilidade. Ele relembra que recentemente Duflo afirma que economistas seriam como plumbers encanadores, onde o trabalho envolve questões para melhorar a vida das pessoas. E acrescenta que as pesquisas teóricas estão em claro declínio: eram 57% dos artigos publicados em 1983 e representava 19% em 2011. Mas na visão dele, a teoria ainda é necessária na era do design e do big data.
Uma típica pesquisa na era do Big Data coleta uma grande quantidade de dados e procura extrair dali algum tipo de relação estatística. Explora as informações, sem um conhecimento prévio do que pode encontrar. Com o resultado encontrado, o pesquisador tenta buscar teorias que poderia sustentar os achados. Um trabalho deste tipo começaria com a metodologia e análise dos dados para depois fazer a revisão da literatura ou revisão da teoria (são coisas distintas). Alguns pesquisadores acham que esta maneira de fazer pesquisa está errada. É uma opinião baseada no fato de que, em alguns casos, os achados não possuem vínculo com uma base teórica. Isto ocorre quando temos a situação de correlação espúria (aqui, aqui, aqui e aqui), onde o tamanho do vestido apresenta correlação com o comportamento do mercado acionário.
Entretanto, é inegável que algumas descobertas da ciência são feitas desta forma. O que parece estranho quando temos o resultado, pode ser um achado importante. O famoso paper de Fama e French usou uma pesquisa deste tipo para chegar ao modelo de três fatores, segundo afirma Justin Fox. Criticando Fama, é bem verdade.
Para o pesquisador, é importante saber que sua escolha por este tipo de pesquisa também leva a algumas escolhas de técnicas. Uma pesquisa que trabalha os dados, “sem uma teoria”, deveria usar o método Stepwise na regressa múltipla; já uma pesquisa com base teórica precedendo a análise dos dados poderia optar pelo método Enter (vide Andy Field no seu livro de estatística).
Imagem, a partir de uma imagem retirada daqui
17 fevereiro 2011
Por que este blog decidiu postar sobre a capa da Sports Illustrated?
Uma razão básica para não fazê-lo: a correlação entre a capa e o mercado é uma correlação espúria. Ou seja, decorre de um acaso, não de um fato científico. Isto foi alertado pelo comentário do professor Jomar. E ele tem razão.
Mas temos três fortes motivos para postar sobre este fato. Em primeiro lugar, a possibilidade de fazermos uma pesquisa e encontrarmos uma correlação espúria é muito grande. Além disto, isto alerta-nos para a necessidade de ter uma teoria para explicar nossos testes estatísticos.
Em segundo lugar, o mundo de negócios realmente discute a capa da revista. Seja por diversão ou por achar que é um assunto que merece ser discutido.
Finalmente, tratar de contabilidade não significa que devamos ser restritos com o que ocorre no mundo. E, convenhamos, foi uma postagem muito bonita.
29 dezembro 2011
O melhor do Blog Contabilidade Financeira
Bom, hoje é meu aniversário então posso publicar mais uma postagem com viés. Alguém comentou anteriormente que é difícil escolher postagens preferidas e tenho que concordar! Por isso escolhi, para esta retrospectiva, as que mais me marcaram (que acabam entrando para as mais preferidas também) – e que, adicionalmente, não fui eu que escrevi. ;) As minhas já foram na “retrospectiva pessoal”.
Quando eu comecei a seguir o blog (que hoje é unificado e faz parte do blogspot – mas já caminhou por várias estradas até chegar aqui) eu me apaixonei pela parte comportamental. Na época em que eu estava na graduação não havia muito espaço para matérias com esse foco, o que aumentou o meu deslumbramento. Eu me lembro que a postagem que mais me marcou foi uma sobre contabilidade criativa, que não mais está disponível nos arquivos.
De qualquer forma, um dos textos mais importantes, que se eu pudesse obrigaria a leitura (que os meus futuros alunos se preparem) é o “correlação espúria”. (Sempre que eu ouço algo sobre isso me lembro do professor César e dessa postagem). De forma simplificada e resumida: para saber se há associação entre as variáveis, realiza-se um teste de correlação – todavia, o coeficiente de correlação não mede a relação causa-efeito entre as variáveis, apesar de que possa estar presente. Uma correlação fortemente positiva entre X e Y não autoriza afirmar que variações em X provocam variações em Y, ou vice-versa (esta recente postagem ilustra bem – só porque existe correlação entre o aumento de usuários do Facebook e da dívida na Grécia, não significa que uma causa a outra. Alguém discorda?).
Outra linha surpreendente de postagens é a que envolve a contabilidade do tráfico brasileiro. Esta fala sobre como os cadernos são organizado. Há contabilização de conserto de armas, cestas básicas (quem diria), pagamento a presos, armas e munição. Já esta comenta sobre como sempre que um policial encontra a lista de clientes, afirma que é a contabilidade dos traficantes. Já aqui é apresentada uma estimativa do valor do “negócio” do tráfico no Rio de Janeiro – comparável a grandes empresas listadas na BMF&Bovespa.
Entretanto, a minha paixão maior recai sobre as postagens que envolvem dicas ou comentários sobre pesquisa. Cito algumas: “conselhos de um econometrista”, “conselhos para um orientando”, “evolução” (sobre a forma das apresentações em Power Point), “como achar um tema para a sua pesquisa?”, “o que deve conter um resumo?”, e várias outras mais *adusem dos mecanismos de busca disponibilizados pelo blog).
Acho que já relembrei muitas postagens para vocês lerem neste fim de ano né? Então hoje fico por aqui. Espero que gostem das indicações, das releituras, das lembranças.
Ah! E relembrando: hoje é meu aniversário. De presente? Espero boas energias e a sua presença constante por aqui.
15 fevereiro 2012
Correlação Espúria
Isto é o que chamamos de correlação espúria. É o caso da relação entre o comportamento do mercado acionário e a capa da revista Sports Illustrated (vide postagem de hoje sobre o assunto)
08 abril 2009
Correlação e Causalidade
O gráfico mostra dados históricos e comparativos entre o número de mortes nas estradas dos EUA e, no eixo "x", a importação de limão do México. A correlação é elevada. Mas existe causalidade? (Fonte, aqui)
Em pesquisas empíricas é necessário tomar cuidado com a existência de correlação, mas ausência de relação causa-efeito. A chamada correlação espúria.
22 junho 2023
O perigo das correlações apressadas nas pesquisas realizadas na pandemia
A publicação rápida e não criteriosa de correlações durante a pandemia de COVID-19 pode ter gerado algumas pesquisas com qualidade duvidosa. Um estudo relacionou o aumento de eventos cardiovasculares graves em Israel durante a vacinação contra a COVID-19, em pessoas com menos de 40 anos. Embora a correlação pareça estatisticamente significativa, tudo leva a crer que é clinicamente irrelevante.
Muitas publicações durante a pandemia foram apressadas, possivelmente sem uma revisão rigorosa por pares, levando ao desperdício de esforços científicos. Na estatística temos vários exemplos de correlações sem sentido, como a relação entre o consumo de chocolate e o número de ganhadores do Prêmio Nobel, para ilustrar o problema de interpretação incorreta dos dados de correlação. Este é o fenômeno de correlação espúria, que já destacamos várias vezes no blog.
O estudo de Israel, por exemplo, possui várias falhas na análise estatística e as conclusões não são sustentadas pela metodologia adequada. Publicar correlações é válido, desde que não sejam interpretadas erroneamente ou consideradas como evidências científicas ou relevantes para políticas.
As correlações devem ser publicadas, mas é importante interpretá-las corretamente e evitar conclusões equivocadas.
Baseado aqui. Foto Oliver Roos
12 novembro 2009
Rock e Petróleo
Correlação estatística? Sim. Mas não existe teoria para explicar tal correlação. Denominamos de correlação espúria
10 dezembro 2011
Correlação e causalidade
Uma das minhas postagens preferidas aqui do blog é a que fala sobre correlação espúria por ser um assunto extremamente pertinente não só na vida academica, mas principalmente fora dela. Quem nunca leu uma reportagem na qual o jornalista faz conclusões absurdas sem o devido embasamento!? (O Phd Comics tem uma tirinha super engraçada com esse tema, mas não consegui encontrar e vou ficar devendo. Se alguém achar, deixe o link nos comentários, ok?)
Para refrescar o assunto, uma postagem da PharmaCoaching:
(...)
Desde os seus primórdios, o homem sempre tentou encontrar sentido para tudo o que acontecia ao seu redor. Buscava explicações, inclusive, para fenômenos naturais como a chuva, o nascimento de um bezerro, ou um apêndice inflamado.
Tal comportamento explica-se pela necessidade de estar no controle: se você sabe as causas, você pode tentar controlar as consequências; se não sabe, aquilo está fora do seu controle.
Para atender a esta necessidade em encontrar explicações, valia qualquer coisa, inclusive encontrar padrões onde eles não existiam. Dos primórdios da humanidade até hoje, costumamos confundir coincidência (fatos que acontecem juntos por puro acaso) com causalidade (um fato causando e sendo responsável pelo outro).
Se um homem das cavernas subia numa árvore antes da chuva, ele fazia todos subirem em árvores quando queria que chovesse novamente. Se a vaca comesse um jiló e o bezerro nascesse forte, a dieta básica das vacas prenhas passava a ser jiló. E se alguém matasse um besouro na véspera de o seu apêndice estourar, o inseto tornava-se intocável.
(...)
Superstições nascem, assim, de coisas que coincidentemente acontecem antes dos eventos aos quais estamos prestando atenção. A relação é reforçada, ainda, porque convenientemente nos esquecemos das vezes em que o evento acontece sem que a coisa tenha ocorrido antes.
Quando enxergamos um padrão onde ele não existe, cometemos um Erro Tipo I - ou um Falso Positivo. Mas quando não enxergamos um padrão onde, de fato, ele existe, cometemos um Erro Tipo II - ou um Falso Negativo. Vejamos um exemplo prático:
Um paciente chega ao pronto socorro queixando-se de dores no peito. O médico plantonista precisa avaliar se ele está enfartando ou não.
Se o paciente não estiver enfartando e o médico disser que ele está bem de saúde, então o diagnóstico está correto. Se o médico disser, no entanto, que este paciente (que não está enfartando) deve receber o tratamento indicado para casos de enfarte, incorrerá num Erro Tipo I, ou Falso Positivo (dizer que ele tem uma condição que ele, na verdade, não tem).
Se o paciente estiver enfartando e o médico fizer o diagnóstico correto, ele receberá o tratamento adequado. Mas se estiver enfartando e o médico disser que não está, temos um clássico exemplo de Erro Tipo II, ou Falso Negativo (dizer que ele não tem uma condição que ele, na verdade, tem). (...)
Em situações novas, sempre estamos sujeitos a cometer um dos dois tipos de erros - mas nunca sabemos qual. O problema consiste, então, em avaliar o quanto cada erro pode custar. No exemplo acima, um Falso Positivo fará com que o paciente receba um tratamento de que não precisa, enquanto que com um Falso Negativo ele correrá risco de morte.
Assim, o custo de um Falso Negativo (risco de morte) é maior do que o risco de um Falso Positivo (gastos com tratamento desnecessário e possíveis eventos adversos). Em Medicina, este tipo de preferência em pecar pelo excesso é, de certa forma, justificável pois, muitas vezes, as consequências são irreversíveis.
Em muitas situações do dia-a-dia, contudo, os custos cumulativos dos Falsos Positivos acabam não aparecendo na conta final - exatamente porque não os percebemos.
A capacidade de encontrar padrões representa uma das mais valiosas habilidades das pessoas criativas. Mas quando em excesso, dá margem às superstições ou, em casos mais patológicos, à paranoia.
Para fugir das armadilhas do causalismo é preciso questionar se as relações que você está enxergando realmente fazem sentido (usar a mesma camisa em todas as provas faz você ficar mais inteligente?). Ao avaliar a ligação entre dois eventos, veja se não há um terceiro que cause os dois e, principalmente, se aquele que causa ocorre antes daquele que é causado.
10 fevereiro 2010
Previsão para o ano
Segundo o indicador Sports Illustrated Swimsuit Issue o mercado acionário neste ano deverá ter um desempenho acima da sua média histórica.
Por este indicador, a nacionalidade da modelo da capa da edição da revista Sports Illustrated swimsuit edition está relacionada com o retorno do mercado acionário: se a capa é uma modelo dos EUA o desempenho é melhor.
Entre 1978 a 2008 o retorno da SP 500, índice de mede o desempenho das ações no mercado do EUA, foi de 10,5%. Mas quando a modelo era dos EUA o retorno foi de 13,9%; se a modelo era não-estadunidense o retorno era de 7,2%.
Mas no período, o maior retorno, de 34,1% em 1997, teve uma modelo da República Tcheca.
Este ano a revista tem como modelo Brooklyn Decker, também conhecida como esposa do tenista Andy Roddick. (Foto ao lado)
Obviamente que está é uma situação onde a elevada correlação não significa necessariamente a existência de uma teoria. Ou seja, é uma correlação espúria.
Aqui postagem deste blog do ano passado.
14 janeiro 2009
O indicador do Super-Bowl
E a previsão para este é que o mercado deverá crescer.
Veja mais aqui
24 julho 2019
Erros Comuns na Pesquisa
Efeito cobra - O império Britânico queria reduzir as mortes por cobra na Índia e ofereceram um incentivo financeiro para cada pele de cobra trazida, para motivar a caça à cobra. As pessoas começaram a criar cobra. Neste caso, um incentivo para resolver um problema criou consequências negativas.
P-Hacking (ou Data Dredging) - Testes estatísticos depende da definição prévia da hipótese. Caso contrário, haveria uma "drenagem" dos dados e mudança no que está sendo testado. Para reduzir este efeito, é importante registrar antecipadamente o que está sendo testado.
Gerrymandering - A origem do termo é manipular os distritos políticos para permitir a vitória de um partido. Na figura, na parte de cima, a simples contagem mostra a vitória das pretas; mas ao dividir os "votos" em "distritos", as verdes vencem, mesmo não tendo maioria dos votos. Na análise dos dados, algumas escolhas podem afetar a conclusão, assim como a escala usada.
Reversão à média - Ocorre quando o acaso pode desempenhar um papel importante no resultado. Um jogador de futebol de baixa habilidade que marcou três gols em uma partida poderá voltar ao seu desempenho normal no próximo jogo. Um fundo de investimento que apostou certo, pode reverter a média no próximo ano.
16 abril 2008
Efeito Tiger Woods
Tiger Woods terminou em segundo lugar no Masters tournament deste ano. Segundo analistas do BNP Paribas, quando Woods ganha o troféu, o retorno médio do Lehman Brothers Aggregate Bond Index é de 1.09% e um retorno médio de 1,11% para Treasurys. Em quatro ocasiões Woods venceu o Masters: 1997, 2001, 2002 e 2005. Quando não venceu, o Lehman Aggregate teve um retorno negativo de 0.12% e Treasurys também ficou negativo (0,33%).
Eis mais um caso de correlação espúria.
Fonte: Aqui
15 outubro 2011
Esta será a sua iniciação
O propósito principal do blog é postar assuntos relacionados à contabilidade financeira. É o nosso foco, o nosso principal interesse e o nosso compromisso. Também publicamos assuntos relacionados à academia, tal como pesquisa e pós-graduação. Gostamos ainda de economia, administração e comportamento. Vez ou outra, achamos interessante repassar um texto que nada tem a ver com esses assuntos, mas que são divertidos e merecem ser divulgados. Postamos testes (participem deles nos comentários. Assim ficará mais divertido!), quadrinhos e diversão (“Rir e o melhor remédio”), além de uma postagem intitulada “links” que muitas vezes agrega tanto a contabilidade, quanto aqueles tópicos que comentamos nada ter a ver com o mundo das finanças, no entanto que são ótimos.
Enfim, o nosso propósito aqui é informar e educar, mas também divertir e descontrair. Naveguem conosco pelo blog. Comentem. Utilizem exageradamente os campos de busca. Muitas postagens não se desatualizam com o tempo, como por exemplo:
O patrimônio é o objeto da contabilidade?
3 mitos sobre o capitalismo
Dicas para não afundar em dívidas
Correlação espúria
Como achar um tema para pesquisa
Como ler um artigo acadêmico
Como escolher um tema para a monografia
Como melhorar o seu referencial teórico
Doze dicas para maximizar o seu potencial
Para tomar decisões melhores
Efeito beleza
Por que você deve manter em segredo os seus objetivos?
Aguardamos você por aqui!
30 julho 2019
12 fevereiro 2016
Links
Contabilidade criativa continua, agora com as reservas do Banco Central (mais aqui)
Problema de bebida e depressão entre os advogados dos EUA
Correlação espúria
Comercial da Pepsi de 1992 com Cindy Crawford é recriado como paródia
Quanto maior a remuneração dos funcionários, maior o desempenho das ações
09 janeiro 2014
Indicador pouco convencional
Alguns destes índices são bizarros, como a relação entre o tamanho da saia usada pelas mulheres e o mercado acionário. Outros possuem uma explicação razoável, como o aumento no número de pesquisas da palavra “desemprego” no Google durante as recessões. No primeiro caso é difícil arrumar uma explicação; no segundo, a relação parece óbvia. Chamamos o primeiro caso de “correlação espúria”, como talvez seja o caso da capa da Sports Illustrated ou o fato de Aaron Ramsey, um jogador do Arsenal, marcar gols quando acontece a morte de alguém importante.
Em geral estes índices possuem uma relação estatística forte e, por este motivo, passam a exercer uma atração por parte das pessoas, sendo muitas vezes tratado com seriedade. É o caso da relação entre o consumo de pornografia e jogos de azar e os padrões de gastos da economia. Criou-se inclusive um índice para determinar a primeira variável , denominado Vice Index, que consegue determinar com uma precisão de quase 90%, o gasto de consumo individual. Acredita-se que quando os tempos são ruins, as pessoas param de gastar nos seus vícios, no caso pornografia e jogos de azar.
Parece que quando a economia vai mal: aumenta a tentativa de procurar namoros, o consumo de pipocas no cinema (e de bilhetes de filmes que ajudam a fugir da realidade), a quantidade de corpos que não são reclamados nos IMLs, o número de garçonetes atraentes (fotografia), a quantidade de abuso infantil, os descontos na aquisição dos automóveis, o número de mortes de bicicleta, a quantidade mordida de mosquito, o número de vezes que a palavra “recessão” aparece na imprensa, o consumo de gravatas, os laços das gravatas ficam mais “magros”, a construção de arranha-céus, o retorno de ligações telefônicas de prestadores de serviços, e o consumo de aspirina e Tylenol. Mas reduz a propaganda de alistamento militar, o consumo de fralda, o consumo de cerveja em bares, a taxa de divórcio, o consumo de relógios suíços, a quantidade de lixo e as prostitutas.