Translate

Mostrando postagens com marcador dados. Mostrar todas as postagens
Mostrando postagens com marcador dados. Mostrar todas as postagens

04 janeiro 2026

Um histograma que mostra um problema na ciência moderna

Há cinco anos, escrevi um pequeno artigo sobre o filtro de significância, a maldição do vencedor e a necessidade de “shrinkage” (em coautoria com Eric Cator). O principal objetivo era publicar alguns resultados matemáticos para referência futura. Para tornar o artigo um pouco mais interessante, quisemos acrescentar um exemplo motivador. Encontrei então um trabalho de Barnett e Wren (2019), que coletaram (scraped) mais de um milhão de intervalos de confiança de estimativas de razões a partir do PubMed e os disponibilizaram publicamente. Convertemos esses intervalos de confiança em estatísticas z, construí um histograma e fiquei impressionado com a ausência de estatísticas z entre −2 e 2 (ou seja, resultados não significativos).

(...) muitos memes foram criados. 


Para marcar o quinto aniversário do histograma, quis reagir a alguns comentários típicos. Por exemplo, Adriano Aguzzi comentou:

“Não vamos hiperventilar com isso. É da natureza das coisas que resultados negativos raramente sejam informativos e, portanto, raramente sejam publicados. E isso é perfeitamente legítimo.”

É decepcionante — para dizer o mínimo — que muitas pessoas ainda não percebam o problema de distorcer o registro científico ao relatar e publicar seletivamente apenas resultados que atendem ao critério p < 0,05.

Outro comentário típico (Simo110901) foi:

“Não acho que isso seja inerentemente ruim. Parte desse viés certamente vem do viés de publicação, mas uma parcela significativa (esperamos que a maioria) pode decorrer do fato de que pesquisadores costumam ser muito bons em formular hipóteses bem fundamentadas e, portanto, conseguem rejeitar resultados nulos na maioria dos casos.”

Muitos outros comentaristas também acreditam que a ausência de resultados não significativos se deve à capacidade dos pesquisadores de dimensionar seus estudos com precisão, de modo a obter significância estatística com um desvio mínimo para cima. Isso é muito improvável. Na figura abaixo, comparo as estatísticas z de Barnett e Wren (2019) com um conjunto de mais de 20.000 estatísticas z referentes aos desfechos primários de eficácia de ensaios clínicos extraídos da Cochrane Database of Systematic Reviews (CDSR).


O histograma da CDSR (à direita) não apresenta uma lacuna perceptível. Não posso afirmar com certeza a razão disso, mas arriscaria dizer que se deve ao fato de que ensaios clínicos constituem pesquisa séria. Em geral, eles são pré-registrados, no sentido de que possuem um protocolo aprovado por um Comitê de Ética em Pesquisa (Institutional Review Board). Além disso, são caros e demorados, de modo que, mesmo quando os resultados não são significativos, seria um desperdício não publicá-los. Por fim, não publicar seria eticamente problemático em relação aos participantes do estudo.

Outro comentário típico (Daniel Lakens) afirma:

“Isso não é um retrato preciso do quanto a literatura é enviesada. Os autores analisam apenas valores-p presentes nos resumos.”

Barnett e Wren (2019), no entanto, coletaram estatísticas z tanto de resumos quanto de textos completos. Os dados de texto completo estão disponíveis para artigos hospedados no PubMed Central. No total, há 961.862 resumos e 348.809 textos completos. A seguir, apresento as estatísticas z separadamente. As distribuições são notavelmente semelhantes, embora haja uma proporção ligeiramente maior de resultados não significativos nos textos completos.

Qualquer algoritmo automatizado de coleta de dados (scraping) inevitavelmente deixará passar algumas informações. É bastante possível que resultados não significativos que não apareçam no resumo ou no texto principal ainda sejam reportados em tabelas separadas, apêndices ou materiais suplementares. No entanto, duvido que isso explique a enorme lacuna observada. Estou bastante convencido de que as estatísticas z extraídas do PubMed realmente fornecem fortes evidências de viés de publicação contra resultados não significativos na literatura médica. Ainda assim, é importante notar que a sub-representação de estatísticas z entre −2 e 2 provavelmente não se deve apenas ao viés de publicação, mas também ao fato de os autores não reportarem intervalos de confiança para resultados não significativos. Evidentemente, isso tampouco é algo desejável.

Fonte: aqui 

Tinha pensado inicialmente em postar somente um trecho do artigo. Mas achei bem interessante e importante e acima tem o texto quase completo. A mensagem é clara: o não resultado também é importante para a ciência.  


11 maio 2023

Torturando os dados para prever preço de bitcoin

 De um trecho do livro Distrust, de Gary Smith, sobre uma pesquisa de Yukun Lin e Aleh Tsyvinski, publicada no NBER, eu encontrei uma consideração crítica ao uso da tortura de dados. Inicialmente o resumo da pesquisa de Lin e Tsyvinski: 

Estabelecemos que a troca de risco-retorno de criptomoedas (Bitcoin, Ripple e Ethereum) é distinta da de estoques, moedas e metais preciosos. As criptomoedas não têm exposição aos fatores macroeconômicos e do mercado de ações mais comuns. Eles também não têm exposição aos retornos de moedas e mercadorias. Por outro lado, mostramos que os retornos das criptomoedas podem ser previstos por fatores específicos dos mercados de criptomoedas. Especificamente, determinamos que há um forte efeito de momento da série temporal e que os proxies para a atenção do investidor prevêem fortemente o retorno da criptomoeda. Finalmente, criamos um índice de exposições a criptomoedas de 354 indústrias nos EUA e 137 na China.

A principal crítica do trabalho de L&T, feita por Gary Smith,  é a busca por relação entre variáveis:

Liu e Tsyvinski relatam correlações entre o número semanal de pesquisas do Google pela palavra bitcoin (em comparação com a média nas últimas quatro semanas) e as variações percentuais nos preços do bitcoin uma a sete semanas depois. Eles também analisaram a correlação entre a proporção semanal de pesquisas de hackers de bitcoin e as variações percentuais nos preços de bitcoin uma a sete semanas depois. O fato de eles terem relatado resultados de pesquisa de bitcoin olhando para trás quatro semanas e para frente sete semanas deve nos alertar para a possibilidade de que eles tentem outras combinações de retrocesso e encaminhamento que também não funcionaram. O mesmo vale para o fato de que eles não olharam para trás quatro semanas com pesquisas de hackers de bitcoin. Evidentemente, eles torturaram os dados em sua busca por correlações.

Mesmo assim, apenas sete de suas catorze correlações pareciam promissoras para prever os preços do bitcoin. Owen Rosebeck e eu examinamos as previsões feitas por essas correlações durante o ano seguinte ao estudo e descobrimos que elas eram inúteis. Eles também podem ter lançado moedas para prever os preços do bitcoin.


Este tipo de questão é comum em pesquisa empírica. É feito um monte de modelo e somente aqueles que apareceram com significantes que são relatados. 

Tradicionalmente, a pesquisa empírica começa especificando uma teoria e depois coletando dados apropriados para testar a teoria. Muitos agora adotam o atalho para procurar padrões em dados não onerados pela teoria. Isso é chamado de mineração de dados, na medida em que os pesquisadores vasculham os dados, sem saber o que encontrarão.

Estamos empenhados em buscar padrões, mas o dilúvio de dados torna a grande maioria dos padrões esperando para ser descoberta ilusória e inútil. Bitcoin é novamente um bom exemplo. Como não existe uma teoria lógica (exceto ganância e manipulação de mercado) que explique flutuações nos preços do bitcoin, é tentador procurar correlações entre os preços do bitcoin e outras variáveis sem pensar muito sobre se as correlações fazem sentido. Além de torturar dados, Liu e Tsyvinski extraíram seus dados.

Eles calcularam correlações entre os preços do bitcoin e outras 810 variáveis, incluindo itens caprichosos como o dólar canadense - EUA. taxa de câmbio do dólar, preço do petróleo bruto e retorno de ações nas indústrias automobilística, de livros e de cerveja. Você pode pensar que estou inventando isso. Infelizmente eu não sou.

(Tradução via Vivaldi). Foto Jan Canty

14 maio 2021

Contador e a Ciência dos Dados



Um relatório do IFAC e do CPA do Canadá lembra a relevância da ciência dos dados para contabilidade. Eis o resumo:

Conforme as economias digitalizam, as organizações de todos os tamanhos, em todos os setores, enfrentam enormes perturbações e oportunidades. Os contadores devem expandir sua abordagem para incluir conjuntos de dados estruturados e não estruturados para apoiar as organizações na tomada de decisões (...) um relatório conjunto lançado pela IFAC e os Contadores Profissionais do Canadá (CPA Canadá), delineia uma cadeia de valor de gerenciamento de dados e explora quatro papéis-chave que os contadores podem ocupar dentro dela: Engenheiro de Dados, Controlador de Dados, Cientista de Dados e Assessor Estratégico. 

As organizações estão enfrentando escassez crônica de habilidades nestas áreas, e os contadores têm a oportunidade de ocupar estas funções. O relatório inclui estudo de caso destacando como os contadores profissionais em diferentes funções, tais como o CFO, podem ampliar suas funções na condução de decisões orientadas por dados. 


Clique aqui para obter cópia do relatório de 38 páginas

12 março 2018

Tapiwa Chiwewe: Você não precisa ser um especialista para resolver grandes problemas


Ao dirigir em Joanesburgo um dia, Tapiwa Chiwewe percebeu uma nuvem gigantesca de poluição atmosférica pairando sobre a cidade. Ele estava curioso e preocupado, mas não era especialista ambiental - então ele fez umas pesquisas e descobriu que quase 14% de todas as mortes no mundo em 2012 foram causadas por poluição atmosférica doméstica e ambiental. Com este conhecimento e um impulso para fazer algo sobre isso, Chiwewe e seus colegas desenvolveram uma plataforma que revela tendências em poluição e ajuda planejadores urbanos a tomarem melhores decisões. "Às vezes apenas uma nova perspectiva, novas habilidades, podem tornar as condições corretas para algo marcante acontecer" Chiwewe diz. "Mas você precisa ser corajoso o suficiente para tentar."

04 março 2018

Anna Rosling Rönnlund: Veja como vive o resto do mundo, segundo a renda

Como é escovar os dentes na Suécia ou arrumar a cama em Ruanda? Anna Rosling Rönnlund quer que todos nós saibamos como é, por isso ela enviou fotógrafos a 264 casas em 50 países (e vêm mais por aí), para documentar os fogões, as camas, os banheiros, os brinquedos e muito mais, em casas de toda faixa de renda no mundo. Veja como as famílias vivem na Letônia, na Burquina ou no Peru, à medida que Rosling Rönnlund explica como o poder da visualização de dados nos ajuda a compreender melhor o mundo.