Translate

Mostrando postagens com marcador ciência. Mostrar todas as postagens
Mostrando postagens com marcador ciência. Mostrar todas as postagens

11 maio 2023

Torturando os dados para prever preço de bitcoin

 De um trecho do livro Distrust, de Gary Smith, sobre uma pesquisa de Yukun Lin e Aleh Tsyvinski, publicada no NBER, eu encontrei uma consideração crítica ao uso da tortura de dados. Inicialmente o resumo da pesquisa de Lin e Tsyvinski: 

Estabelecemos que a troca de risco-retorno de criptomoedas (Bitcoin, Ripple e Ethereum) é distinta da de estoques, moedas e metais preciosos. As criptomoedas não têm exposição aos fatores macroeconômicos e do mercado de ações mais comuns. Eles também não têm exposição aos retornos de moedas e mercadorias. Por outro lado, mostramos que os retornos das criptomoedas podem ser previstos por fatores específicos dos mercados de criptomoedas. Especificamente, determinamos que há um forte efeito de momento da série temporal e que os proxies para a atenção do investidor prevêem fortemente o retorno da criptomoeda. Finalmente, criamos um índice de exposições a criptomoedas de 354 indústrias nos EUA e 137 na China.

A principal crítica do trabalho de L&T, feita por Gary Smith,  é a busca por relação entre variáveis:

Liu e Tsyvinski relatam correlações entre o número semanal de pesquisas do Google pela palavra bitcoin (em comparação com a média nas últimas quatro semanas) e as variações percentuais nos preços do bitcoin uma a sete semanas depois. Eles também analisaram a correlação entre a proporção semanal de pesquisas de hackers de bitcoin e as variações percentuais nos preços de bitcoin uma a sete semanas depois. O fato de eles terem relatado resultados de pesquisa de bitcoin olhando para trás quatro semanas e para frente sete semanas deve nos alertar para a possibilidade de que eles tentem outras combinações de retrocesso e encaminhamento que também não funcionaram. O mesmo vale para o fato de que eles não olharam para trás quatro semanas com pesquisas de hackers de bitcoin. Evidentemente, eles torturaram os dados em sua busca por correlações.

Mesmo assim, apenas sete de suas catorze correlações pareciam promissoras para prever os preços do bitcoin. Owen Rosebeck e eu examinamos as previsões feitas por essas correlações durante o ano seguinte ao estudo e descobrimos que elas eram inúteis. Eles também podem ter lançado moedas para prever os preços do bitcoin.


Este tipo de questão é comum em pesquisa empírica. É feito um monte de modelo e somente aqueles que apareceram com significantes que são relatados. 

Tradicionalmente, a pesquisa empírica começa especificando uma teoria e depois coletando dados apropriados para testar a teoria. Muitos agora adotam o atalho para procurar padrões em dados não onerados pela teoria. Isso é chamado de mineração de dados, na medida em que os pesquisadores vasculham os dados, sem saber o que encontrarão.

Estamos empenhados em buscar padrões, mas o dilúvio de dados torna a grande maioria dos padrões esperando para ser descoberta ilusória e inútil. Bitcoin é novamente um bom exemplo. Como não existe uma teoria lógica (exceto ganância e manipulação de mercado) que explique flutuações nos preços do bitcoin, é tentador procurar correlações entre os preços do bitcoin e outras variáveis sem pensar muito sobre se as correlações fazem sentido. Além de torturar dados, Liu e Tsyvinski extraíram seus dados.

Eles calcularam correlações entre os preços do bitcoin e outras 810 variáveis, incluindo itens caprichosos como o dólar canadense - EUA. taxa de câmbio do dólar, preço do petróleo bruto e retorno de ações nas indústrias automobilística, de livros e de cerveja. Você pode pensar que estou inventando isso. Infelizmente eu não sou.

(Tradução via Vivaldi). Foto Jan Canty

15 fevereiro 2023

Ciência e fatos: comunicação para afetar as pessoas

Muitos cientistas pensam que basta fazer uma pesquisa de qualidade para que as pessoas fiquem convencidas de uma determinada posição. Mas segundo Anne Toomey, o que faz com que as pessoas mudem que ideia não são fatos, mas as redes sociais, os grupos e as histórias. 

Os cientistas costumam ser ensinados a "apenas seguir os fatos" ao comunicar seus resultados de pesquisa, particularmente em tópicos controversos. "Atender aos fatos" parece um conselho sólido e simples e, além disso, está fundamentado nos valores da ciência para ser o mais objetivo e baseado em evidências possível.


No entanto, é contra intuitivo (e não um pouco irônico) que, "perseguindo os fatos", ignoremos uma riqueza de evidências sobre uma comunicação científica eficaz. Em nosso zelo em comunicar as evidências da ciência, negligenciamos as evidências da comunicação científica.

Durante décadas, a comunicação científica se concentrou no compartilhamento dos "produtos" da ciência. Os cientistas são incentivados a "divulgar" dando palestras públicas, compartilhando resultados nas mídias sociais e conversando com repórteres. Na superfície, essas abordagens fazem sentido. Procuramos transmitir nossas mensagens para o maior público possível - afinal, esses são problemas globais que estamos enfrentando.

Mas essas estratégias são básicas em um "déficit" da comunicação científica. Por exemplo, o principal problema é que, como pessoas não são tão informadas para uma tomada de decisão eficaz. Esse modelo foi ampliado nos campos de comunicação científica, estudos de política e vigilância cognitiva, e substituições por modelos mais holísticos que enfatizam ou empelam a emoção, valores e instinto, e não a informação.

Entre os conselhos apresentados a necessidade de contar uma história. Isto ajuda a lembrar da mensagem, em lugar de um número frio. Parcerias com poetas e roteiristas pode ajudar na criatividade da comunicação científica. Isto sem falar na melhoria da qualidade dos dados gráficos. Outro conselho bastante interessante: use redes sociais em vez de plataformas de mídia nacionais. 

Os cientistas ficam compreensivelmente empolgados quando suas pesquisas são compartilhadas em grandes plataformas de mídia, como cobertura de notícias nacionais ou internacionais. Porém, estudos sobre como a informação se espalha questionam o valor da alta visibilidade para gerar mudanças. (...) essa visibilidade raramente resulta em mudanças generalizadas de comportamento. 

30 dezembro 2022

Consenso científico

A pandemia e algumas discussões políticas, em conjunto com o crescimento de mídias sociais, fez com que a questão do consenso científico adquirisse relevância. O site Skeptical Science trouxe um texto explicativo bem interessante sobre este assunto. As considerações a seguir estão baseadas neste artigo.

Inicialmente é bom destacar que consenso científico (vamos chamar, a partir de agora, de CC) não é sinônimo de verdade absoluta e nem prova de uma teoria científica. Consenso significa que existe uma convergência de evidências, todas aparentemente apontando na mesma direção. O CC não é parte do método científico, mas sim resultado da aplicação dele. Assim, o consenso científico só pode surgir nas discussões onde o método científico é usado. Não existe consenso científico nas coisas da fé. 

Por não ser uma verdade absoluta, o consenso não é infalível, mas significa o que melhor sabemos com as condições atuais sobre um determinado tópico. O desenvolvimento científico, a criação de novos instrumentos ou mais discussões pode mudar este consenso científico. 

Ao contrário de uma eleição ou um grupo social, o CC está baseado no ... conhecimento científico. Conforme lembra o texto, ciência não é democracia. Pelo contrário, é uma ditadura, a ditadura da evidência. Se o conhecimento é estruturado conforme o método científico, este irá prevalecer sobre a opinião dos cientistas. 

Neste sentido, o termo "consiliência da evidência" pode ser importante. Isto significa dizer que muitas evidências, surgidas de forma independente, podem apontar para a mesma conclusão. Isto não significa concordância em todos os aspectos, mas que os resultados gerais são consistentes para diferentes áreas científicas. 

Como o site explora bastante a questão ambiental, o exemplo citado é nesta linha. Diversas áreas, como meteorologia, geologia, geofísica, química atmosférica, entre outras, estudaram a questão do clima e chegaram a resultados consistentes sobre o recente aquecimento global em razão das atividades humanas nos últimos séculos. Isto é um exemplo de consiliência. 

A ciência depende de que as evidências se unam e contem a mesma história. Quando consideramos a temperatura média da Terra, com medições no solo, nos oceanos e em balões no ar, todos os métodos apontam um aumento na temperatura. Além da mera mensuração da temperatura, a observação das geleiras, do nível do mar, o comportamento dos animais, entre outras observações, fazem com que o quebra-cabeça do clima se encaixe e tenhamos uma evidência consistente, que gera o CC.

É na evidência que podemos dizer que a ciência está cumprindo seu papel. Mesmo com todas as evidências, ainda há pessoas que contestam a questão do aquecimento global. A divergência faz parte do CC, pois não existe a necessidade de que 100% dos cientistas estejam convencidos de algo para que faça parte do CC. 


Mas faz parte do CC a diversidade. Em uma questão como o aquecimento global o número de grupos de apoiam esta ideia é muito grande, conforme pode ser notado na figura acima. São países com culturas distintas que chegaram a mesma conclusão. Dos mais de 200 países, 80 deles, os mais relevantes, consideram que o ser humano tem um papel no aquecimento global. Aqui temos não somente CC como diversidade geográfica, social e econômica. 

Isto é diferente de um pequeno grupo de pesquisadores, com formação similar, que chegaram a um acordo. Não, aqui não temos CC, mas uma tendência de pequenos grupos promoverem a harmonia entre seus membros. 

Assim, o CC é baseado na consiliência da evidência, na calibração social e na diversidade social. Tendo os três elementos, provavelmente iremos encontrar o CC. Não será no seu grupo de amigos ou na opinião de uma pessoa. É na ciência. 

30 setembro 2022

Limitação para publicação

Do Statmodeling:

O consultor internacional de biotecnologia Glenn Begley, que está em campanha por vínculos mais significativos entre a academia e a indústria, disse que a fraude na pesquisa é uma história de incentivos perversos. Ele quer que os pesquisadores sejam proibidos de produzir mais de dois ou três trabalhos por ano, para garantir que o foco permaneça na qualidade e não na quantidade.


No começo, pensei que era uma ideia horrível. Alguns de nós têm mais de duas ou três coisas para dizer em um ano Begley está tentando nos silenciar!

Mas então pensei, com certeza, que tudo depende apenas de como você define “artigos de periódicos.”Em vez de publicar 20 artigos de periódicos em um ano, eu poderia colocar 20 artigos no Arxiv e escolher apenas três deles para publicar em periódicos. Isso seria bom pois, na verdade, pouparia meus colaboradores e eu de enormes esforços para lidar com relatórios de revisão, papelada de periódicos e assim por diante. Meus colaboradores e eu poderíamos escrever o quanto sempre escrevemos, apenas com muito mais eficiência.

Então, eu estou de acordo com a proposta de Begley. Não tenho certeza de como isso seria aplicado e não pretendo fazê-lo unilateralmente, mas estou começando a gostar disso como uma política geral.

Então, novamente, você poderá continuar publicando 20 ou mais artigos por ano, mas há uma lógica para dizer que apenas 2 ou 3 podem estar em "jornais".”Ainda existem alguns detalhes que precisam ser elaborados, como contar artigos de coautoria e pensar em publicações não-jornais, como o arxiv.

A Capes, no Brasil, tentou fazer algo sobre isto - provavelmente não intencionalmente - reforçando uma análise somente na produção mais "relevante".

13 setembro 2022

Aglomeração de cientistas compensa?

 Que a aglomeração ajuda na pesquisa científica já sabíamos. O estudo comparou o ganho na produtividade da pesquisa versus o custo de morar em cidades com muitos cientistas:


Cities with a larger concentration of scientists have been shown to be more productive places for additional scientists to do Research and Development. At the same time, these urban areas tend to be associated with higher costs of doing research, in terms of both wages and land. While the literature on the benefits of agglomeration economies is extensive, it offers no direct evidence of how productivity gains from agglomeration compare with higher costs of production. This paper aims to shed light on the balance between local productivity and local costs in science. Using a novel dataset, we estimate place-based costs of carrying out R&D in each US metro area and assess how these place-based costs vary with the density of scientists in each area. We then compare these costs with estimates of the corresponding productivity benefits of more scientist density from Moretti (2021). Adding more scientists to a city increases both productivity and production costs, but the rise in productivity is larger than the rise in production costs. In particular, each 10% rise in the stock of scientists is associated with a 0.11% rise in costs and a 0.67% rise in productivity. This implies that firms moving from cities with a small agglomeration of scientists to cities with a large agglomeration of scientists experience productivity gains that are 6 times larger than the increase in production costs. This finding is consistent with the increased concentration of R&D activity observed over the past 30 years. However, while the productivity estimate has only modest non-linearities, the cost estimates suggest much larger non-linearities as the concentration of scientists increases. For the most concentrated R&D cities, the difference between productivity gains and cost increases is close to zero.

Os autores usaram dados de vários pesquisadores e o local onde trabalharam. Com os dados do custo de vida local, eles puderam verificar se residir em cidades caras compensava. A resposta para pergunta do título é sim. 

01 agosto 2022

Escrita científica piorou?


A linguagem científica deveria ter pouco adjetivo e advérbio. Mas parece que isto não aconteceu, entre 1969 a 2019. 

Writing in a clear and simple language is critical for scientific communications. Previous studies argued that the use of adjectives and adverbs cluttered writing and made scientific text less readable. The present study aims to investigate if the articles in life sciences have become more cluttered and less readable across the past 50 years in terms of the use of adjectives and adverbs. The data that were used in the study were a large dataset of 775,456 scientific texts published between 1969 and 2019 in 123 scientific journals. Results showed that an increasing number of adjectives and adverbs were used and the readability of scientific texts have decreased in the examined years. More importantly, the use of emotion adjectives and adverbs also demonstrated an upward trend while that of nonemotion adjectives and adverbs did not increase. To our knowledge, this is probably the first large scale diachronic study on the use of adjectives and adverbs in scientific writing. Possible explanations to these findings were discussed.

(via aqui)

Poderia argumentar que é a língua inglesa, mas hoje quase todas as ciências produzem nesta língua. 

Foto: aqui

22 março 2022

Credibilidade da ciência e meio de divulgação

Lembro que já orientei uma pesquisa de TCC próxima, sobre o assunto. A fonte da informação pode fazer diferença em termos de credibilidade

projetamos e implementamos duas pesquisas em que os entrevistados indicaram a credibilidade em encontrar informações científicas on-line. Enquanto a primeira pesquisa comparou credibilidade em vários tipos de mídia, incluindo o Twitter, a segunda pesquisa se concentrou mais de perto nos elementos dos Tweets que podem contribuir para uma maior credibilidade. Este estudo nos permitiu estudar como as informações são percebidas on-line, bem como como os pesquisadores podem moldar suas mensagens para se destacar do dilúvio de informações na web.

O poder dessas pistas formais não deve ser subestimado. Nosso trabalho descobriu como as informações científicas on-line podem parecer mais credíveis, alterando apenas onde e como são apresentadas. A mesma descoberta científica foi percebida como mais credível se estivesse alojada em um local on-line mais credível (Fig. 1 [acima]). As capturas de tela de artigos científicos foram consistentemente consideradas as mais credíveis pelos entrevistados, o que sugere que as descobertas científicas originais geralmente começam em uma posição credível. Outros tipos de mídia, como notícias e postagens de blog, também tendem a ser um pouco credíveis. No entanto, obter cobertura da mídia ou escrever uma postagem completa no blog pode estar além das restrições de alcance ou tempo de um acadêmico ocupado. O Twitter, por outro lado, é a plataforma com a menor barreira de entrada para pesquisadores, facilitando o compartilhamento de seu trabalho pelos pesquisadores. Porém, descobrimos que as informações no Twitter eram consistentemente vistas como menos credíveis do que as outras opções.

Com respeito ao Twitter, apresentar uma figura do artigo ou do resumo traz mais credibilidade. 

22 dezembro 2021

Nenhuma evidência

No Astral Codex uma crítica ao uso do termo "nenhuma evidência" por parte da comunicação científica (e também do jornalismo). O termo pode significar:

a) algo que é plausível ou provável, mas que ainda não foi verificado e por isto não temos certeza

b) algo onde temos evidências fortes de que é falso e por este motivo deve ser desmascarado como uma mentira.

O problema é que usamos o termo nos dois sentidos. Por exemplo, "não há evidências empíricas de que o uso do paraquedas ajuda a evitar lesões quando pulamos de um avião". Nesta frase, o sentido seria a letra "a", ou seja, sabemos sobre o assunto, mas ninguém fez um experimento científico para comprovar. Seria melhor dizer claramente isto, não? Outro exemplo, não há evidência de que Dom Pedro tinha baço. Este é o caso de algo que é provável, mas que não foi verificado. 

Resumindo, "não há evidência" não significa dizer "falso". 

Já na frase "não há evidência" de que o óleo de cobra funcione é nos termos da segunda alternativa. Aqui seria melhor dizer "é falso que o óleo de cobra funcione". 

As manchetes dos jornais mostram como o termo pode ser perigoso. "Não há evidência de que o Covid-19 pode ser transmitido pelo ar" ou "não há evidência de que o Covid seja transmitido entre humanos" correspondem a dizer que não tínhamos condições de afirmar naquele momento sobre este assunto. Isto deveria ser claro. Como afirma o blog, "sem evidência" é uma bandeira vermelha para a comunicação científica ruim. 

21 dezembro 2021

Pesquisa escrita ou pesquisa falada

Mark Carrigan, no blog da London School Economics, ressalta que a pandemia aumentou a popularidade dos podcasts. Como os acadêmicos possuem uma envolvimento com tendências tecnológicas, isto também afetou a área acadêmica. O ato de ouvir tornou-se uma forma relevante para transmitir do conhecimento. 

Para os pesquisadores qualitativos, a escuta é parte integrante da prática de pesquisa. Mas mesmo os pesquisadores quantitativos estão usando este recurso.

Lá fora destaco o pessoal do Freakonomics e Tim Harford. No Brasil, o trabalho louvável da professora Ducineli em divulgar pesquisas produzidas no PPGCont da UnB é pioneiro, antes mesmo da pandemia. 


É bom lembrar que alguns periódicos, além de publicar o trabalho acadêmico, faz divulgação sob forma de um ensaio para o público leigo ou para o público que não quer entrar nas minúcias do método e quer focar nas conclusões. A associação de economia dos Estados Unidos tem algumas divulgações de pesquisa que seguem esta linha, mas de forma escrita. 

Para finalizar, a comunicação escrita como forma de comunicação científica é algo bem recente na história da humanidade. Somente com a popularização da imprensa isto foi possível. A linguagem falada sempre predominou na transmissão do conhecimento. Estamos recuperando um pouco dessa relevância.  

11 maio 2021

Cientista e maldade

Qual o cientista mais malvado da história? Além da resposta óbvia, citando Mengele, uma das respostas lembrava Dr. Helmut Wakeham. Wakeham trabalhou para Philip Morris de 1959 a 1981. Ele usou a dúvida a favor da indústria do fumo. No momento que começaram a surgir evidências da ligação entre fumo e câncer, Wakeham comandou uma reação a partir do seguinte pensamento: os cigarros não podem causar câncer, porque algumas pessoas têm câncer sem ter fumado, e algumas pessoas fumam sem ter câncer. 

Este tipo de argumento tem sido usado por muitos picaretas de empresas, da política e da ciência. Se a evidência mostra uma relação de causa-efeito, inverta o pensamento.

Em uma entrevista de 1976 para "Death in the West", um documentário britânico apresentando cowboys da vida real morrendo por fumar, Wakeham foi questionado se os cigarros eram perigosos. Sua resposta: qualquer coisa pode causar danos se você consumir muito, "até mesmo compota de maçã". Quando pressionado a reconhecer que muitas pessoas não estavam morrendo de compota de maçã, Wakeham brincou: "Eles não estão comendo muito!" A Philip Morris percebeu que o filme poderia prejudicar sua reputação, então eles enviaram um exército de advogados ao Reino Unido e conseguiram que um tribunal impedisse a distribuição do filme nos Estados Unidos ou em qualquer outro lugar. Todas as cópias foram confiscadas, e os produtores e editores do filme receberam ordens de silêncio vitalícias.


11 março 2021

Concentração de citações


Uma análise de mais de 26 milhões de estudos científicos publicados por mais de 4 milhões de pesquisadores entre 2000 e 2015 descobriu que, em 2015, os 1% dos autores mais citados representavam 21% de todas as citações. 

  Essa desigualdade de citações tornou-se mais extrema com o tempo, e a participação de cientistas nos Estados Unidos nas citações está caindo. 

 (...) Nielsen e Andersen também encontraram uma diminuição na participação de citações dadas a artigos de autoria dos Estados Unidos e um aumento nas citações de artigos de autoria da Europa Ocidental e Australásia. As maiores concentrações de pesquisadores de 'elite de citações' estavam na Holanda, Reino Unido, Suíça e Bélgica.

Um problema da pesquisa é que os autores só levaram em consideração os pesquisadores que tinham mais de cinco publicações na base de dados. Mas esta limitação é compreensível, já que a qualidade dos dados pode piorar. 

11 agosto 2020

Ciência e Covid

Antes da pandemia, o ambiente acadêmico era assim:

Depois de publicado, o conteúdo é protegido da maioria, disponível apenas por meio de licenças pesadas ou de uma taxa de cerca de US $ 30 por artigo. Os membros do público, cujos impostos financiam grande parte da produção científica do país, só podem ver o material após um período de embargo de seis meses a quatro anos, dependendo da revista.

Mas agora:

As coisas estão diferentes agora, durante uma pandemia. A maioria das grandes revistas temporariamente derrubou paywalls  pelo conteúdo do COVID-19, citando seu compromisso em ajudar na pesquisa da doença. Muitos editores também estão acompanhando rapidamente o material relacionado ao COVID-19.

Além disto, tivemos uma explosão da disponibilização das pesquisas antes de sua publicação:

Ainda assim, como laboratórios em todo o mundo realizam estudos sobre essa doença, os periódicos não conseguem acompanhar. Em vez disso, os pesquisadores estão se voltando para as pré-impressões: versões de acesso aberto dos trabalhos de pesquisa compartilhadas antes da revisão ou publicação oficial. Os cientistas publicam seus manuscritos em repositórios abertos, conhecidos como servidores de pré-impressão, onde outros podem ler e discutir as descobertas.

Os servidores explodiram com o conteúdo nos últimos meses. Em junho, mais de 5.000 artigos sobre o vírus haviam sido publicados nos principais servidores de biologia e medicina, bioRxiv e medRxiv (pronunciado “bio-archive” e “med-archive”).

O apelo das pré-impressões é claro: acesso e velocidade. O acesso instantâneo à literatura científica pode salvar os pesquisadores de experimentos desnecessários, por exemplo. Mas há um problema: as pré-impressões ainda precisam passar pela revisão por pares - o teste padrão da boa ciência.

(...) Hoje, quase todas as principais revistas permitem ou, em alguns casos, incentivam os pesquisadores a publicar seus estudos para pré-imprimir servidores antes da publicação. Muitos periódicos chegaram a prometer em seus sites que isso não prejudicaria a chance de um artigo ser publicado posteriormente.

Fonte: aqui

08 agosto 2020

Pandemia e Ciência 2

 Tim Harford lembra um aspecto importante: adoramos "casos" neste sentido deixamos de lado a ciência (os números, as probabilidades, ...). Na realidade, isto não é originalmente dele, mas de Kahneman. Para este ganhador de Nobel, as "histórias vivas" tendem a embaçar nossa avaliação de risco. 

Em lugar da descrição simples "morrendo de Covid", contarmos uma história sobre infecção, preocupação familiar, febre, recuperação aparente, mudança acentuada para pior, ser levado rapidamente para o hospital, sedação e morte, separação da família, bem, nesta altura, ninguém se importa com a percentagens. O risco ficou terrivelmente real, pelo menos por um tempo. 

Por isto ficamos impressionados com as reportagens jornalísticas que contam os casos reais de uma pessoa específica e temos a tendência a extrapolar para todos os casos. 

Harford lembra um trabalho recente (e já polêmico) divulgado pelo NBER. O estudo solicitou que as pessoas respondessem sobre os riscos do coronavírus. O resultado mostrou que os jovens apresentaram uma estimativa de risco muito superior ao risco real. Já os mais velhos foi justamente o contrário: eles colocaram um risco bem menor. Já sabemos que o Covid apresenta uma taxa de risco muito reduzida para os jovens e um risco superior para os idosos. Vale a pena dar uma olhada no artigo de Harford.

30 junho 2020

Palavras e Dinheiro

A forma como comunicamos pode significar mais ou menos dinheiro. Isto é meio óbvio, mas  mesmo quando algo é óbvio isto não significa que não possa ser de interesse dos cientistas.

Em muitos casos a leitura de uma pesquisa é atrativa pela forma como o cientista desenhou o método. Este é o caso de um artigo publicado no Journal of Language and Social Psychology. O seu autor, da escola de jornalismo da University of Oregon, comprovou como a escolha de certas palavras pode significar dinheiro. Como ele fez isto? Ele pegou 19.569 propostas de financiamentos de pesquisas que foram submetidas ao National Science Foundation e analisou as palavras utilizadas. E ele encontrou que a forma como o texto era escrito poderia aumentar o sucesso da aprovação do financiamento.

Eis o que ele descobriu: texto mais longos, com palavras menos comuns e escritos com mais certeza verbal geralmente recebem mais dinheiro da NSF. E isto é contraditório, já que as entidades de ciência, entre as quais a NSF, fazem um esforço para que a comunicação científica seja mais clara. Mas recompensam as propostas com linguagem menos acessível.

Leia: Markowitz, David. What Words are Worth: National Science Foundation Grant Abstracts Indicate Award Funding. Journal of Language and Social Psychology, 2019, vol 38(3) 264-282.

09 junho 2020

Como ler um estudo científico

Em Como ler um estudo científico, Carl Zimmer, do New York Times (tradução publicada no domingo pelo Estado de S Paulo) dá algumas dicas sobre o assunto. Começa destacando a grande quantidade de artigos existentes, fala da revisão por pares, indica seguir o twitter dos pesquisadores, entre outras coisas. Gostei da seguinte parte:

As exigências da revisão por pares - satisfazendo as demandas de vários especialistas diferentes - também podem dar ainda mais trabalho para compreender o que está escrito. Os periódicos podem piorar a situação exigindo que os cientista cortem seus artigos em blocos, alguns dos quais passam a fazer parte de um arquivo suplementar. Ler um artigo pode ser como ler um romance e perceber, apenas no fim, que os capítulos 14, 30 e 41 foram publicados separadamente. 

Duas observações sobre o artigo. Em primeiro lugar, muitos artigo merecem e deveriam ser cortados. Há muita palavra desnecessária. Na nossa área é bem razoável imaginar um artigo com sete páginas. (Recentemente o Congresso USP abriu um espaço para publicação de texto com até 1500 palavras. Parabéns!!!)

Outro ponto é que muitos periódicos estão exigindo dos autores um resumo simplificado do texto. Isto é ótimo. Siga o site do AEA, que publica alguns dos artigos em linguagem bem acessível. Ou o VoxEU.

02 junho 2020

Impacto na ciência

Três mil pesquisadores responderam um questionário sobre a situação da ciência. Brasileiros foram  127, sendo que a maioria respondeu a opção "lockdown". Depois do Reino Unido, é o país mais afetado pelo Covid.

27 maio 2020

Pesquisa científica sobre o Covid-19

No domingo encerrou o prazo para submissão de um breve artigo para o Congresso da USP de 2020. O prazo para submissão dos artigos regulares já tinha terminado, mas a organização do congresso resolveu abrir um prazo adicional para submissão, desde que o tema fosse Covid-19 e, naturalmente, a contabilidade.

Creio que diversos pesquisadores submeteram suas pesquisas. E o pequeno círculo com quem conversei, parece que vários deles reclamaram do número de caracteres, reduzido demais para a pesquisa que estava sendo feita.

O interesse pela pesquisa sobre o Covid é comum a toda ciência. Nós postamos aqui que o NBER está publicando muita pesquisa sobre o assunto, um mês depois do Covid ser considerado uma pandemia. E note que esta entidade preocupa com a pesquisa econômica.

Um texto do Nada es Grátis mostra que o efeito contágio do Covid na pesquisa. Usando dados do Scholar, mais de 50 mil artigos sobre o tema foram publicados este ano. Uma base mais restrita, o Web of Science, tem 12 mil artigos. O volume de artigos cresce 21,7% por semana. Ou, a cada 25 dias, o número de artigos é multiplicado por dois.

Boa parte dos artigos possuem como procedência os países que são produtores de ciência nos dias atuais. Mas há um claro destaque para os países que sofreram "na pele" o efeito da doença. No caso dos artigos do Web of Science, a ordem procedência é: Estados Unidos, China, Inglaterra, Itália, Índia, Canadá, Alemanha, Austrália, Irã e Suíça.

Apesar do tema ser tipicamente de saúde, muitas áreas estão pesquisado sobre o assunto. Depois da tecnologia e ciências da vida, as ciências sociais possuem o maior número de pesquisas publicadas. Certamente há controvérsias se ainda é possível publicar boas pesquisas sobre o tema: a amostra certamente é enviesada e os dados ficam defasados rapidamente são duas das dificuldades. Mesmo assim é impressionante saber que 2 mil artigos já foram depositados no SSRN e já temos um periódico sobre o Covid e a Economia.

Este esforço traz dois problemas. O primeiro é a dificuldade de separar os avanços de uma pesquisa das demais. Ninguém consegue ler tanto artigo sobre o tema. E provavelmente muitos deles podem ser "esquecidos", quando representam um avanço, em detrimento de outros, que não seriam pesquisas sérias. Uso de inteligência artificial pode ajudar aqui, mas não resolve o problema.

O segundo aspecto é o custo de oportunidade. O foco da ciência agora é o Covid. Outras frentes de pesquisas relevantes, com malária e câncer, perderam seu status. O Nada es Grátis mostra que o número de publicações no Web of Science sobre malária diminuiu 36%, embora o número de mortos anuais desta doença seja de 405 mil (versus 300 mil do Covid. Ok, esta comparação é inadequada, mas destaca o argumento que não é possível deixar de lado a pesquisa sobre malária). A pesquisa sobre câncer caiu 21%.

25 abril 2020

Censura na pesquisa sobre Covid

Denúncia do blog LSE mostra que pesquisas sobre o Covid-19 estão sendo censuradas na China. Isto inclui um sistema de verificação prévia dos artigos, onde funcionários do governo determinam se a pesquisa tem valor acadêmico e se o momento da publicação é adequado. Isto não é uma prática nova na China, que já tinha feito uma triagem em artigos sobre assuntos sensíveis, como os três Ts (Tiananmem, Tibete e Taiwan).  

Issues of censorship surrounding the publication of scholarly research in China have been prominent since a series of press reports and publisher statements revealed that works had been removed from circulation that were deemed sensitive by Chinese buyers. As George Cooper observes, evidence that Chinese authorities are conducting pre-publication vetting of COVID-19 related research, raises new challenges for publishers seeking to distribute open access research papers on this subject, as there is little ground for publishers to remove these papers from their platforms. As publisher commitments to openness collide with their obligations to operate within the legal frameworks of the countries they operate in, it is argued that COVID-19 presages an overdue discussion on the limits of openness in publishing.