Translate

28 janeiro 2026

Ciência e IA


Da newsletter da Nature 

Um estudo de 42 milhões de artigos nas ciências naturais descobriu que pesquisadores que utilizam métodos de IA publicam mais trabalhos, obtêm mais citações e tornam-se líderes de projetos mais cedo do que aqueles que não adotam ferramentas de pesquisa de IA. No entanto, esses cientistas que realizam pesquisas 'aumentadas por IA' o fazem em um conjunto mais restrito de tópicos e interagem menos com outros cientistas. 'Parecia claro que [a IA] estava realmente comprimindo ou meio que automatizando campos científicos existentes, em vez de gerar novas perguntas', afirma James Evans, cientista de dados e coautor do estudo.

Eis a citação do estudo:

Hao, Q., Xu, F., Li, Y. et al. Artificial intelligence tools expand scientists’ impact but contract science’s focus. Nature 649, 1237–1243 (2026). https://doi.org/10.1038/s41586-025-09922-y 

Carrie Bradshaw Index

A revista The Economist criou um indicador para avaliar a acessibilidade de viver em uma cidade europeia. Trata-se do European Carrie Bradshaw Index, assim denominado em homenagem a uma personagem de uma série de televisão. O índice é simples: um assalariado mediano pode pagar um apartamento de um quarto, mantendo o aluguel em até 30% da sua renda? Eis o resultado:

Das 39 cidades pesquisadas, somente oito passaram no teste da acessibilidade. A 
 surpresa é que na lista não estão Lisboa, Madri ou Londres. A relação entre aluguel e salário são desfavoráveis nessas cidades. Estão em vermelho no gráfico. Entre as oito, Berlin, Bonn, Berna, Bruxelas, Helsinque, Luxemburgo, Lion e Viena. 

Rir é o melhor remédio

 

Renovado depois de umas férias. 

27 janeiro 2026

IA treinada com dados de IA pode ser um problema

Modelos de IA funcionam sendo treinados em enormes volumes de dados da internet. Mas, à medida que a IA vem sendo cada vez mais usada para despejar na web páginas cheias de conteúdo lixo, esse processo corre o risco de ser minado. 

(...) À medida que modelos subsequentes produzem saídas que passam a ser usadas como dados de treinamento para modelos futuros, o efeito piora. Ilia Shumailov, cientista da computação da Universidade de Oxford que liderou o estudo, compara o processo a tirar fotos de fotos. “Se você tira uma foto, escaneia, depois imprime, e repete esse processo ao longo do tempo, basicamente o ruído acaba dominando todo o processo”, diz ele. “Você fica com um quadrado escuro.” O equivalente desse quadrado escuro para a IA é chamado de “colapso do modelo”, explica, ou seja, o modelo passa a produzir lixo incoerente. 

(...) E o problema tende a piorar à medida que um número crescente de sites lixo gerados por IA começa a entulhar a internet. 

Os modelos atuais de IA não vão simplesmente colapsar, diz Shumailov, mas ainda assim pode haver efeitos substanciais: as melhorias vão desacelerar e o desempenho pode sofrer. (...)

Shumailov explica o que ele acha que está acontecendo usando esta analogia: imagine que você está tentando encontrar o nome menos provável de um estudante na escola. Você poderia passar por todos os nomes dos alunos, mas isso levaria tempo demais. Em vez disso, você olha 100 dos 1.000 nomes. Você obtém uma estimativa razoavelmente boa, mas provavelmente não é a resposta correta. Agora imagine que outra pessoa venha e faça uma estimativa com base nos seus 100 nomes, mas selecione apenas 50. A estimativa dessa segunda pessoa vai estar ainda mais distante da realidade. 

“Você certamente pode imaginar que o mesmo acontece com modelos de aprendizado de máquina”, diz ele. “Então, se o primeiro modelo viu metade da internet, talvez o segundo modelo não vá pedir metade da internet, mas, na verdade, vai raspar os últimos 100.000 tweets e ajustar o modelo em cima disso.” 

Além disso, a internet não contém uma quantidade ilimitada de dados. Para alimentar seu apetite por mais, modelos futuros de IA talvez precisem treinar com dados sintéticos — ou dados que tenham sido produzidos por IA. 

(...) Matthias Gerstgrasser, pesquisador de IA em Stanford que é autor de outro artigo examinando o colapso de modelos, diz que adicionar dados sintéticos aos dados do mundo real, em vez de substituí-los, não causa grandes problemas. Mas acrescenta: “Uma conclusão com a qual toda a literatura sobre colapso de modelos concorda é que dados de treinamento de alta qualidade e diversos são importantes.” 

Fonte: aqui 

O texto é de 2024, mas o alerta ainda é válido. Talvez por isso seja tão importante uma enciclopédia, como a Wikipedia, escrita por humanos. Ou, sendo pouco humilde, um blog escrito por três abnegados, possa ser útil para treinar os modelos de LLM 

Escolha seu difícil

 

E aqui uma adaptação, com ajuda do GPT:


 

Ignorância estratégica


Eu chamaria de ignorância estratégica. O colunista chamou de efeito avestruz ou evitação de informação. 

Provavelmente, você consegue lembrar de uma ocasião em que escolheu deliberadamente não saber de algo. Alguns de nós evitam conferir o saldo bancário depois de um fim de semana de gastos. Outros ignoram suspeitas persistentes sobre a fidelidade do parceiro. Há quem passe rapidamente por manchetes pesadas sobre guerras ou mudanças climáticas.

Esse pensamento de “quanto menos eu souber, melhor” é surpreendentemente comum na vida adulta. O que é menos óbvio, porém, é de onde vem esse comportamento. Afinal, crianças são notoriamente (e até irritantemente) curiosas. Estão sempre fazendo perguntas e querendo saber mais.

Isso realmente é comum. Mas há outras razões que o texto não aborda como situações onde sabemos que não temos controle dos fatos, então preferimos não estar informado. Pense na situação onde você pode assistir o jogo do seu time de futebol, mas sabe que sua torcida não irá afetar o resultado, mas você irá sofrer durante os minutos do jogo. A ignorância estratégica é muito interessante aqui, pois evita os sentimentos ruins e a perda de tempo. 

Mas há outro aspecto que interessa de perto a contabilidade. Há um pressuposto de que mais informação é melhor. Mas em muitos casos a ignorância pode ser útil. Muitas vezes não queremos saber se uma empresa onde somos acionistas subornou alguém para conseguir negócios vantajosos. E outros exemplos surgem facilmente.  

Imagem aqui