Os modelos de linguagem de grande escala (LLMs, na sigla em inglês) estão reduzindo as barreiras de entrada para o trabalho com fontes de dados interessantes que antes exigiam fortes habilidades em ciência de dados, como livros-razão manuscritos, textos, imagens ou gravações de áudio. Este guia fornece uma introdução para pesquisadores que estão começando a usar LLMs. Ele apresenta um fluxo de trabalho passo a passo para transformar uma ideia de pesquisa em código e dados funcionais e descreve as quatro principais maneiras de interagir com um LLM: a janela de bate-papo, assistentes integrados ao editor, ferramentas de codificação agentiva e a API. Em seguida, aborda as decisões que um profissional precisa tomar em sequência, começando por avaliar se um LLM é a ferramenta certa e se os dados podem ser enviados para ele, passando por como selecionar modelos, escrever prompts, gerenciar limites de contexto e controlar custos, e finalmente como validar, reproduzir, documentar e corrigir medidas geradas por LLMs em contextos de regressão. Uma revisão de pesquisas recentes mostra como essas ferramentas já extraem, vinculam, harmonizam e classificam dados históricos em grande escala. Quatro exemplos práticos com arquivos de replicação ilustram o uso de LLMs. Eles classificam emoções em pinturas, vinculam registros censitários sem nomes, medem a relevância e o sentimento dos jornais em relação à Lei de Exclusão Chinesa de 1882 e avaliam a expressividade emocional dos discursos de guerra de Franklin D. Roosevelt. O guia também condensa o fluxo de trabalho, as recomendações de melhores práticas e a preparação de pacotes de replicação em tabelas resumidas e listas de verificação para auxiliar economistas aplicados.
Muito interessante e útil.






