04 maio 2026
IA erra muito tarefas contábeis reais
Executamos 19 dos principais modelos de IA em 101 fluxos de trabalho contábeis reais. Não eram tarefas triviais. Não era um exercício de múltipla escolha do tipo "o que são contas a pagar". Eram cenários contábeis reais: classificar esta transação, criar um lançamento contábil para este cenário, conciliar este extrato bancário e fechar o mês. O tipo de trabalho que está na fila de todas as equipes financeiras todos os dias. O melhor modelo que testamos obteve 79,2% de precisão. Esse foi o Claude Opus 4.7. O segundo lugar ficou com o OpenAI GPT-5.4, com 77,3%. O GPT-4 obteve 39,8% nas mesmas tarefas. Independentemente da sua opinião sobre IA, essa trajetória é difícil de ignorar.
Assinar:
Postar comentários (Atom)

Nenhum comentário:
Postar um comentário