Translate

29 abril 2026

Claude identifica o nome de uma autora em um texto inédito


O texto traz, com espanto, que o Claude Opus 4.7 conseguiu identificar o nome de uma autora de um texto inédito. Eis o texto: 

Kelsey Piper, redatora da Future Perfect, da Vox, colou 125 palavras de uma coluna política inédita no Claude Opus 4.7 na semana passada e recebeu seu próprio nome como resposta. Ela não estava logada; o teste foi feito em modo anônimo, confirmado pela API e repetido no computador de um amigo. O mesmo resultado apareceu todas as vezes.

O mesmo modelo a identificou a partir de um relatório escolar que ela havia escrito sobre redações de um aluno sobre Pokémon — um gênero totalmente fora de seus textos publicados — e de uma crítica de cinema sobre uma comédia da Segunda Guerra Mundial de 1942 que ela nunca havia resenhado publicamente. Foram necessárias 500 palavras de ficção inédita para chegar à mesma conclusão. Foi necessária uma redação de candidatura à faculdade escrita 15 anos antes. ChatGPT e Gemini, em sua maioria, erraram os palpites, enquanto o Opus 4.7 acertou. 

Piper escreve no The Argument que qualquer pessoa que tenha escrito de forma prolífica usando seu nome real provavelmente já perdeu um grau significativo de anonimato. Ela testou amigos com presença online mínima, e Claude não conseguiu identificá-los — mas chegou perto ao sugerir amigos em comum do mesmo círculo social, captando tiques estilísticos que se espalham por comunidades. O limiar para a desanonimização provavelmente cairá à medida que os modelos melhorem e os dados de treinamento aumentem.

Fonte: aqui

Nenhum comentário:

Postar um comentário