Translate

Mostrando postagens com marcador análise de texto. Mostrar todas as postagens
Mostrando postagens com marcador análise de texto. Mostrar todas as postagens

27 janeiro 2023

A cor das palavras

Our paper relies on stock price reactions to colour words, in order to provide new dictionaries of positive and negative words in a finance context. We extend the machine learning algorithm of Taddy (2013), adding a cross-validation layer to avoid over-fitting. In head-to-head comparisons, our dictionaries outperform the standard bag-of-words approach (Loughran and McDonald, 2011) when predicting stock price movements out-of-sample. By comparing their composition, word-by-word, our method refines and expands the sentiment dictionaries in the literature. The breadth of our dictionaries and their ability to disambiguate words using bigrams both help to colour finance discourse better.

Aqui


O primeiro parágrafo é bem esclarecedor:

Since Tetlock (2007), the literature in Finance and Accounting studying different types of textual data has flourished.1 The current state of the art to measure sentiment is to use a “bag-of-words” approach, counting words in dictionaries that are specialized to Finance and Accounting jargon, namely those developed by Loughran and McDonald (2011) (LM dictionaries). This approach has been criticized as potentially having low power in comparison to more sophisticated machine learning techniques (Gentzkow et al., 2019). Our paper contributes to this debate by constructing new dictionaries using techniques from the natural language processing literature (NLP) in Computer Science, explicitly comparing their composition and predictive power relative to the LM dictionaries.

Foto: Sharon Pittaway

20 novembro 2020

A Língua da Economia

Blair Fix faz uma interessante análise das palavras usadas na economia. Ele usa alguns dos livros que são adotados no ensino da disciplina e compara com os outros livros publicados (inclusive literatura). Por exemplo:


A palavra preço aparece 13.900 vezes (em um milhão de palavras) nos livros de economia; mas só aparece 296 vezes (também em um milhão) nos demais livros. Ou seja, a frequência relativa é de 46,9 ou 13900/296. Isto indica que palavra é muito utilizada nos livros de economia. Parece óbvio, pois trata-se do jargão da disciplina. Já a palavra ciência ocorre menos na economia do que nos demais livros. Aqui Fix observa que isto talvez seja um reflexo do fato da economia ser uma pseudo-ciência. 

Observe que a última coluna da tabela é mais importante, pois relaciona o uso de um termo na economia com os demais livros. "Murder" (assassino) parece não interessante muito a economia quanto as demais obras. "Ditchdigger" (escavador de valas) é um termo muito pouco usado nos livros, mas ainda assim aparece mais nos livros de economia. As palavras mais usadas, de forma relativa, nos livros de economia, são:

Mas Fix considera que é importante analisar as palavras que não foram usadas ou foram usadas em uma quantidade menor que os demais livros. Veja o resultado a seguir:

Muitas palavras estão ligadas a religião (gospel, judeu, Deus, etc). Eis sua análise:

Os livros de economia, no entanto, são um tipo muito particular de escrita secular. Eles estão promovendo uma ideologia secular . E isso torna a subutilização de palavras religiosas dos economistas mais interessante. Enquadrado dessa forma, podemos pensar na Figura 4 como mostrando duas ideologias contrastantes. A ideologia secular da economia exclui amplamente a linguagem usada pelas ideologias religiosas. Fascinante.

Mas um resultado que Fix não esperava é o termo "anti". Em lugar de dizer "João é anti-democrático", os economistas constroem a frase como "João tem preferência pela não democracia".  Ou seja,

Os livros de economia estão vendendo uma ideologia que legitima o status quo. E a melhor maneira de fazer isso é silenciar qualquer conversa de oposição. Elimine 'anti' do seu vocabulário.

Contabilidade? - Alguém por favor use o método de Fix e faça um trabalho parecido para a contabilidade.