Translate

Mostrando postagens com marcador palavras. Mostrar todas as postagens
Mostrando postagens com marcador palavras. Mostrar todas as postagens

27 janeiro 2023

A cor das palavras

Our paper relies on stock price reactions to colour words, in order to provide new dictionaries of positive and negative words in a finance context. We extend the machine learning algorithm of Taddy (2013), adding a cross-validation layer to avoid over-fitting. In head-to-head comparisons, our dictionaries outperform the standard bag-of-words approach (Loughran and McDonald, 2011) when predicting stock price movements out-of-sample. By comparing their composition, word-by-word, our method refines and expands the sentiment dictionaries in the literature. The breadth of our dictionaries and their ability to disambiguate words using bigrams both help to colour finance discourse better.

Aqui


O primeiro parágrafo é bem esclarecedor:

Since Tetlock (2007), the literature in Finance and Accounting studying different types of textual data has flourished.1 The current state of the art to measure sentiment is to use a “bag-of-words” approach, counting words in dictionaries that are specialized to Finance and Accounting jargon, namely those developed by Loughran and McDonald (2011) (LM dictionaries). This approach has been criticized as potentially having low power in comparison to more sophisticated machine learning techniques (Gentzkow et al., 2019). Our paper contributes to this debate by constructing new dictionaries using techniques from the natural language processing literature (NLP) in Computer Science, explicitly comparing their composition and predictive power relative to the LM dictionaries.

Foto: Sharon Pittaway

20 novembro 2020

A Língua da Economia

Blair Fix faz uma interessante análise das palavras usadas na economia. Ele usa alguns dos livros que são adotados no ensino da disciplina e compara com os outros livros publicados (inclusive literatura). Por exemplo:


A palavra preço aparece 13.900 vezes (em um milhão de palavras) nos livros de economia; mas só aparece 296 vezes (também em um milhão) nos demais livros. Ou seja, a frequência relativa é de 46,9 ou 13900/296. Isto indica que palavra é muito utilizada nos livros de economia. Parece óbvio, pois trata-se do jargão da disciplina. Já a palavra ciência ocorre menos na economia do que nos demais livros. Aqui Fix observa que isto talvez seja um reflexo do fato da economia ser uma pseudo-ciência. 

Observe que a última coluna da tabela é mais importante, pois relaciona o uso de um termo na economia com os demais livros. "Murder" (assassino) parece não interessante muito a economia quanto as demais obras. "Ditchdigger" (escavador de valas) é um termo muito pouco usado nos livros, mas ainda assim aparece mais nos livros de economia. As palavras mais usadas, de forma relativa, nos livros de economia, são:

Mas Fix considera que é importante analisar as palavras que não foram usadas ou foram usadas em uma quantidade menor que os demais livros. Veja o resultado a seguir:

Muitas palavras estão ligadas a religião (gospel, judeu, Deus, etc). Eis sua análise:

Os livros de economia, no entanto, são um tipo muito particular de escrita secular. Eles estão promovendo uma ideologia secular . E isso torna a subutilização de palavras religiosas dos economistas mais interessante. Enquadrado dessa forma, podemos pensar na Figura 4 como mostrando duas ideologias contrastantes. A ideologia secular da economia exclui amplamente a linguagem usada pelas ideologias religiosas. Fascinante.

Mas um resultado que Fix não esperava é o termo "anti". Em lugar de dizer "João é anti-democrático", os economistas constroem a frase como "João tem preferência pela não democracia".  Ou seja,

Os livros de economia estão vendendo uma ideologia que legitima o status quo. E a melhor maneira de fazer isso é silenciar qualquer conversa de oposição. Elimine 'anti' do seu vocabulário.

Contabilidade? - Alguém por favor use o método de Fix e faça um trabalho parecido para a contabilidade. 

08 agosto 2011

Como prever crises

Os cientistas da computação também analisaram a freqüência dos termos positivos e negativos e descobriram que num mercado normal há uma mistura da linguagem positiva e negativa. Logo antes de uma bolha, no entanto, há um salto em linguagem positiva. Quando o Dow Jones Industrial Average subia até 2007, por exemplo, "ascensão", "outono", "fechar" e "ganho" foram os verbos mais popular, chegando a semana de 12 de outubro, depois que o crash começou. O uso de termos negativos atingiu o pico em janeiro de 2009, dois meses antes da Dow atingiu seu ponto mais baixo. Economistas desenvolveram várias medidas para prever bolhas principalmente com base em preços, mas uma revisão da linguagem oferece outra maneira de avaliar o que as pessoas estão dizendo e pensando sobre o mercado, oferecendo pistas sobre onde a economia está indo. 

Thinking Cap: Predicting Bubbles and Crashes - Patricia Cohen - New York Times - 2 Ago 2011

07 janeiro 2011

A popularidade da contabilidade

O gráfico abaixo mostra o número de vezes que a palavra contabilidade, em inglês, aparece nos livros da biblioteca do Google. É interessante notar que o termo praticamente não era usado até início do século passado. A partir da década de sessenta o termo torna-se mais popular nas obras, sendo uma palavra mais fácil de ser encontrada.


O segundo gráfico mostra a mesma palavra, também nos livros da biblioteca do Google, em espanhol. Observe que o termo era muito mais usado nos livros em 1870 do que nos dias de hoje. E ao contrário do termo em língua inglesa, a partir da década de sessenta tem sido usado cada vez menos.


O Google não disponibiliza a ferramenta para língua portuguesa, infelizmente.

06 julho 2007

Quem fala mais - Parte 2

Outra reportagem sobre a pesquisa da Science:

Estos resultados difieren significativamente de los datos barajados en un reciente y comentado libro («El cerebro femenino») de la neuropsiquiatra Louan Brizendine. La profesora de la Universidad de California, con trece ediciones vendidas de su tratado, se ha hecho famosa entre otras cosas por afirmar que una mujer utiliza por término medio 20.000 palabras al día, mientras que un hombre satisface sus necesidades de comunicación con unas 7.000. (...)

Con todo, un número similar de palabras no quiere decir que ambos sexos hablen de las mismas cosas. A partir de la muestra de jóvenes universitarios utilizada en el estudio dirigido por el profesor Mehl, la cháchara masculina parece centrarse en cosas tangibles mientras las conversaciones femeninas tienden a ser dominadas por cuestiones relacionadas con personas. En su opinión, «es cierto que hombres y mujeres tienen muy diferentes procesos cerebrales porque disponen de diferentes hormonas» pero eso no se traduce en una mayor cantidad diaria de palabras. En respuesta, la profesora Louan Brizendine ha apuntado que el problema no es necesariamente que las mujeres hablen más sino quizá que «los hombres realmente no quieren escuchar».


Aqui para ler completo e aqui para ler anterior

30 maio 2007

Pequenas notícias

1. A Transportation Security Administration perdeu um drive com dados (número do social security, datas de nascimentos, conta de bancos) de 100 mil empregados. (clique aqui)

2. Um estudo encontrou que uma criança escuta do professor uma média de 2.150 palavras por hora. E 620 na família. aqui

09 fevereiro 2007

Poder das palavras

As empresas usam as palavras para fazer um resultado parecer melhor do que realmente é ou para minimizar um resultado ruim. Da Espanha, a Renault anunciou que seus resultados. Segundo o jornal ABC de hoje:

El resultado de Renault en España fue el pasado año «menos bueno» que en 2005, según destacó ayer en París el responsable financiero del grupo automovilístico francés, Thierry Moulonguet, que no quiso cifrarlo ni dar cuenta de la magnitud de la caída.