Translate

31 dezembro 2022

ML usada para melhorar a auditoria em tributos

 We study the extent to which ML techniques can be used to improve tax auditing efficiency using administrative data, without the need of randomized audits. Using Italy's population data on sole proprietorship tax returns, audits and their outcome, we develop a new approach to address the so called selective labels problem - the fact that a ML algorithm must necessarily be trained on endogenously selected data. We document the existence of substantial margins for raising revenue from audits by improving the selection of taxpayers to audit with ML. Replacing the 10% least productive audits with an equal number of taxpayers selected by our trained algorithm raises detected tax evasion by as much as 38%, and evasion that is actually payed back by 29%.

Fonte: aqui

As atletas mais bem pagas de 2022

 

Simone Biles
Fonte da imagem: Aqui



1. Naomi Osaka • US$ 51,1 milhões (R$ 265,8 milhões)
ESPORTE: TÊNIS | NACIONALIDADE: JAPÃO | IDADE: 25 | EM CAMPO: US$ 1,1 milhões • FORA DE CAMPO: US$ 50 milhões

2. Serena Williams • US$ 41,3 milhões (R$ 214,8 milhões)
ESPORTE: TÊNIS | NACIONALIDADE: EUA | IDADE: 41 | EM CAMPO: US$ 0,3 milhões • FORA DE CAMPO: US$ 41 milhões

3. Eileen Gu • US$ 20,1 milhões (R$ 104,5 milhões)
ESPORTE: ESQUI LIVRE | NACIONALIDADE: CHINA | IDADE: 19 | EM CAMPO: US$ 0,1 milhões • FORA DO CAMPO: US$ 20 milhões

4. Emma Raducanu • US$ 18,7 milhões (R$ 97,2 milhões)
ESPORTE: TÊNIS | NACIONALIDADE: REINO UNIDO | IDADE: 20 | EM CAMPO: US$ 0,7 milhões • FORA DE CAMPO: US$ 18 milhões

5. Iga Świątek • US$ 14,9 milhões (R$ 77,5 milhões)
ESPORTES: TÊNIS | NACIONALIDADE: POLÔNIA | IDADE: 21 | EM CAMPO: US$ 9,9 milhões • FORA DE CAMPO: US$ 5 milhões

6. Venus Williams • US$ 12,1 milhões (R$ 62,9 milhões)
ESPORTE: TÊNIS | NACIONALIDADE: EUA | IDADE: 42 | EM CAMPO: US$ 0,1 milhões • FORA DE CAMPO: US$ 12 milhões

7. Coco Gauff • US$ 11,1 milhões (R$ 57,7 milhões)
ESPORTE: TÊNIS | NACIONALIDADE: EUA | IDADE: 18 | EM CAMPO: US$ 3,1 milhões • FORA DE CAMPO: US$ 8 milhões

8. Simone Biles • US$ 10 milhões (R$ 52 milhões)
ESPORTE: GINÁSTICA | NACIONALIDADE: EUA | IDADE: 25 | EM CAMPO: US$ 0 • FORA DE CAMPO: US$ 10 milhões

9. Jessica Pegula • US$ 7,6 milhões (R$ 39,5 milhões)
ESPORTE: TÊNIS | NACIONALIDADE: EUA | IDADE: 28 | EM CAMPO: US$ 3,6 milhões • FORA DE CAMPO: US$ 4 milhões

10. Minjee Lee • US$ 7,3 milhões (R$ 37,9 milhões)
ESPORTE: GOLFE | NACIONALIDADE: AUSTRÁLIA | IDADE: 26 | EM CAMPO: US$ 4,8 milhões • FORA DE CAMPO: US$ 2,5 milhões

11. Candace Parker • US$ 7,2 milhões (R$ 37,5 milhões)
ESPORTE: BASQUETEBOL | NACIONALIDADE: EUA | IDADE: 36 | EM CAMPO: US$ 0,2 milhões • FORA DE CAMPO: US$ 7 milhões

12. PV Sindhu • US$ 7,1 milhões (R$ 36,9 milhões)
ESPORTE: BADMINTON | NACIONALIDADE: ÍNDIA | IDADE: 27 | EM CAMPO: US$ 0,1 milhão • FORA DE CAMPO: US$ 7 milhões

13. Leylah Fernandez • US$ 7 milhões (R$ 36,4 milhões)
ESPORTE: TÊNIS | NACIONALIDADE: CANADÁ | IDADE: 20 | EM CAMPO: $ 1 milhão • FORA DE CAMPO: $ 6 milhões

14. Lydia Ko • US$ 6,9 milhões (R$ 35,8 milhões)
ESPORTE: GOLFE | NACIONALIDADE: NOVA ZELÂNDIA | IDADE: 25 | EM CAMPO: US$ 4,4 milhões • FORA DE CAMPO: US$ 2,5 milhões

15. Ons Jabeur • US$6,5 milhões (R$ 33,8 milhões)
ESPORTE: TÊNIS | NACIONALIDADE: TUNÍSIA | IDADE: 28 | EM CAMPO: US$ 5 milhões • FORA DE CAMPO: US$ 1,5 milhão

16. Paula Badosa • US$6,2 milhões (R$ 32,2 milhões)
ESPORTE: TÊNIS | NACIONALIDADE: ESPANHA | IDADE: 25 | EM CAMPO: US$ 1,7 milhão • FORA DE CAMPO: US$ 4,5 milhões

17. Lexi Thompson • US$ 5,9 milhões (R$ 30,7 milhões)
ESPORTE: GOLFE | NACIONALIDADE: EUA | IDADE: 27 | EM CAMPO: US$ 1,9 milhão • FORA DE CAMPO: US$ 4 milhões

18. Jin Young Ko • US$ 5,8 milhões (R$ 30,1 milhões)
ESPORTE: GOLFE | NACIONALIDADE: COREIA DO SUL | IDADE: 27 | EM CAMPO: US$ 1,3 milhão • FORA DE CAMPO: US$ 4,5 milhões

19 (empate). In Gee Chun • US$ 5,7 milhões (R$ 29,6 milhões)
ESPORTE: GOLFE | NACIONALIDADE: COREIA DO SUL | IDADE: 28 | EM CAMPO: US$ 2,7 milhões • FORA DE CAMPO: US$ 3 milhões

19 (empate). Alex Morgan • US$ 5,7 milhões (R$ 29,5 milhões)
ESPORTE: FUTEBOL | NACIONALIDADE: EUA | IDADE: 33 | EM CAMPO: US$ 0,7 milhão • FORA DE CAMPO: US$ 5 milhões

19 (empate). Megan Rapinoe • US$ 5,7 milhões (R$ 29,5 milhões)
ESPORTE: FUTEBOL | NACIONALIDADE: EUA | IDADE: 37 | EM CAMPO: US$ 0,7 milhões • FORA DE CAMPO: US$ 5 milhões

22 (empate). Brooke Henderson • US$ 5,4 milhões (R$ 28 milhões)
ESPORTE: GOLFE | NACIONALIDADE: CANADÁ | IDADE: 25 | EM CAMPO: US$ 2,4 milhões • FORA DE CAMPO: US$ 3 milhões

22 (empate). Nelly Korda • US$ 5,4 milhões (R$ 28 milhões)
ESPORTE: GOLFE | NACIONALIDADE: EUA | IDADE: 24 | EM CAMPO: US$ 1,4 milhão • FORA DE CAMPO: US$ 4 milhões

24 (empate). Caroline Garcia • US$ 5,2 milhões (R$ 27 milhões)
ESPORTE: TÊNIS | NACIONALIDADE: FRANÇA | IDADE: 29 | EM CAMPO: US$ 3,7 milhões • FORA DE CAMPO: US$ 1,5 milhão

24 (empate). Garbiñe Muguruza • US$ 5,2 milhões (R$ 27 milhões)
ESPORTE: TÊNIS | NACIONALIDADE: ESPANHA | IDADE: 29 | EM CAMPO: US$ 0,7 milhões • FORA DE CAMPO: US$ 4,5 milhões

Fonte: Forbes

Rir é o melhor remédio

 

Fonte: Eduardo Arruda 



30 dezembro 2022

As de 2022 mais lidas

Continuando a nossa série de listas de fim de ano, apresentamos agora as postagens de 2022 mais lidas.

O primeiro lugar é merecidíssimo para uma matéria sobre o lado controverso da Materialidade, escrita pelo professor César. Vale a leitura e a releitura!

Em segundo lugar temos a postagem sobre Teoria da Agência e Contabilidade, que está com notas de rodapé com comentários pessoais do autor, que deixam a leitura com um sabor a mais.

A frase “”Em Deus nós confiamos". Todos os outros trazem dados", do executivo Barry Beracha, aparece em uma postagem na super interessante 3ª colocação: Frases sobre Dados (Ciência de Dados).

Em 4º lugar figura o texto sobre A Existência de Trapaça no Xadrez, com vários aspectos inusitados sobre este mundo.

A 5ª colocada fala sobre Resoluções CVM emitidas no dia 22 de março. Achei curioso ela ter aparecido com tantos acessos.

Continuando a nossa lista de forma ilustre, a 6ª colocada deu o que falar, tanto que foi postada há 11 dias e já apareceu no ranking: Avaliação Capes dos Programas de Pós.

A KPMG é mencionada nas posições 7 e 8, com as postagens Theranos e Auditoria e KPMG e os Problemas na Ilha.

Na 9ª posição temos a parte 2 da postagem Ativo, Segundo o Fasb. A primeira parte ficou na 11ª posição.

Decidimos colocar 12 itens ao invés dos tradicionais 10, porque a que aparece em 12º lugar é interessante demais para ficar de fora: Contabilidade é um trabalho chato? O que você acha?

Covid e prefeitura municipal no Brasil: viés de gênero

Uma pesquisa realizada no Brasil tentou explorar o viés de gênero entre os eleitores e como isto afeta as decisões políticas entre prefeitos. 


Durante a pandemia, o então presidente do país relutou em implementar medidas de contenção. Isto jogou para os prefeitos a responsabilidade na resposta da pandemia. A pesquisa tentou mostrar como uma crise sanitária afetou as chances de candidatos a reeleição. Eis um ponto interessante :

Sua análise mostra uma evolução muito diferente no número de mortes na COVID-19 e nas escolhas políticas dos prefeitos em municípios liderados por mulheres, em comparação com os municípios liderados por homens. Nomeadamente, as municipalidades lideradas por mulheres sofreram mais mortes e as prefeituras tiveram menos probabilidade de impor bloqueios comerciais em comparação com suas contrapartes masculinas no início, quando havia maior incerteza sobre o risco representado pela COVID-19.

Em termos práticos, a taxa de mortalidade em municípios dirigidos por mulheres era três vezes maior que os municípios comandados por homens, na primeira onda. E o lockdown imposto por prefeitas ocorreu 33 dias mais tarde. Mas no final do ano, os municípios liderados por mulheres sofreram menos mortes. 

Isto inverteu na segunda onda, quando os municípios liderados por mulheres sofreram menos mortes e as cidades impuseram menos restrições. Além do gênero, a escolha também foi afetada pelo fato do prefeito estar concorrendo à reeleição. 

Os resultados estão de acordo com a realidade política, onde as prefeitas, sabendo do preconceito de gênero, tinham menor incentivo para impor restrições nos primeiros dias da doença. 

Consenso científico

A pandemia e algumas discussões políticas, em conjunto com o crescimento de mídias sociais, fez com que a questão do consenso científico adquirisse relevância. O site Skeptical Science trouxe um texto explicativo bem interessante sobre este assunto. As considerações a seguir estão baseadas neste artigo.

Inicialmente é bom destacar que consenso científico (vamos chamar, a partir de agora, de CC) não é sinônimo de verdade absoluta e nem prova de uma teoria científica. Consenso significa que existe uma convergência de evidências, todas aparentemente apontando na mesma direção. O CC não é parte do método científico, mas sim resultado da aplicação dele. Assim, o consenso científico só pode surgir nas discussões onde o método científico é usado. Não existe consenso científico nas coisas da fé. 

Por não ser uma verdade absoluta, o consenso não é infalível, mas significa o que melhor sabemos com as condições atuais sobre um determinado tópico. O desenvolvimento científico, a criação de novos instrumentos ou mais discussões pode mudar este consenso científico. 

Ao contrário de uma eleição ou um grupo social, o CC está baseado no ... conhecimento científico. Conforme lembra o texto, ciência não é democracia. Pelo contrário, é uma ditadura, a ditadura da evidência. Se o conhecimento é estruturado conforme o método científico, este irá prevalecer sobre a opinião dos cientistas. 

Neste sentido, o termo "consiliência da evidência" pode ser importante. Isto significa dizer que muitas evidências, surgidas de forma independente, podem apontar para a mesma conclusão. Isto não significa concordância em todos os aspectos, mas que os resultados gerais são consistentes para diferentes áreas científicas. 

Como o site explora bastante a questão ambiental, o exemplo citado é nesta linha. Diversas áreas, como meteorologia, geologia, geofísica, química atmosférica, entre outras, estudaram a questão do clima e chegaram a resultados consistentes sobre o recente aquecimento global em razão das atividades humanas nos últimos séculos. Isto é um exemplo de consiliência. 

A ciência depende de que as evidências se unam e contem a mesma história. Quando consideramos a temperatura média da Terra, com medições no solo, nos oceanos e em balões no ar, todos os métodos apontam um aumento na temperatura. Além da mera mensuração da temperatura, a observação das geleiras, do nível do mar, o comportamento dos animais, entre outras observações, fazem com que o quebra-cabeça do clima se encaixe e tenhamos uma evidência consistente, que gera o CC.

É na evidência que podemos dizer que a ciência está cumprindo seu papel. Mesmo com todas as evidências, ainda há pessoas que contestam a questão do aquecimento global. A divergência faz parte do CC, pois não existe a necessidade de que 100% dos cientistas estejam convencidos de algo para que faça parte do CC. 


Mas faz parte do CC a diversidade. Em uma questão como o aquecimento global o número de grupos de apoiam esta ideia é muito grande, conforme pode ser notado na figura acima. São países com culturas distintas que chegaram a mesma conclusão. Dos mais de 200 países, 80 deles, os mais relevantes, consideram que o ser humano tem um papel no aquecimento global. Aqui temos não somente CC como diversidade geográfica, social e econômica. 

Isto é diferente de um pequeno grupo de pesquisadores, com formação similar, que chegaram a um acordo. Não, aqui não temos CC, mas uma tendência de pequenos grupos promoverem a harmonia entre seus membros. 

Assim, o CC é baseado na consiliência da evidência, na calibração social e na diversidade social. Tendo os três elementos, provavelmente iremos encontrar o CC. Não será no seu grupo de amigos ou na opinião de uma pessoa. É na ciência. 

Ainda sobre a desconexão dos livros de finanças pessoais

Ainda sobre a divergência existente entre a teoria e os livros de finanças pessoais, eis o comentário de Andy Preston:

Vale a pena notar, neste momento, que não acredito que os economistas estejam sempre certos e que os gurus de finanças pessoais estejam errados quando há um ponto de discórdia. Muitas vezes como as pessoas realmente se comportam pode nos dizer algumas coisas úteis sobre quais os fatores os modelos [dos economistas] podem estar omitindo. 


Preston discute as regras de economia ao longo do ciclo de vida. Os autores de finanças pessoais defendem um percentual da renda como padrão de economia. A lógica é que a habilidade de poupança precisa ser aprimorada no tempo, começando quando jovem; uma regra simples, como um percentual de 10 a 15% pode ajudar neste sentido; e os juros compostos, enfatizados pelos autores, são considerados nesta regra. 

As pessoas não possuem disciplina perfeita e não fazem decisões racionais o tempo todo. E as regras simplórias dos livros de finanças ajudam neste sentido. 

Foto: Aaron Burden

Rir é o melhor remédio

 

Ficar bem no Instagram

29 dezembro 2022

Descobrindo fraude em cripto

We introduce systematic tests exploiting robust statistical and behavioral patterns in trading to detect fake transactions on 29 cryptocurrency exchanges. Regulated exchanges feature patterns consistently observed in financial markets and nature; abnormal first-significant-digit distributions, size rounding, and transaction tail distributions on unregulated exchanges reveal rampant manipulations unlikely driven by strategy or exchange heterogeneity. We quantify the wash trading on each unregulated exchange, which averaged over 70% of the reported volume. We further document how these fabricated volumes (trillions of dollars annually) improve exchange ranking, temporarily distort prices, and relate to exchange characteristics (e.g., age and userbase), market conditions, and regulation.


Veja o texto completo aqui

O apêndice C traz uma revisão da Lei de Benford

Lucros Extraordinários são tributados na Europa e a Exxon entra na justiça

A petrolífera norte-americana Exxon Mobil intentou uma ação contra a União Europeia devido ao "windfall tax", na tentativa de bloquear o novo imposto sobre os lucros extraordinários das empresas do setor da energia (e distribuição alimentar), avançou o Financial Times.


A Exxon Mobil argumenta que a UE excedeu a sua autoridade legal com a imposição desta taxa extraordinária, que também abrange os grupos petrolíferos, e que foi criada com o intuito de responder ao aumento acentuado dos preços da energia.

Segundo o FT, as subsidiárias alemã e holandesa da Exxon Mobil intentaram a ação no Tribunal Geral da União Europeia, sediado no Luxemburgo.

Este imposto extraordinário "mina a confiança dos investidores, desencoraja o investimento e aumenta a dependência da energia importada", afirmou Casey Norton, porta-voz da Exxon, citado pelo jornal britânico.

Recorde-se que a Comissão Europeia definiu, com a "luz verde" dos Estados-membros dada em outubro, uma "contribuição temporária de solidariedade" sobre os lucros extraordinários gerados pelas empresas que operam na UE nos setores do petróleo, do gás, do carvão e da refinação.

Os lucros excedentários têm lugar quando, em 2022 e 2023, houver o correspondente a 20% de aumento em relação à média dos lucros tributáveis nos quatro anos anteriores, e a taxa aplicável é de 33%.

Fonte: aqui

O ano que cansamos dos narcisistas

Do Politico, um artigo de Joanna Weiss:

(...) Elon Musk, Sam Bankman-Fried, Ye (né Kanye West), Elizabeth Holmes, Meghan Markle, Donald Trump: Todos eles usaram a atenção como moeda e ego como combustível e foram recompensados por um tempo com o que desejavam. Somos atraídos por pessoas que se amam.

Mas em algum lugar entre a quinta e sexta hora de "Harry e Meghan", a nova série documental Netflix produzida pelo ex-Duque e Duquesa de Sussex e filmada em sua mansão na Califórnia minha simpatia natural pelo casal começou a me irritar, e me ocorreu que o ego tem seus limites. E passei a achar que o que levou à mega-série ser duramente criticada é o mesmo impulso que transformou Elon Musk em um terror no Twitter, levou Ye a aumentar a aposta de um comportamento ultrajante até que ele cruzou a linha para um anti-semitismo flagrante e enviou Bankman-Fried do topo do mundo para uma prisão das Bahamas.

Algumas dessas reviravoltas do destino são mais dramáticas e completas que outras. Mas uma vez que contabilizamos as perdas, pode ser que 2022 marque o ano em que nosso caso de amor com narcisistas começou a vacilar. (...)


“Eu acho que agora as pessoas estão ficando cansadas disso ”, disse John P. Harden, professor de ciências políticas do Ripon College, quando testei meus limites da teoria do narcisismo por telefone. Eu entrei em contato porque Harden estuda narcisismo na política: para um artigo de 2021 ele revisou pesquisas detalhadas de historiadores presidenciais, correlacionou-as com pesquisas em psicologia e criou uma espécie de índice de narcisismo para presidentes dos EUA até o início dos anos 2000. No fundo estavam Jimmy Carter, George H.W. Bush e Calvin Coolidge. No topo estavam Lyndon Johnson, Richard Nixon e Theodore Roosevelt. A teoria de Harden é que o ego pode conduzir a história: em conflitos internacionais, é provável que um presidente narcisista se preocupe em ser desrespeitado, ameace os oponentes e aja unilateralmente, ignorando conselheiros ou aliados. (...)

Para outras histórias de advertência, veja Elizabeth Holmes e Sam Bankman-Fried, que conquistaram os investidores criando mitos em torno de si: gênios jovens em roupas exclusivas (ela, a gola alta preta; ele, o short de carga), mais espertos que os céticos e os especialistas. Holmes, através de sua empresa de testes de sangue Theranos, ia mudar a indústria farmacêutica; Bankman-Fried, com sua troca de criptomoedas, iria ofender as finanças e a filantropia.

Continue lendo aqui

Rir é o melhor remédio


 Inspiração para escrever um artigo

28 dezembro 2022

As mais lidas de 2022

Chegou aquela tão esperada época do ano: os dias em que só enrolamos até o ano virar, para podermos começar tudo de novo. E para te ajudar a passar o tempo, voltamos com as nossas listas de fim de ano. Hoje vamos revisitar as postagens mais lidas de 2022!

As mais lidas do ano geralmente envolvem postagens sobre análise de balanço e este ano não foi diferente. A mais lida foi Margem Bruta (1º), seguida por: Endividamento Oneroso (2ª) e CCL (3ª).

Para quebrar um pouco a seriedade, em 4º lugar apareceu um Rir é o Melhor Remédio com uma imagem das roupas da rainha Elizabeth em degradê. Não temos como não dizer que não é uma postagem suntuosa!

A 5ª mais lida é Patrimônio de Referência, que menciona uma dissertação de mestrado em Regulação e Gestão de Negócios, mostrando informações sobre o PR dos bancos brasileiros.

Em seguida aparece a postagem Fontes Para Leitura de Textos Longos (6ª), que tive a oportunidade de reler e achar super informativa. Especialmente a parte em que fala que uma fonte com serifa é boa para leitura impressa, mas não tão agradável em tela.

Por que falamos estou em débito com você? Você pode descobrir isso ao revisitar a nossa 7ª postagem mais lida, publicada originalmente em 2011. Aumente também o seu exponencial cultural ao visitar a nossa 8ª colocada, Lei Brandolini.

Em 9ª lugar temos um texto clássico sobre Depreciação Acelerada e, para fechar as 10 mais lidas, temos a postagem sobre as Letras Mais Usadas na Língua Portuguesa (10ª).

Margem Bruta

Endividamento Oneroso

CCL

Rir é o Melhor Remédio

Patrimônio de Referência

Fontes Para Leitura de Textos Longos

Por Que Falamos Estou em Débito com Você

Lei Brandolini

Depreciação Acelerada

10º

Letras Mais Usadas na Língua Portuguesa


É uma mistura interessante sobre postagens tradicionais, descontração e curiosidades.

Você tem uma postagem preferida?

Livros de Finanças Pessoais e a Teoria

James Choi analisou os 50 livros de finanças pessoais mais populares do mercado e comparou com os conselhos da teoria. O artigo é bem interessante e pode ser encontrado, na versão preliminar, no site NBER. Em uma entrevista, Choi disse que os teóricos também podem aprender com os livros de finanças pessoais. 


Nesta entrevista, uma questão interessante:

Smith: Qual foi o pior conselho que você notou nesses livros?

Choi : O conselho mais irresponsável provavelmente vem de Robert Kiyosaki, que também tinha o livro mais popular da lista dos 50 que pesquisei. Ele basicamente aconselha você a comprar imóveis com muita dívida e a pagar muito rapidamente. É basicamente um esquema de enriquecimento rápido, com muito pouca diversificação e muita influência. Eu acho isso realmente muito perigoso.

Choi comenta que os livros populares de finanças pessoais talvez estejam com a razão sobre coisas como pagar a menor dívida primeiro, para motivar. Mas considera que o desprezo pela diversificação pode ser uma ideia ruim. 

Excel ainda é importante

Na postagem anterior há uma discussão sobre R e Python. A questão da tecnologia parece ser uma demanda enorme das empresas. Veja um trecho de uma postagem da AAT:


88% das empresas concordam que um entendimento da tecnologia é importante para os contadores, de acordo com uma pesquisa recente da agência de marketing PracticeWeb. E 66% pagariam mais a um contador experiente em tecnologia - o que significa que aprimorar suas habilidades em TI também pode aumentar seu poder aquisitivo nos estágios iniciais de sua carreira.

A postagem comenta cinco maneiras de obter conhecimento técnico: online (seminários, fóruns, cursos, entre outros), Excel avançado (isto inclui as funções de organizar e manipular dados), Inteligência Artificial e aprendizado de máquina, nuvem (79% das empresas no Reino Unido estão migrando para nuvem) e segurança cibernética. 

Particularmente achei interessante o foco em Excel. 

Python ou R? Eis um conjunto de considerações interessantes

Mesmo sendo um blog de contabilidade financeira, é inegável que temas relacionados com ciência de dados sejam de nosso interesse. O debate entre Python e R é um daqueles assuntos emocionantes na área. Recentemente encontrei um post que fazia um comparativo entre os dois de forma mais isenta. Ao contrário do livro de Joel Gus, que afirma, nos agradecimentos, que "pessoas que preferem a R ao Python são moralmente reprováveis", Luca Zavarella é mais ponderado. Eu fiz um resumo da sua postagem (traduzido via Vivaldi e Deepl, com adaptações) a seguir:

Entre R e Python, qual idioma eu sugeriria para um especialista em análise de dados aspirante?

Nos últimos anos, vi a evolução do uso de ambos os idiomas no mundo do Data Analytics. Aqui estão meus pensamentos.


✔ A linguagem R é muito mais direta na análise interativa de dados e exploração de dados, especialmente para analistas ou para aqueles que vêm do mundo da inteligência de negócios, onde o SQL domina. Transformar os dados com R é uma reminiscência do processo mental realizado por quem usa SQL, com a vantagem de poder usar funções específicas que simplificam transformações complexas (como rotação de dados, por exemplo) ou que aplicam operações estatísticas úteis para análise .

A abordagem adotada pela Python para transformar dados está mais relacionada à experiência de um programador. Ter que recorrer necessariamente a expressões lambda, por exemplo, para tarefas bastante básicas de manipulação de dados, o que desorienta qualquer analista acostumado a uma abordagem mais baseada em conjuntos (que é a maneira correta de pensar quando se trabalha com dados!) e nos faz perceber que aqueles que desenvolveram os pacotes Python necessários para a manipulação de dados eram principalmente desenvolvedores e não analistas.

✔ R é a linguagem por excelência usada na academia (estatística, matemática, ciência de dados e assim por diante). Portanto, é muito provável que encontre novos algoritmos de ciência de dados implementados diretamente em R, mesmo antes de encontrá-los implementados em Python. Portanto, se você precisar usar esses novos algoritmos para um projeto, deverá necessariamente usar R .

✔ Tanto quanto visualização de dados No que diz respeito, R é a principal ferramenta que permite produzir belos gráficos prontos para publicações profissionais. Certamente, gráficos desse tipo também são obtidos no Python, mas não tão facilmente quanto você pode fazer em R, especialmente com a infinidade de pacotes desenvolvidos para adicionar necessidades gráficas específicas.

✔ Quanto a painel profissional, as plataformas mais usadas evoluíram e admitem o uso dos dois idiomas. Por exemplo, Plotly Dash e Shiny permitem o desenvolvimento de aplicativos de dados em nível empresarial em Python e R. Para aqueles conectados ao mundo da plataforma de dados da Microsoft, o Power BI também permite que você use os dois idiomas.

✔ Python é uma linguagem de programação de uso geral muito clara, muito versátil devido ao ecossistema de pacotes desenvolvidos pela comunidade e predominantemente usada por estudantes e desenvolvedores de programação. Por esse motivo, é mais fácil encontrar um programador que conheça Python que também queira entrar em análise de dados. É por isso que existem tantos pacotes dedicados à transformação de dados e análise de dados agora disponíveis no Python. Como resultado, o mercado de tecnologias relacionadas à Análise de Dados se voltou para a adoção do Python.

✔ No lado da engenharia de dados, o vencedor claro é certamente Python. Primeiro, o Python é um dos poucos idiomas suportados por todas as APIs que permitem interagir com os serviços de dados de todos os principais provedores de nuvem (Azure, AWS, Google). 

✔ Devido ao fato de toda a parte de engenharia de dados ser tratada em Python, geralmente é conveniente desenvolver modelos de aprendizado de máquina sempre usando Python (você também pode desenvolvê-los em R). 

✔ Python é a escolha necessária quando você precisa enfrentar projetos que exigem soluções de Aprendizado profundo (visão computacional, reconhecimento automático de linguagem falada, processamento de linguagem natural, reconhecimento de áudio usando as estruturas TensorFlow, Keras e PyTorch). Implicitamente, estamos afirmando que o mundo inteiro da Inteligência Artificial é fortemente baseado em Python.

Dito isto, tento responder à pergunta feita no título do artigo.

Conclusões

Atualmente, o Python permite que você lide com tópicos puros de Análise de Dados e Ciência de Dados, bem como Engenharia de Dados e Inteligência Artificial, graças ao vasto ecossistema de pacotes desenvolvidos pela comunidade. É verdade que problemas específicos relacionados mais a Estatísticas e Visualização de Dados são resolvidos mais facilmente usando a linguagem R, mas ainda são casos específicos que compõem uma porcentagem muito pequena dos casos para os quais o Python é mais necessário.

Portanto, embora eu seja mais fluente em R do que em Python,

Eu recomendo que aqueles que desejam abordar os tópicos do Data Analytics se dediquem principalmente ao aprendizado do Python e como usar melhor os pacotes mais importantes para transformação de dados e aprendizado de máquina (pandas, scikit-learn, etc.).).

A versatilidade do Python permite que você alterne de uma função para outra (por exemplo,., de Data Scientist a Data Engineer, ou vice-versa), caso seus interesses mudem durante sua carreira.


Isso não tira o fato de que, depois de se aprofundar no Python, estudar para ter um entendimento básico de R e seus pacotes do ecossistema Tidyverse é definitivamente uma vantagem que será muito útil em muitos casos. Você não deve subestimar que a comunidade R é grande e que muitas soluções foram desenvolvidas em R. Adicionar o conhecimento desse idioma ao seu arsenal é, portanto, uma escolha vencedora. Também porque, ao contrário do que alguns podem pensar, Python e R não são mais dois mundos compartimentados. 

Faço um adendo: na nossa comunidade científica (de contabilidade e áreas afins) há um predomínio de pessoas que conhecem R, mas não Python. Se estudar Python pode ser um diferencial, saber R não te deixa sozinho. 

Rir é o melhor remédio

 

Sim, mas ...

27 dezembro 2022

Blogs podem mudar o mundo

O blog da LSE apresentou um artigo que começa sob forma de pergunta: os blogs podem mudar o mundo? O texto analisa o caso específico do LSE mas creio ser interessante reproduzir o resumo:

Para alguns acadêmicos que estão sendo solicitados a escrever um post de pesquisa, pode parecer gritar no vazio, outra adição a uma massa em constante expansão de conteúdo on-line. No entanto, a rede de conexões que podem surgir desses compromissos e seu potencial de influenciar o mundo em geral são significativos e também são cada vez mais rastreáveis. Neste post Kat Hart usa o banco de dados Overton para avaliar a influência política da plataforma LSE Blogs e a maneira pela qual os blogs acadêmicos podem informar debates públicos e de políticas.

O texto traz uma série de documentos de política que citam o blog da LSE.  

Isto é um alento. Cada vez menos há postagens nos blogs de contabilidade. O esforço de produção é muito grande e as pessoas fazem uma análise do tipo custo-benefício e concluem de maneira negativa. Além disto, outras formas de produção surgiram, como vídeos de curta duração. Este ano postamos mais de mil itens, o que é pouco em relação as 2500 postagens de 2011. 

Mas iremos continuar insistindo. Que venha 2023





Valor de uma assinatura falsa

A notícia é de novembro, mas vale o registro.


A editora Simon & Schuster ofereceu uma edição especial do livro Philosophy of Modern Song, assinada à mão por Bob Dylan. Cada exemplar custaria 600 dólares, que incluía o livro autografado e uma carta do CEO da editora atestando a autenticidade. 

Mas os compradores perceberam que a assinatura do livro é idêntica entre os exemplares, sem nenhuma diferença. E fotos dos livros e da assinatura de Dylan começaram a circular. Dylan pediu desculpas aos fãs e a editora resolveu devolver o dinheiro de quem comprou a edição especial. Segundo a editora, o livro continha a "assinatura original em forma de réplica", o que é realmente estranho. Dylan apelou para a pandemia e a impossibilidade de autografar todos os livros de forma "segura". 

Aqui temos um caso interessante de mensuração contábil. A autenticidade da assinatura poderia justificar o elevado preço do livro. Como alguém que passou horas na fila de uma sessão de autógrafos. Mas uma réplica realmente não vale o preço pago. Além disto, uma editora que garante a autenticidade e não cumpre perde muito da reputação. 

Meta-análise e a insignificância do Empurrão

Recentemente um estudo analisou as pesquisas realizadas com a técnica do empurrão (ou cutucada ou nudge, em inglês). A conclusão do artigo é que talvez o empurrão não apresente um ganho expressivo em termos de resultados. 

Logo após a premiação do Nobel de Economia para Kahnemann, a atenção do mundo acadêmico voltou-se para a área comportamental. Cerca de cinco anos depois surgiu um livro, com o título de Nudge, de co-autoria de Richard Thaler e Cass Sunstein. O livro fez sucesso e sua proposta era mostrar os benefícios da forma sobre a essência e como isto poderia ser usado em políticas públicas. 

Um exemplo famoso do livro é o caso do aeroporto que resolveu colocar uma pequena mosca pintada nos mictórios masculinos. O índice de acerto dos homens aumentou e a quantidade de sujeira dos banheiros diminuiu. Há diversos exemplos sobre o poder da forma como uma questão é apresentada e alguns governantes leram o livro e ficaram entusiasmados com a possibilidade de adotar o enfoque comportamental para resolver alguns problemas de gestão.



O governo britânico, por exemplo, criou uma equipe de trabalho que sugeriu diversas abordagens para algumas políticas públicas. Mas será que o empurrão realmente funciona? Pesquisas e mais pesquisas foram publicadas, algumas apresentando bons resultados, outras com resultados decepcionantes. 

Em 2019, um estudo agrupou o conjunto de pesquisas realizadas na área através de uma técnica chamada meta-análise. O resultado foi, segundo seus autores, que o empurrão não funciona. Imediatamente os críticos da área comportamental divulgaram os resultados que seria uma grande crítica para os pesquisadores. Em 2021 outro estudo chegou a mesma conclusão. (Outro estudo, de 2022, chegou em uma resposta positiva)

Agora o DataColada, um site que investiga a fundo as pesquisas acadêmicas, fez uma crítica severa a pesquisa que "derrubou" o empurrão. Em dois posts o site argumenta que a meta-análise não faz sentido uma vez que os estudos incluídos apresentam uma agregação de resultados que não podem ser agregados. 

A técnica da meta-análise é um grande avanço na ciência e já salvou vidas. Ben Goldacre, em Ciência Picareta, capítulo 4, mostra isto. Mas uma condição relevante para este tipo de estudo é que a pesquisa seja realizada com um grupo de estudos similares e comparáveis. O DataColada considera que isto não foi seguido nas duas pesquisas que rejeitaram a importância no empurrão na decisão humana. Sua posição é mais radical - e contrária a Goldacre - que indicar que é uma análise que não faz sentido.