Carta da Gestão – Dezembro/2022

Carta em PDF

Pílulas da Academia II: Inferência Causal

Explorando a Causalidade: Um Olhar Profundo

Desejo de Compreender o Mundo – Explorando a Causalidade

O desejo de compreender o mundo e ter o poder de controlar e prever eventos é inerente à natureza humana. Há mais de dois mil anos, Aristóteles criou uma das primeiras teorias sobre causalidade, que incluía as “quatro causas”1. Além dele, vários filósofos modernos como Descartes, Newton, Leibniz e Stuart Mill também abordaram o tema em suas obras.

Debate sobre Experiência Empírica

Um debate importante nessa linha filosófica diz respeito à questão de se a experiência empírica é suficiente para estabelecer uma relação causal entre dois fenômenos. David Hume argumentou que a relação entre causa e efeito é baseada na experiência e que, para existir, é necessária uma conexão entre as duas, bem como proximidade no espaço e no tempo. No entanto, Kant contestou essa perspectiva, afirmando que uma relação causal nunca pode derivar de uma regularidade empírica, sendo sua origem restrita a uma teoria a priori2.

Pílulas da Academia II: Inferência Causal

Explorando a Causalidade: Um Olhar Profundo

Desejo de Compreender o Mundo - Explorando a Causalidade

O desejo de compreender o mundo e ter o poder de controlar e prever eventos é inerente à natureza humana. Há mais de dois mil anos, Aristóteles criou uma das primeiras teorias sobre causalidade, que incluía as "quatro causas"1. Além dele, vários filósofos modernos como Descartes, Newton, Leibniz e Stuart Mill também abordaram o tema em suas obras.

Debate sobre Experiência Empírica

Um debate importante nessa linha filosófica diz respeito à questão de se a experiência empírica é suficiente para estabelecer uma relação causal entre dois fenômenos. David Hume argumentou que a relação entre causa e efeito é baseada na experiência e que, para existir, é necessária uma conexão entre as duas, bem como proximidade no espaço e no tempo. No entanto, Kant contestou essa perspectiva, afirmando que uma relação causal nunca pode derivar de uma regularidade empírica, sendo sua origem restrita a uma teoria a priori2.

Associativo vs. Causal

Em uma escala de rigor científico, afirmações associativas estão um degrau abaixo daquelas que são causais. Embora seja interessante saber que existe uma correlação entre o signo de uma criança e seu desempenho escolar, essa correlação apenas nos permite entender a superfície do fenômeno. Para chegar ao núcleo da questão, o pesquisador precisa usar instrumentos causais. Neste caso, o padrão de fato existe, mas sua causa está relacionada ao desenvolvimento cognitivo das crianças ao longo do tempo e ao mês de corte considerado para matrículas em escolas3.

A Importância do Controle Adequado

Em linha com o exposto acima, o trabalho de Levitt (1994) é um ótimo exemplo de como o ferramental causal permite uma investigação mais profunda e precisa. Antes desse artigo, a literatura apontava que os gastos em campanha aumentavam bastante a probabilidade de um candidato desafiador - aquele que não está no poder - ser eleito para o congresso americano. Na realidade, como Levitt aponta, candidatos com uma alta chance de serem eleitos são mais propensos a receberem maiores doações eleitorais. Ou seja, não é o dinheiro que aumenta a probabilidade de candidatos serem eleitos, mas a probabilidade de ser eleito que atrai (ou afasta) doações.

Para testar essa hipótese, o autor examinou situações em que os mesmos dois candidatos disputaram um assento no Congresso mais de uma vez. Nesse caso, as variações nos gastos com campanha estão relacionados à capacidade de cada candidato em arrecadar capital e não mais em atrair o voto de eleitores. Ou seja, o efeito relacionado ao carisma de cada candidato passa a ser controlado. Com essa metodologia, o autor apresentou evidências de que, na verdade, o gasto com campanha eleitoral tem um impacto extremamente pequeno no resultado das eleições.

Mesmo que o poder do ferramental causal venha sendo empregado há décadas em outras áreas do conhecimento, a metodologia é pouco explorada em finanças e, mais especificamente, na literatura de precificação de ativos. Por esse motivo, López de Prado (2022) incitou os pesquisadores da área a adotarem esse paradigma em suas análises e a “acordarem de seu sono associativo” com o objetivo de criar o novo campo de conhecimento chamado causal factor investing. Infelizmente, o limite de espaço relacionado a essa carta nos impedem de aprofundar no tema com a profundidade merecida, mas oferecemos um vislumbre do assunto.

Exemplos de Variáveis de Controle

Para isso, vamos considerar o trabalho do brasileiro Carlos Cinelli, professor da Universidade de Washington, sobre o uso de variáveis de controle em modelos econométricos sob uma perspectiva de causalidade (Cinelli, Forney e Pearl (2022)). Como o próprio autor aponta, em termos de modelagem, alguns controles são ruins e podem prejudicar o ajuste do modelo. Outros, por sua vez, são fundamentais para garantir que não exista viés de variável omitida no modelo. Portanto, adicionar ou remover variáveis sem um modelo causal estruturado é como seguir uma receita de bolo sem verificar os nomes dos ingredientes. Visando ilustrar essa questão, apresentamos alguns exemplos de variáveis de controle boas e ruins.

Boas e Más Variáveis de Controle

Como exemplo de uma boa variável de controle, podemos citar o caso de 1973 da Universidade de Berkeley (Bickel, Hammel e O’Connell (1975)). Na ocasião, 44% dos homens que participaram do processo seletivo para a universidade foram aprovados, enquanto apenas 39% das mulheres foram. Isso levou a universidade a ser processada por discriminação de gênero.

Em resposta, o reitor da faculdade realizou uma espécie de auditoria nos processos seletivos por departamento - onde as decisões de aceitação ou recusa eram tomadas - e descobriu que, na verdade, a taxa de aceitação de mulheres e homens era similar. Ou seja, o padrão observado para a população geral se inverteu quando as subamostras foram consideradas. Esse fenômeno, em que uma tendência existe para diferentes grupos, mas desaparece quando os grupos são combinados, foi chamado de paradoxo de Simpson e demonstra a importância do controle adequado em uma análise - nesse caso, o controle por departamento.

Entrando no escopo de variáveis de controle ruins, recorremos ao exemplo fornecido pelo professor Cinelli sobre o paradoxo do peso em recém-nascidos (Hernández-Díaz, et al., 2006.). A literatura médica aponta que recém-nascidos de mães fumantes têm maior risco de mortalidade do que os recém-nascidos de mães não-fumantes. No entanto, entre os recém-nascidos que nasceram com um peso baixo, essa relação se inverte: os recém-nascidos cujas mães são fumantes têm menor risco de mortalidade. Isso poderia sugerir que o tabagismo materno beneficia os recém-nascidos com vulnerabilidades, o que é de difícil compreensão, considerando os conhecidos malefícios do tabagismo para a saúde.

Ao adotar um pensamento causal e abandonar o paradigma associativo, podemos entender melhor esse evento. Sabemos que vários fatores podem afetar o peso de um recém-nascido. Se uma criança nasce com um peso baixo e sua mãe não é fumante, isso pode ser um sinal de outros problemas, como parto prematuro ou alto risco de gravidez. Ao “controlarmos” pelo peso de nascimento, estamos levando em consideração essas outras variáveis que não estão relacionadas ao fato da mãe ser fumante ou não. Por esse motivo, o filtro baseado no peso de nascimento acaba adicionando um viés à estimativa do impacto do tabagismo materno na mortalidade do recém-nascido.

Olhando para o Futuro

Finalmente, podemos prever com confiança que 2023 será um ano de grande progresso e inovação para a literatura de factor investing. Estamos especialmente empolgados com os frutos da colaboração entre as áreas de finanças e inferência causal, bem como as pesquisas que combinam precificação de ativos e inteligência artificial. Isso certamente trará inovações valiosas e importantes para o mercado financeiro e estaremos atentos a cada novo desenvolvimento na área, com o objetivo de aumentar a segurança e a consistência dos nossos retornos.

Associativo vs. Causal

Em uma escala de rigor científico, afirmações associativas estão um degrau abaixo daquelas que são causais. Embora seja interessante saber que existe uma correlação entre o signo de uma criança e seu desempenho escolar, essa correlação apenas nos permite entender a superfície do fenômeno. Para chegar ao núcleo da questão, o pesquisador precisa usar instrumentos causais. Neste caso, o padrão de fato existe, mas sua causa está relacionada ao desenvolvimento cognitivo das crianças ao longo do tempo e ao mês de corte considerado para matrículas em escolas3.

A Importância do Controle Adequado

Em linha com o exposto acima, o trabalho de Levitt (1994) é um ótimo exemplo de como o ferramental causal permite uma investigação mais profunda e precisa. Antes desse artigo, a literatura apontava que os gastos em campanha aumentavam bastante a probabilidade de um candidato desafiador – aquele que não está no poder – ser eleito para o congresso americano. Na realidade, como Levitt aponta, candidatos com uma alta chance de serem eleitos são mais propensos a receberem maiores doações eleitorais. Ou seja, não é o dinheiro que aumenta a probabilidade de candidatos serem eleitos, mas a probabilidade de ser eleito que atrai (ou afasta) doações.

Para testar essa hipótese, o autor examinou situações em que os mesmos dois candidatos disputaram um assento no Congresso mais de uma vez. Nesse caso, as variações nos gastos com campanha estão relacionados à capacidade de cada candidato em arrecadar capital e não mais em atrair o voto de eleitores. Ou seja, o efeito relacionado ao carisma de cada candidato passa a ser controlado. Com essa metodologia, o autor apresentou evidências de que, na verdade, o gasto com campanha eleitoral tem um impacto extremamente pequeno no resultado das eleições.

Mesmo que o poder do ferramental causal venha sendo empregado há décadas em outras áreas do conhecimento, a metodologia é pouco explorada em finanças e, mais especificamente, na literatura de precificação de ativos. Por esse motivo, López de Prado (2022) incitou os pesquisadores da área a adotarem esse paradigma em suas análises e a “acordarem de seu sono associativo” com o objetivo de criar o novo campo de conhecimento chamado causal factor investing. Infelizmente, o limite de espaço relacionado a essa carta nos impedem de aprofundar no tema com a profundidade merecida, mas oferecemos um vislumbre do assunto.

Exemplos de Variáveis de Controle

Para isso, vamos considerar o trabalho do brasileiro Carlos Cinelli, professor da Universidade de Washington, sobre o uso de variáveis de controle em modelos econométricos sob uma perspectiva de causalidade (Cinelli, Forney e Pearl (2022)). Como o próprio autor aponta, em termos de modelagem, alguns controles são ruins e podem prejudicar o ajuste do modelo. Outros, por sua vez, são fundamentais para garantir que não exista viés de variável omitida no modelo. Portanto, adicionar ou remover variáveis sem um modelo causal estruturado é como seguir uma receita de bolo sem verificar os nomes dos ingredientes. Visando ilustrar essa questão, apresentamos alguns exemplos de variáveis de controle boas e ruins.

Boas e Más Variáveis de Controle

Como exemplo de uma boa variável de controle, podemos citar o caso de 1973 da Universidade de Berkeley (Bickel, Hammel e O’Connell (1975)). Na ocasião, 44% dos homens que participaram do processo seletivo para a universidade foram aprovados, enquanto apenas 39% das mulheres foram. Isso levou a universidade a ser processada por discriminação de gênero.

Em resposta, o reitor da faculdade realizou uma espécie de auditoria nos processos seletivos por departamento – onde as decisões de aceitação ou recusa eram tomadas – e descobriu que, na verdade, a taxa de aceitação de mulheres e homens era similar. Ou seja, o padrão observado para a população geral se inverteu quando as subamostras foram consideradas. Esse fenômeno, em que uma tendência existe para diferentes grupos, mas desaparece quando os grupos são combinados, foi chamado de paradoxo de Simpson e demonstra a importância do controle adequado em uma análise – nesse caso, o controle por departamento.

Entrando no escopo de variáveis de controle ruins, recorremos ao exemplo fornecido pelo professor Cinelli sobre o paradoxo do peso em recém-nascidos (Hernández-Díaz, et al., 2006.). A literatura médica aponta que recém-nascidos de mães fumantes têm maior risco de mortalidade do que os recém-nascidos de mães não-fumantes. No entanto, entre os recém-nascidos que nasceram com um peso baixo, essa relação se inverte: os recém-nascidos cujas mães são fumantes têm menor risco de mortalidade. Isso poderia sugerir que o tabagismo materno beneficia os recém-nascidos com vulnerabilidades, o que é de difícil compreensão, considerando os conhecidos malefícios do tabagismo para a saúde.

Ao adotar um pensamento causal e abandonar o paradigma associativo, podemos entender melhor esse evento. Sabemos que vários fatores podem afetar o peso de um recém-nascido. Se uma criança nasce com um peso baixo e sua mãe não é fumante, isso pode ser um sinal de outros problemas, como parto prematuro ou alto risco de gravidez. Ao “controlarmos” pelo peso de nascimento, estamos levando em consideração essas outras variáveis que não estão relacionadas ao fato da mãe ser fumante ou não. Por esse motivo, o filtro baseado no peso de nascimento acaba adicionando um viés à estimativa do impacto do tabagismo materno na mortalidade do recém-nascido.

Olhando para o Futuro

Finalmente, podemos prever com confiança que 2023 será um ano de grande progresso e inovação para a literatura de factor investing. Estamos especialmente empolgados com os frutos da colaboração entre as áreas de finanças e inferência causal, bem como as pesquisas que combinam precificação de ativos e inteligência artificial. Isso certamente trará inovações valiosas e importantes para o mercado financeiro e estaremos atentos a cada novo desenvolvimento na área, com o objetivo de aumentar a segurança e a consistência dos nossos retornos.

1Para um aprofundamento sobre o pensamento de Aristóteles em relação à causalidade, você pode consultar o artigo “Aristotle on Causality“.
2Se você deseja fazer uma revisão do debate filosófico acerca da causalidade, recomendo o artigo “A Short History of Causation“.
3Para uma revisão da literatura sobre o impacto dos signos astrológicos no desempenho escolar em linguagem acessível, o artigo “Psy-Q: Does Your Horoscope Affect School Performance?” pode ser uma fonte útil.