Os estatísticos do setor privado tentam determinar a causalidade?

12

Econométricos acadêmicos geralmente estão interessados ​​em determinar a causalidade. Parece que todos os trabalhos estatísticos / de ciência de dados do setor privado que ouço estão procurando apenas modelos preditivos.

Existem empregos no setor privado (ou empregos no governo) que pesquisem a causalidade?

Ótimo38
fonte
5
Sempre que queremos fazer uma intervenção, você aposta que nos importamos. Pense em todos os testes A / B que o Google faz para fazer uma alteração simples no design.
Matthew Drury
8
Claro. Praticamente qualquer processo legal depende de questões de causalidade. Quase todo esquema de controle de qualidade decente está relacionado à causalidade. Engenheiros e cientistas se preocupam muito com isso.
whuber
6
Outra pergunta clássica do setor privado é: "Meus anúncios causam mais vendas?"
Matthew Gunn
2
@MatthewGunn: +1. Em geral: "Essa mudança (cara) fará alguma diferença?" Assumir que uma empresa precisa permanecer à tona (e possivelmente prosperar), é fundamental ter algum grau de compreensão da dinâmica causal de seu mercado.
usεr11852 diz Reinstate Monic
4
Inicialmente, evitei converter esse segmento para a CW, acreditando possível que uma resposta autorizada baseada em dados / fatos pudesse ser oferecida. Como não está sendo assim, por várias razões que muitos podem achar interessantes e úteis, eu o convertei para a CW. Obrigado a todos por suas contribuições!
whuber

Respostas:

15

Sou economista em tecnologia que trabalha com inferência causal com dados experimentais observacionais ou com falhas. A maioria das grandes empresas de tecnologia terá pessoas como eu em torno de fazer pesquisas aplicadas sobre preços, marketing e design de produtos. Existem também equipes de políticas públicas em algumas empresas.

Também existem muitas pessoas que trabalham na experimentação na web. Este é um grupo muito maior.

Por fim, também existem tipos específicos de consultoria econômica, particularmente a truste, onde esse é o foco principal.

Dimitriy V. Masterov
fonte
7

[As cinco primeiras respostas emocionais censuradas.]

Essa é uma das perguntas mais estranhas do site, francamente. E mostra o quanto de desconexão existe entre o que seus professores dizem e a vida real - ou seja, a vida fora da torre de marfim. É bom que você espreite com isso ... mas você (ou seja, estudantes de doutorado em economia) definitivamente precisa fazer isso com mais frequência.

Sim, existem empregos fora da academia onde as pessoas (surpresa, surpresa) usam métodos de inferência causal. E (surpresa, surpresa) publica artigos. Minhas respostas são específicas dos EUA, mas tenho certeza de que você pode encontrar organizações semelhantes em outros países.

  • Exemplo 1 (apenas porque eu o conheço internamente no meu trabalho). Trabalho em uma subsidiária de uma grande organização de pesquisa de contratos, a Abt Associates . Emprega cerca de 2.300 pessoas em 50 países, e a maioria delas trabalha na condução ou apoio à pesquisa de avaliação e na implementação de intervenções. Uma das 6 principais pessoas técnicas (conhecidas como bolsistas seniores ), Jacob Klerman, é o editor da Review Review, supervisionando um conselho de editores, dos quais cerca de 5/6 têm afiliações acadêmicas. Então esse é um exemplo do setor privado para você. (Verifique os anúncios de posição da empresa para ver especificamente que tipo de habilidades uma empresa como essa pode estar procurando - não tenho certeza de que todo mundo anuncie na JOE por ser caro; posso citar facilmente outra dúzia nos EUA que ficaria feliz contratar um economista habilidoso.)
  • Exemplo 2 (tenho uma familiaridade passageira com isso porque conheço pessoas que iniciaram este projeto a partir de outros locais): What Works Clearinghouseno Departamento de Educação federal dos EUA, é um site dedicado à metanálise da análise publicada de programas educacionais. O WWC opera por meio de uma rede de revisores que recebem instruções específicas sobre o que é considerado um estudo com rigor suficiente para apoiar alegações causais e o que não é. Acontece que a maioria dessas pesquisas publicadas é uma porcaria absoluta. Como em besteira. Nenhum grupo de controle. Nenhuma verificação do saldo nas covariáveis ​​demográficas / equivalência de linha de base. Apenas cerca de 3-5% dos estudos (publicados na literatura de revisão por pares) "atendem aos padrões sem reservas" - ou seja, eles tinham alguma aparência de randomização, atrito controlado e contaminação cruzada dos braços do experimento, e fez a análise de maneira mais ou menos aceitável no final da linha. (Pelo teorema de Bayes, quando você ouve alguém dizer: "Mas vi publicado que o chiclete aumenta o desempenho em matemática", você pode responder "BS" e você está certo em mais de 90% do tempo.) De qualquer forma, essa é uma regra federal projeto de departamento, então esse é um exemplo para você, em que uma agência governamental analisa o uso adequado das ferramentas de inferência causal. (Jogue seu nome como revisor do estudo, esta será uma ótima experiência educacional para você. Se eu estivesse ensinando avaliação do programa, eu faria disso um requisito para meus alunos.) (Para bioestatísticos que trabalham com a FDA, onde você precisa enviar seu código de análise antes de coletar dados, os padrões da WWC ainda são muito frouxos.) de qualquer forma, este é um projeto do departamento federal, então esse é um exemplo para você, em que uma agência governamental analisa o uso adequado das ferramentas de inferência causal. (Jogue seu nome como revisor do estudo, esta será uma ótima experiência educacional para você. Se eu estivesse ensinando avaliação do programa, eu faria disso um requisito para meus alunos.) (Para bioestatísticos que trabalham com a FDA, onde você precisa enviar seu código de análise antes de coletar dados, os padrões da WWC ainda são muito frouxos.) de qualquer forma, este é um projeto do departamento federal, então esse é um exemplo para você, em que uma agência governamental analisa o uso adequado das ferramentas de inferência causal. (Jogue seu nome como revisor do estudo, esta será uma ótima experiência educacional para você. Se eu estivesse ensinando avaliação do programa, eu faria disso um requisito para meus alunos.) (Para bioestatísticos que trabalham com a FDA, onde você precisa enviar seu código de análise antes de coletar dados, os padrões da WWC ainda são muito frouxos.)
StasK
fonte
Eu não acho que os professores de economia digam que você não usa métodos causais na prática (ninguém começa uma conversa com "aqui estão alguns métodos estatísticos com os quais ninguém se importará"), mas o aluno está preocupado que a inferência causal seja apenas um marfim tópico da torre (como estimativa de densidade log-côncava: garanto que ninguém na indústria faz isso, e por boas razões). Também não está claro como o exemplo 2 mostra as pessoas na indústria usando métodos causais?
Cliff AB
@CliffAB O OP pediu exemplos da indústria e do governo, de modo que o número 2 se encaixa na conta. Eu também acho que o argumento de StasK sobre o escasso conhecimento da vida fora da torre de marfim entre estudantes de doutorado em economia e, em menor grau, seus professores, é bastante preciso, embora exista muita heterogeneidade entre campos e departamentos e até tempo.
Dimitriy V. Masterov 26/08/16
@ DimitriyV.Masterov: # 2 parece um exemplo de não usar ferramentas causais apropriadas. E li (talvez mal interpretado) a resposta de StasK como implicando que os professores estão dizendo "ninguém fora dos acadêmicos usa métodos causais". Se um professor especializado em métodos causais disse isso, está admitindo o fracasso; se você estiver criando métodos estatísticos aplicados que ninguém fora do mundo acadêmico usa, isso não é considerado uma coisa boa. A teoria estatística é obviamente uma história diferente.
Cliff AB
Minha leitura (novamente, talvez mal interpretada) da pergunta do OP é que os professores estão dizendo a eles "estatística causal é importante!", E sua resposta é "isso é realmente importante? As pessoas na indústria realmente usam esses métodos?". Mas, novamente, talvez eu esteja interpretando mal.
Cliff AB
1
O @CLIFF WWCH analisa a pesquisa acadêmica, separando o joio do trigo até a inferência causal, por isso é realmente um excelente exemplo de uma área em que os padrões são mais altos no governo do que em algumas partes da academia.
Dimitriy V. Masterov 26/08/16
6

Nas estatísticas farmacêuticas e em vários campos relacionados, o nexo de causalidade entre intervenção e resultado da saúde é a principal questão de interesse ao decidir se uma intervenção deve ser usada. Há uma grande variedade de subcampos, como ensaios clínicos randomizados (clínicos ou pré-clínicos), ensaios não randomizados ou de braço único, esforços laboratoriais, metanálises, vigilância de segurança de medicamentos com base em relatórios espontâneos de eventos adversos, epidemiologia (incluindo idéias como randomização mandeliana) e pesquisa de eficácia (por exemplo, usando dados observacionais, como bancos de dados de sinistros). É claro que, nos experimentos randomizados projetados (como ensaios clínicos randomizados), atribuir causalidade é um pouco mais fácil do que em outras aplicações.

Björn
fonte
Suponho que um ambiente de desenvolvimento de medicamentos seria um dos poucos lugares em que as pessoas se preocupam com a causa das pessoas melhorarem, em vez de melhorarem, porque, em última análise, você precisa 'estar seguro' em toda a população. - Então, definitivamente, uma boa resposta, mas como você mencionou, um caso bastante especial.
Dennis Jaheruddin
4

Sou pesquisador do A Place for Mom, o maior serviço de referência de idosos do país. Criamos uma pesquisa com o objetivo de entender como a mudança para uma comunidade de vida assistida influencia a qualidade de vida. A inferência causal é central para esta pesquisa, e os métodos de análise causal (por exemplo, correspondência, modelagem de processos de seleção, estimativa dos efeitos médios do tratamento) são essenciais.

Equilíbrio Brash
fonte
-3

Na maioria das situações do setor privado, você não se preocupa com causalidade

Na prática, apesar do uso típico da linguagem, as pessoas estão muito mais interessadas no impacto bem entendido do que na causalidade (bem entendida).

Do ponto de vista acadêmico, é muito interessante saber:

Se eu fizer A, por causa disso, o resultado será B

Mas, do ponto de vista prático, em quase todas as situações é o que as pessoas realmente querem saber:

Se eu fizer A, o resultado será B

Claro que você pode estar interessado no impacto de A, mas se é realmente a causa ou se existe uma causa oculta que apenas cria essa correlação geralmente não é tão interessante.

Nota sobre limitações

Você pode pensar: ok, mas se não sabemos que A causa B, é muito arriscado trabalhar com essa suposição.

Isso é verdade de certa forma, mas, novamente, na prática, você apenas se preocupará: funcionará ou há exceções?

Para ilustrar isso, você pode observar que esta situação:

Se eu fizer A, na situação X, por causa de A, o resultado será B e, por causa de X, o resultado será desviado por delta

Não é muito mais útil do que esta situação (supondo que você possa quantificar os impactos igualmente):

Se eu fizer A, na situação X, o resultado será B e o resultado será desviado em delta

Exemplo simples: correlação para causar

  • A: Reabasteça o óleo do motor
  • B: Falta de freio reduzida
  • C: Exame de carro

A lógica: C sempre causa A e B

Relação resultante: Se A sobe, B sobe, mas não há relação causal entre A e B.

O que quero dizer: você pode modelar o impacto de A em B. A não causa B, mas o modelo ainda estará correto e, se você tiver informações sobre A, terá informações sobre B.

A pessoa interessada na falha do freio com informações sobre A se preocupará apenas em conhecer a relação de A para B e apenas se preocupará se a relação estiver correta, independentemente de essa relação ser causal ou não.

Dennis Jaheruddin
fonte
1
Acho que não sou o único que está confuso com a sua distinção entre "causa" e "impacto". Seus exemplos parecem esclarecer um pouco: desmarcar os detalhes da cadeia causal pode não ser especialmente importante. A compra de mais anúncios de custo por clique causará um aumento nas vendas - não importa como - e é isso que importa para o seu cliente.
Scortchi - Restabelece Monica
@ Scortchi O que quero dizer com causa: 'Se A, então por causa daquele B'. O que quero dizer com impacto (talvez não seja a definição mais típica, mas não se trata de linguagem): 'Se A, então B'. - Exemplo de diferença relevante em livros didáticos: C causa A e B. Portanto, A não causa B, mas eu diria que faria sentido modelar o impacto de A em B. - Depois de reler meu próprio comentário, talvez 'impacto 'poderia ser substituído por' relação real com atraso de tempo '.
Dennis Jaheruddin 26/08/16
5
Acho que não concordo com o exemplo da publicidade. Se precisar decidir comprar mais anúncios on-line, preocupo-me se isso resultará em mais vendas do que em não comprar esses anúncios (seja por meio de mais cliques ou por outros meios = causalidade), o que pode ser diferente se as empresas que aumentaram sua publicidade on-line no último ano tiveram maiores aumentos de vendas do que as empresas que não tiveram (correlação). A causalidade não é sobre os meios exactos pelos quais o resultado ocorre (seria bom saber, é claro), mas se algo ocorre devido a fazer ou não fazer A.
Björn
6
Nas vendas, você deve se preocupar com causalidade. Se você realizar um experimento no qual açãoUMA é seguido pelo resultado B, mas esse resultado não é causal, você ficará desapontado quando - como é natural e se espera - - quando repetir uma açãoUMA no futuro, apenas inconsistentemente (se alguma vez) for seguido por B. Em suma, a distinção entre "causas" e "impactos" usada nesta resposta parece ser análoga à entre "estatisticamente significante" - interpretada livremente como "digna de crença e base para ação futura" - e "espúria". "
whuber
Não acho que concorde com esse comentário, embora, na minha experiência, seja algo verdadeiro que a causalidade não é procurada, embora em muitos problemas deva. Na prática, vejo isso quase equivalente à distinção entre modelos preditivos e modelos explicativos.
Thomas Speidel