O que é análise de dados em francês?

9

Alguns métodos estatísticos - não me lembro se é a análise de componentes principais ou algo assim - às vezes são chamados de "análise de dados em francês". O que é isso exatamente ? E algumas pessoas dizem que esse nome é irônico, é verdade e por quê?

Stéphane Laurent
fonte
11
Boa pergunta! Ontem notei que o Analyze des données é um 'bom artigo' na Wikipedia francesa e que seu conteúdo é muito diferente do artigo de Análise de dados da Wikipedia em inglês .
onestop
4
Talvez este artigo seja interessante: Análise multivariada de dados: O jeito francês
Tim
2
Esse artigo parece responder à pergunta - e é o primeiro sucesso no Google. Talvez não tenha sido uma boa pergunta depois de tudo ...
Onestop
2
não tem que ser línguas envolvidos
Aksakal

Respostas:

16

A análise de dados no estilo francês é geralmente identificada como um trabalho baseado na Análise de Correspondência e em outro trabalho orientado espectralmente, mas na verdade é mais profundamente fundamentado. A referência de Tim à peça de Holmes é particularmente útil aqui.

Uma imagem um pouco ampla seria dizer que o estilo francês adota uma abordagem axiomática, geométrica e matemática das matrizes de dados, em vez de uma modelagem estatística. O termo deve ser um pouco irônico, porque embora a CA tenha sido popularizada por Benzecri, LeBart etc. (francês), ela tem precursores em Hirschfeld (alemão) e sucessores em Leeuw / Gifi (holandês) e popularizadores em Greenacre (sul-africano). Greenacre também observou uma conexão importante com o SVD generalizado e gerou para mim o único livro de fácil leitura sobre o assunto. As discussões podem ficar cáusticas - veja a revisão de Murtagh por Leeuw .

Um exemplo útil para ver as consequências comparativas do estilo está na análise de crosstabulações. Com uma simples tabela de referência cruzada, pode-se comparar o estilo 'francês' de Análise de Correspondência simples com base na decomposição espectral de uma tabela adequadamente transformada, com modelagem de Associação (por exemplo, Goodman, Clogg ou Haberman) com base em termos de interação estruturada em um modelo linear de log subjacente . De fato, essas duas abordagens geram parametrizações muito semelhantes (e parâmetros!), Mas o foco é bem diferente. Agresti (1990) tem uma excelente discussão.

conjugateprior
fonte
11
Que você mencionou a equipe Gifi (também conhecida como Leiden univ. Nom de plume ) e o trabalho de Greenacre é realmente bom! Estou apenas relendo o livro em que os autores fornecem uma extensa discussão sobre seu último parágrafo. Meu grande +1.
ch12
3

Talvez "análise de correspondência"? : http://en.wikipedia.org/wiki/Correspondence_analysis porque foi desenvolvido principalmente por um pesquisador francês Jean-Paul Benzecri?

Florian
fonte
11
Alguém me disse que essa "análise multivariada de dados em francês" era ironicamente denominada "análise de dados em francês" porque, na época em que esses métodos foram criados, eles eram impraticáveis ​​(muito intensivos em termos de computação).
Stéphane Laurent
2
Florian> Desenvolvido por Benzecri e muito utilizado por Bourdieu.
2
@ StéphaneLaurent: embora a axiomatização tenha passado por cima da cerca de uma maneira típica francesa, o Analyze des Données era prático e usado. Se você conseguir um "Cahiers de l'Analyse des Données" , verifique isso!
Xi'an