Significado de "design" na matriz de design?

13

Na regressão linear, Y=Xβ , por que é Xchamado de matriz de design? pode Xser projetado ou construído arbitrariamente até certo ponto, como na arte?

Tim
fonte
3
A origem do termo é bastante antiga, e acredito que remonta às origens da estatística inferencial na análise de experimentos; em particular, acho que se referia à maneira como a matriz X se relacionava com o projeto experimental real (as configurações específicas dos valores- ). Se eu conseguir encontrar uma referência específica, postarei uma resposta. x
Glen_b -Reinstala Monica
@Glen_b: Obrigado! "Design" tem algo a ver com a escolha de uma transformação na variável de entrada, para que a variável de saída também seja linear na variável de entrada transformada? Por exemplo, a matriz de design na regressão polinomial?
Tim
2
Quando você cria um experimento que você especificar os valores de . X
whuber

Respostas:

15

Para dar um exemplo de acordo com a resposta do @ neverKnowsBest, considere que em um experimento fatorial existem 3 fatores, cada um tratado como variáveis ​​categóricas com 2 níveis, e cada combinação possível dos níveis de fator é testada em cada replicação. Se o experimento fosse administrado apenas uma vez (sem replicação), esse projeto exigiria 2 3 = 8 execuções. As execuções podem ser descritas pela seguinte matriz 8x3: [ 0 0 0 1 0 0 0 0 1 0 1 1 0 0 0 1 1 0 1 0 1 1 12323=8 B C ]. (A primeira coluna representa o nível do fator A, a segunda coluna B e a terceira coluna C). Isso é chamado deMatriz de Design,porque descreve o design do experimento. A primeira execução é coletada no nível 'baixo' de todos os fatores, a segunda execução é coletada no nível 'alto' do fator A e os níveis 'baixos' dos fatores B e C e assim por diante.

[000100010110001101011111]
onde as linhas representam as execuções e as colunas representam os níveis dos fatores:
[ABC].

[1000111011000011101001011110100010011001110101001011001011111111]
[IABCABACBCABC].

Citações

Montgomery, D. (2009). Design e Análise de Experimentos, 7ª Edição. John Wiley & Sons Inc. Empresas

tjnel
fonte
9

XXXy=Xβ

O design de experimentos se concentra em como construir a matriz de design e a matriz de modelo, uma vez que isso ocorre antes da coleta de dados. Se os dados já estiverem coletados, o design será definido em pedra, mas você ainda poderá alterar a matriz do modelo. Às vezes, um experimento projetado terá na matriz de design determinadas colunas fixas chamadas covariáveis que não podem controlar, mas você pode observar.

Há algumas coisas que podem acontecer dependendo da sua escolha de modelo e design ... certos parâmetros podem se tornar difíceis de estimar (variações maiores do estimador) ou talvez você não consiga estimar determinados parâmetros. Eu diria que a decisão de um modelo apropriado tem alguns elementos de arte, e certamente há uma arte no design de experimentos.

nunca soube melhor
fonte
2
Isso é muito útil, mas aqui está uma nota de rodapé sobre "covariável". Algumas pessoas usam esse termo muito mais amplamente para qualquer tipo de preditor ou variável independente. (Existem muitos outros sinônimos, naturalmente.)
Nick Cox
(+1) Muito bom para sua primeira contribuição - bem-vindo ao nosso site!
whuber
2

XXXβ


fonte
2

X

X pode ser projetado ou construído arbitrariamente até certo ponto, como na arte?

Basicamente, essa pergunta se resume a "você pode construir um modelo treinado em dados fabricados", para o qual a resposta é obviamente afirmativa. Por exemplo, aqui está uma maneira de construir uma matriz de design arbitrária (vetor de design, na verdade) que fornecerá um modelo com uma inclinação predefinida e interceptará:

design_mat=function(b, a){
  X = runif(100)
  Y = a*X + b
  data.frame(X,Y)
}

df = design_mat(-5, 12.3)

(lm(Y~X, data=df))

Call:
lm(formula = Y ~ X, data = df)

Coefficients:
(Intercept)            X  
       -5.0         12.3  

X=Yba

David Marx
fonte