(Referências) Como derivar modelos de design experimental, em vez de apenas memorizá-los?

8

Na aula de Métodos de Estatística em nível de MS que estou aprendendo, aprendi sobre vários modelos lineares para o design experimental. Tomemos, por exemplo, para o modelo Randomized Complete Block Design (RCBD) ( i representando o bloco, j representando os tratamentos), β representando os efeitos do bloco, τ osefeitos(fixos) do tratamento, ε i j após alguma distribuição N ( 0 , σ 2 ε ) .

YEuj=μ+βEu+τj+εEuj,
EujβτεEujN(0 0,σε2)

Por mais intuitivo que esse modelo possa parecer, eu gostaria de aprofundar um nível e entender como esse modelo é derivado, em vez de apenas memorizar a equação.

Pergunta: Alguém pode me indicar uma fonte que derivaria essa equação para o RCBD e outros modelos de projeto experimental?

Editado devido à resposta : a razão pela qual eu pergunto isso é porque, nas respostas planas de Christansen às perguntas complexas (apêndice G), ele deriva a equação de amostragem aleatória simples , a equação do projeto completamente aleatório y i j = μ i + e i j e a equação do projeto completo aleatório de blocos y i j = α i + β j + e i jyEu=μ+eEuyEuj=μEu+eEujyEuj=αEu+βj+eEujcomo "boas aproximações aos modelos mais apropriados baseados na teoria da randomização". Antes, ele afirma

[S] estatísticas tem tradicionalmente designado a teoria da randomização como uma área de estatística não paramétrica. A teoria da randomização também é de especial interesse na teoria do projeto experimental, porque a randomização tem sido usada para justificar a análise de experimentos projetados.

Então, acho que o que realmente estou pedindo é um livro sobre teoria da randomização que cubra as derivações dessas e de equações similares, relacionadas ao projeto experimental.

Exemplo de prova de um tal (tirado de Christiansen): observações suponha são escolhidos ao acaso (sem substituição) a partir de uma população maior finito (suposição simples amostra aleatória feita a partir de teoria randomização). Suponhamos que os elementos da população são s 1 , ... , s N . Podemos definir variáveis aleatórias de amostragem elementar para i = 1 , ... , n e j = 1 , ... , N : δ i j = { 1 , y IyEus1,,sNEu=1,,nj=1,,N Usando amostragem aleatória simples sem substituição, E[δ i j ]=P(δ i j =1)=1

δjEu={1,yEu=sj0 0,de outra forma.
E[δ i j δ i j ]=P(δ i j δ i j =1)={ 1 / N ( i , j ) = ( i , j ) 1 / [ N ( N - 1 ) ] i i ' , j
E[δjEu]=P(δjEu=1)=1N
Se escreverμ=Σ N j = 1 sj/Neσ2=Σ N j = 1 (sj-μ)2/N, então yi= N Σ j=1δ i j sJ=μ+ N j=1δ i j
E[δjEuδjEu]=P(δjEuδjEu=1)={1/N(Eu,j)=(Eu,j)1/[N(N-1)]EuEu,jj0 0de outra forma.
μ=j=1Nsj/Nσ2=j=1N(sj-μ)2/N Deixando e i = N j = 1 δ i j ( s j - μ ) fornece o modelo linear y i = μ + e i .
yEu=j=1NδjEusj=μ+j=1NδjEu(sj-μ)
eEu=j=1NδjEu(sj-μ)
yEu=μ+eEu.
Clarinetist
fonte
Talvez você precise de alguns livros melhores sobre design experimental. Consulte stats.stackexchange.com/questions/179067/… stats.stackexchange.com/questions/1815/…
kjetil b halvorsen

Respostas:

5

Você está pedindo uma derivação, mas eu argumentaria que essa fórmula não é derivável. Ele se destaca por si só como uma codificação matemática do mundo exterior. A matemática não se importa com o que é um "bloco", mas você sim. E se você acredita que pode ser modelado como uma fonte aditiva de variação, provavelmente terminará com o modelo linear que você propôs acima. Mas os blocos podem interagir com os tratamentos, por exemplo, e então o modelo que você propôs acima estaria errado. Você não pode derivar qual é o modelo "correto" para o mundo.

Você pediu referências, e talvez um bom lugar para procurar sejam alguns dos escritos de RA Fisher sobre design experimental, como O design de experimentos (1960) . Ele nem traz o modelo linear e, em vez disso, concentra-se em particionar a variação por meio de uma Análise de variação. Estou curioso para saber se Fisher pensou em termos de modelo linear no momento em que dividia a variação dessa maneira, e talvez a coisa mais próxima de uma derivação seria mostrar a equivalência da clássica Análise de Variância e a linear. modelo, se você considerar que o primeiro é auto-evidente.

Ben Ogorek
fonte
2
yEu=μ+eEuyEuj=μEu+eEujyEuj=αEu+βj+eEujcomo "boas aproximações aos modelos mais apropriados baseados na teoria da randomização".
Clarinetist
1
Anteriormente, ele afirma que "[a estatística] designou tradicionalmente a teoria da randomização como uma área de estatística não paramétrica. A teoria da randomização também é de especial interesse na teoria do design experimental, porque a randomização tem sido usada para justificar a análise de experimentos projetados". Então, acho que o que realmente estou pedindo é um livro sobre teoria da randomização.
Clarinetist
1
Sua pergunta é interessante. Eu certamente não estava pensando em teoria da randomização. Eu acho que isso envolveria uma definição de efeitos de bloco que são em termos dos membros da população finita e, talvez, esse modelo possa ser "derivado". Espero que vejamos uma resposta como essa.
Ben Ogorek