O que é um bloqueio no projeto experimental?

20

Tenho duas perguntas sobre a noção de bloco no desenho experimental: (1) Qual é a diferença entre um bloco e um fator? (2) Tentei ler alguns livros, mas algo não está claro: parece que os autores sempre assumem que não há interação entre o "fator de bloqueio" e outros fatores. Está certo e, se estiver, por que?

experiment-design interaction interpretation Stéphane Laurent
fonte

13

O bloco é um fator. O principal objetivo do bloqueio é reduzir a variação inexplicada de um design - comparado ao design não bloqueado -. Não estamos interessados no efeito do bloqueio em si , mas bloqueamos quando suspeitamos que o "ruído" de segundo plano contraria o efeito do fator real. Agrupamos unidades experimentais em blocos "homogêneos", onde todos os níveis do fator principal são igualmente representados. A análise de variância de um projeto de bloco de controle aleatório divide o termo residual de um projeto aleatório completo de fator único equivalente em componentes residuais e de bloco. Devemos observar, no entanto, que o último componente tem menos graus de liberdade do que nos projetos de CR de fator único, levando a estimativas mais altas para $(SS_{Residual})$
$MS_{Residual} = {SS_{Residual}}/{d.f.}$ .
A decisão de bloquear ou não bloquear deve ser tomada quando consideramos que a diminuição dos resíduos compensará mais do que a redução em df
Geralmente, um modelo aditivo é ajustado aos dados de projeto do RCB, nos quais a variável resposta é uma combinação aditiva do fator e dos efeitos do bloco e é assumido que não existe interação entre os dois. Eu acho que isso é explicado pelo fato de o RCB não nos permitir distinguir a interação BxF da variabilidade dentro do bloco e a variabilidade dentro das unidades experimentais. O ponto principal é que não devemos assumir nenhuma interação, pois não podemos mensurá-la. Podemos testar se está presente visualmente ou com o teste de Tukey.

Um bom recurso no projeto experimental é esse .

Charlie
fonte

(+1) Outra boa leitura é o Design e análise de experiências de Montgomery .

chl

Obrigado @chl. A Montgomery's estava na minha lista de compras, mas optei por não comprá-la, pois era mais voltada para a engenharia do que para a ecologia. Percebi que uma nova edição deve ser publicada em abril de 2012. Você atualiza seu companheiro de R para ela?

Charlie

1

Obrigado a todos. Eu prefiro ter uma mente matemática, então eu tenho dificuldades para ler livros como o de Montgomery em que há muito texto e não a matemática suficientes

Stéphane Laurent

@Charlie Yup, esse é um projeto que remonta a 2006, quando a exibição Doe CRAN Task não existia. Continuarei a trabalhar na 6ª versão com a esperança de finalizá-la este ano (mas digo isso a cada novo ano, então ...). Além do campo de aplicação "tendencioso", ainda acho que o texto permanece excelente para psicólogos e biólogos.

chl

1

@ Stéphane Eu posso sugerir que dê uma olhada em Plane Answers to Complex Questions , de Christensen: menos DoE, mais matemática e uma boa introdução aos Modelos Lineares.

chl

8

Aqui está uma resposta concisa. Muitos detalhes e exemplos podem ser encontrados na maioria dos documentos que tratam do design de experimentos; especialmente em agronomia.

Freqüentemente, o pesquisador não está interessado no efeito do bloco em si, mas quer apenas explicar a variabilidade na resposta entre os blocos. Então, eu uso para ver o bloco como um fator com uma função específica. De notar, o efeito do bloco é normalmente considerado como um efeito aleatório. Finalmente, se você espera que o 'efeito do tratamento' seja diferente de bloco para bloco, as interações devem ser consideradas.

ocram
fonte

7

Aqui está uma paráfrase da minha explicação favorita, da minha ex-professora Freedom King.

Você está estudando como a massa e a temperatura do pão afetam o sabor do pão. Você tem uma escala de classificação para saborear. Digamos que você esteja comprando massa de pão embalada de alguma empresa de alimentos, em vez de misturá-la. Cada pão cozido é uma unidade experimental.

$n=160$

$2\times2$

Como alternativa, você pode tratar o funcionamento do forno como um fator de bloqueio . Nesse caso, você executaria o forno 40 vezes, o que poderia agilizar a coleta de dados. Cada forno teria quatro pães, mas não necessariamente dois de cada tipo de massa. (A proporção exata seria escolhida aleatoriamente.) Você teria 5 fornos para cada temperatura; isso pode ajudá-lo a explicar a variabilidade entre os fornos de mesma temperatura.

Ainda mais chique, você pode bloquear com a massa e com o forno. Nesse projeto, você teria exatamente dois de cada tipo de massa em cada uma das etapas do forno.

Quando tiver tempo para refletir, atualizarei isso ainda mais com os nomes de fantasia apropriados para esses projetos de experimentos.

Thomas Levine
fonte

2 \times 8

$2 \times 8$

2 \times 2

$2 \times 2$

Este é um exemplo de bloqueio incompleto?

SmallChess

6

Projetos experimentais são uma combinação de três estruturas:

A estrutura do tratamento: Como os tratamentos são formados a partir de fatores de interesse?
A estrutura do projeto: Como as unidades experimentais são agrupadas e atribuídas aos tratamentos?
A estrutura de resposta: como são feitas as observações?

Blocos são "fatores" que pertencem à estrutura do design (para distinguir, não é uma má idéia chamá-los de "fatores de bloqueio" versus "fatores de tratamento"). São bons exemplos de parâmetros incômodos : parâmetros de modelo que você precisa ter e cuja presença você deve levar em conta, mas cujos valores não são particularmente interessantes. Observe que isso não tem nada a ver com a natureza de um fator - os fatores de bloqueio podem ser fixos ou aleatórios, assim como os fatores de tratamento podem ser fixos ou aleatórios.

Minha regra geral pessoal sobre onde um fator pertence a um projeto experimental é a seguinte: Se eu quiser estimar os parâmetros associados ao fator e compará-los dentro do fator ou de outros parâmetros, ele pertence à estrutura de tratamento. Se eu não me importo com os valores dos parâmetros associados e não quero compará-los, o fator pertence à estrutura do design.

Portanto, no exemplo do pão em outras partes deste segmento, tenho que me preocupar com diferenças de execução para execução. Mas não ligo para comparar a Execução 1 versus a Execução 24. A execução do forno pertence à estrutura do design . I fazer querer comparar as duas receitas de massa: Receita pertence à estrutura de tratamento. Eu me preocupo com a temperatura do forno: isso também pertence à estrutura de tratamento. Vamos construir um design experimental.

A estrutura do projeto possui um fator (operação do forno, operação) e a estrutura do tratamento, dois fatores (receita e temperatura). Como toda corrida deve ter uma temperatura (nominal) única, a Temperatura e a Corrida devem ocorrer no mesmo nível do projeto experimental. No entanto, há espaço para 4 pães em cada corrida. Obviamente, podemos optar por assar 1, 2, 3 ou 4 pães por corrida.

Se assarmos um pão por corrida e aleatorizarmos a ordem da apresentação da receita, obteremos uma estrutura de design completamente aleatório (CRD). Se assarmos dois pães, um de cada Receita por Execução, teremos uma Estrutura de Projeto de Bloco Completo Aleatório (RCB). Observe que é importante que cada receita ocorra dentro de cada execução. Sem esse equilíbrio, as comparações de receita serão contaminadas pelas diferenças de execução. Lembre-se: o objetivo do bloqueio é livrar-se das diferenças de execução. Se assarmos três pães por corrida, provavelmente ficaríamos loucos: 3 não é um fator de 160, portanto teremos um ou dois blocos de tamanhos diferentes. A outra possibilidade razoável é de quatro pães por corrida. Nesse caso, assaríamos dois pães de cada receita em cada corrida. Novamente, esta é uma estrutura RCB. Podemos estimar a variabilidade dentro da execução usando diferenças entre os dois pães de cada receita em cada execução.

Se escolhermos uma das estruturas de design do RCB, os efeitos da temperatura serão completamente aleatórios no nível de execução. A receita é aninhada dentro da temperatura e possui uma estrutura de erro diferente da temperatura, porque cada massa aparece dentro de cada execução. Os contrastes entre receita e receita por não aditividade (interação) da massa não apresentam variabilidade de corrida a corrida. Tecnicamente, isso é chamado de estrutura de design de plotagem dividida ou de estrutura de medidas repetidas .

Qual o investigador usaria? Provavelmente o RCB com quatro pães: 40 corridas vs 80 vs 160 carrega muito peso. No entanto, isso pode ser modificado - se a preocupação for fornos domésticos, e não produção industrial, pode haver razões para usar o CRD se acreditar que os padeiros domésticos raramente fazem pães múltiplos.

Dennis
fonte

2

Não sigo sua análise do experimento sobre pão, talvez porque vários projetos diferentes desse experimento tenham sido mencionados e você não especifique a qual (s) você está se referindo. Isso torna a maioria dos seus comentários confusos ao invés de esclarecedores. Se você pudesse esclarecer isso, acredito que sua resposta se destacaria.

whuber

1

A importância do # 2 merece ser destacada. A análise pode ser realizada com base na atribuição aleatória de tratamentos experimentais: os blocos representam restrições nessa atribuição aleatória.

Scortchi - Reinstate Monica

1

@whuber Isso porque eu não estava analisando, estava projetando um experimento a partir desses parâmetros de novo . Esclarecido na edição.

1111 Dennis

3

Eu acho que na maioria das vezes é apenas uma questão de convenção, provavelmente apropriada para cada campo. Penso que no contexto médico, em dois fatores anova, um dos fatores é quase sempre chamado de "tratamento" e o outro "bloco".

Normalmente, como diz o ocram, o efeito do bloqueio será aleatório, mas não acho que isso seja sistemático. Vamos dizer que você deseja avaliar a eficácia de diferentes tratamentos médicos:

Primeiro projeto: cada paciente toma apenas um tratamento e a eficiência é medida em uma escala apropriada. Você suspeita que o sexo do paciente seja de interesse: você terá um "bloqueio" de pacientes do sexo masculino e um bloqueio de mulheres. Nesse caso, o bloco é um fator com efeito fixo.
Segundo desenho: cada paciente tenta todos os tratamentos em momentos diferentes. Como existe alguma variabilidade entre os pacientes, você considera cada paciente como um "bloqueio". Você está interessado na existência de tal variabilidade na população, mas não em seu valor nesses pacientes em particular. Nesse caso, o bloco é um fator com efeito aleatório.

Bem, eu apenas ensino essas coisas, tentando seguir as convenções do domínio (na França), como as recebi dos livros, mas nunca participei de um ensaio clínico (e não quero) ... então isso é apenas meus dois centavos...!

Elvis
fonte

1

2^{k}

$2^k$

@chl Acho que você está certo! Eu estava apenas dando alguns exemplos muito básicos ...

Elvis

Eles são bons (um exemplo com um experimento de rendimento / colheita da agronomia tornaria isso ainda mais claro); Eu estava apenas apontando que "bloquear" se estende além do conceito de "fator" e da distinção fixa versus aleatória.

chl

@chl, se você tem uma boa (e simples) referência sobre esse tipo de coisa, ficaria feliz em lê-la (e você deve postar como resposta) ... (não são aceitas referências tão simples assim!)

Elvis

Você quer dizer example(aov)ou o pacote R agricolae ? :-)

chl

O que é um bloqueio no projeto experimental?

Respostas: