Qual é a análise correta para esse tipo de pergunta? (Regressão logística condicional?)

Dada a experiência a seguir, qual é o método estatístico correto para responder à pergunta abaixo:

Um participante recebe as imagens consecutivamente e é obrigado a responder se viu um objeto ou um rosto após cada foto. Em cada tentativa (apresentação da imagem), a imagem apresentada (1 de 210 faces individuais ou 1 de 210 objetos individuais) é sobreposta a uma certa quantidade de ruído aleatório (entre 5% e 98%). A imagem apresentada em cada tentativa é bastante pequena, portanto, cada tentativa também tem um pano de fundo. O fundo pode ser preto, um objeto grande ou uma face grande. As imagens individuais são correspondidas, o que significa que cada imagem individual é apresentada no total 3 vezes, 1 vez com fundo preto, 1 vez com um objeto grande como plano de fundo e 1 hora com um rosto grande como plano de fundo. A quantidade de ruído aleatório sobreposto a uma imagem individual é mantida constante nas três condições de fundo diferentes. O objeto no plano de fundo do objeto grande não muda e não é incluído em uma das 210 imagens de objetos individuais apresentadas. Da mesma forma, o rosto no fundo do rosto grande não muda e não é incluído em uma das 210 fotos de rosto individuais apresentadas. Nenhum ruído é adicionado a nenhum dos fundos.

A pergunta que gostaria de responder é se a percepção de rostos, objetos ou ambos difere significativamente entre as três condições de fundo diferentes. Veja a pergunta 5 abaixo para obter mais detalhes sobre a pergunta que gostaria de responder

Então, no final, eu tenho uma tabela de dados, assim:

+ ------------- + ------------- + ------------- + ------- ------ + ------------- + ------------- +
| Participante | Categoria | ID da foto | Nível de ruído | Fundo | Resposta * |
+ ------------- + ------------- + ------------- + ------- ------ + ------------- + ------------- +
| 1 | 0 1 | 5% | 1 | 0
| 1 | 0 1 | 5% | 2 0
| 1 | 0 1 | 5% | 3 0
| | | | | | |
| 1 | 0 2 24% | 1 | 0
| 1 | 0 2 24% | 2 1 |
| 1 | 0 2 24% | 3 0
| | | | | | |
| 1 | 0 3 80% | 1 | 1 |
| 1 | 0 3 80% | 2 0
| 1 | 0 3 80% | 3 1 |
| | | | | | |
| .. .. .. .. .. ..
+ ------------- + ------------- + ------------- + ------- ------ + ------------- + ------------- +
| 1 | 1 | 211 12% | 1 | 1 |
| 1 | 1 | 211 12% | 2 1 |
| 1 | 1 | 211 12% | 3 1 |
| | | | | | |
| 1 | 1 | 212 20% | 1 | 1 |
| 1 | 1 | 212 20% | 2 0
| 1 | 1 | 212 20% | 3 1 |
| | | | | | |
| 1 | 1 | 213 75% | 1 | 0
| 1 | 1 | 213 75% | 2 0
| 1 | 1 | 213 75% | 3 1 |
| | | | | | |
| .. .. .. .. .. ..
+ ------------- + ------------- + ------------- + ------- ------ + ------------- + ------------- +

onde Categoria é face (0) ou objeto (1) e Resposta também é face (0) ou objeto (1). A resposta do participante é a variável dependente. Dicotômico com um continuum subjacente. Como cada participante é medido nas três condições de fundo, é um design dependente. Como, para uma foto individual, eu mantenho o ruído constante nas três condições de fundo, ele é de alguma forma pareado ou combinado.

Primeiro, pensei em calcular as correlações biseriais e compará-las com base na estatística t, mas depois vi uma regressão logística que parecia se encaixar melhor na minha estrutura de dados. Mas ainda sinto que as amostras correspondentes e o design dependente devem ser incorporados na análise de alguma forma. Então, quando eu procurei por isso, a Regressão Logística Condicional apareceu.

O problema é que, na regressão logística condicional, a correspondência é feita na variável dependente. Eles geralmente correspondem a 1 na variável dependente com uma ou mais 0 amostras. Não correspondi na variável dependente, mas nas variáveis independentes (mesmas imagens com o mesmo nível de ruído em cada condição de fundo). Portanto, acho que não posso usar a regressão logística condicional para esses dados, mas não consegui encontrar nada mais adequado.

Alguém com mais experiência em estatística poderia me explicar qual é a maneira correta de responder à pergunta acima se a percepção de rostos, objetos ou ambos difere significativamente entre as três condições de fundo diferentes.

Obrigado pela ajuda.

[Procedimento experimental]

O experimento tem 1260 ensaios no total. Composto por 210 faces individuais e 210 objetos individuais apresentados 3 vezes cada (uma vez com cada um dos 3 fundos diferentes). A ordem dos ensaios é randomizada com a restrição de que, no primeiro, no segundo e no último bloco de 420 ensaios, cada plano de fundo seja apresentado exatamente 140 vezes e cada objeto individual e cada face individual sejam apresentados exatamente uma vez. A maioria, mas não todas as faces e objetos individuais diferentes, tem uma quantidade diferente de ruído adicionada a eles, mas o ruído de uma face ou objeto individual é mantido contado nas três condições de fundo diferentes apresentadas.

[Perguntas e Respostas]

1. Quantos participantes? Existem 5 participantes no total.

2. Existe algum limite no ruído? O ruído é discretizado em etapas de 0,5% e na faixa [5%, 98%]. O ruído é retirado aleatoriamente de um vetor de ruído (sem substituição) e atribuído a uma imagem. Esse vetor inclui uma distribuição de ruído (210 entradas para cada categoria) que não inclui todos os valores possíveis entre 5% e 98% em etapas de 0,5%, mas ignora alguns desses valores e inclui outros valores até 3 vezes ( resposta à pergunta 3) Isso garante que cada participante experimente os mesmos níveis de ruído (embora não seja provável para as mesmas fotos, pois os níveis de ruído são atribuídos aleatoriamente às fotos individuais no início do experimento) e que haja uma boa cobertura em toda a faixa, mas o foco está em níveis de ruído próximos ao limite em que (para nossa configuração) os participantes podem reconhecer a imagem em cerca de 50% do tempo. Esse limiar foi encontrado em um estudo preliminar com outros participantes, usando as mesmas figuras apresentadas em um fundo preto. Portanto, o plano de fundo preto é o plano de fundo padrão neste experimento.

3. É possível que duas ou mais fotos sejam apresentadas com o mesmo nível de ruído? Sim, isso acontecerá várias vezes e incluirá até 3 fotos individuais para o mesmo nível de ruído, mas não mais que 3.

4. Você pode confirmar que não está interessado na associação de ruído com a resposta?Esta pergunta é difícil de responder para mim. É de se esperar que o efeito de diferentes planos de fundo seja (se houver) mais proeminente se as imagens forem mais difíceis de ver, ou seja, houver mais ruído presente. Então, eu quero considerar o ruído na análise, mas não preciso necessariamente que a análise me diga alguma coisa sobre a associação do ruído com a resposta. Só estou interessado em detectar qualquer tipo de diferença entre as condições de fundo com o máximo de energia possível. No começo, eu queria ajustar duas curvas psicométricas para cada uma das três condições de fundo diferentes (probabilidade de responder com a respectiva categoria versus nível de ruído) e depois comparar as mudanças dos ajustes psicométricos para verificar se há diferenças nas condições de fundo. Contudo, uma análise de bootstrapping revelou que a variação do procedimento de ajuste é muito grande para poder detectar alterações no intervalo que eu esperava que fossem. Portanto, suponho que informações sobre a associação de ruído com a resposta também possam diminuir o poder de outros tipos de análise. Se for esse o caso, não preciso disso.

5. O que você quer dizer com 'percepção' e 'ambos'. O que você realmente quer saber? Por 'percepção de [categoria]' não quero dizer porcentagem correta, mas 'respostas de [categoria]'. A suposição que tenho (e gostaria de testar isso) é que um background de face influenciaria um participante a responder com face, mas um background de objeto NÃO influenciaria um participante a responder com objeto(essa suposição provavelmente não faz sentido para você como leitor, mas é isso que preciso testar). O que quero dizer com 'ambos' é que, caso um background de face influencie um participante a responder com face E um background de objeto influencie um participante a responder com objeto, minha suposição de que apenas o background de face tenha efeito na percepção seria falso. Os diferentes níveis de ruído foram incluídos porque as chances de influenciar a percepção em relação a uma das categorias devem ser maiores quando as imagens são mais difíceis de ver / reconhecer. Portanto, se houver um efeito dependente de segundo plano na percepção para qualquer uma das categorias, é improvável que seja exibido na faixa de ruído de 5% a 20%, mas na faixa de ruído mais alta.

Entre em contato se precisar de mais informações.

hypothesis-testing logistic multiple-comparisons paired-data Simeon
fonte

Você disse que "todo participante é medido nas três condições de fundo" - quantos participantes existem?

Robert Long

Esse será o número total ou você está adicionando mais? Você precisa analisar os dados apenas com os 5 atuais?

Robert Long

Se possível, gostaria de analisá-lo com o atual 5. Devido a certas circunstâncias, só posso medir cerca de 6 pessoas por ano. Portanto, enquanto na teoria eu poderia medir mais, gostaria de evitá-lo, pois isso custaria muito tempo.

Simeon

Existem limites quanto ao ruído (100% do ruído não faria sentido, mas e 99%, por exemplo)? Você pode confirmar que não está interessado na associação de ruído com a resposta? Além disso, cada imagem é única, mas é possível que duas ou mais imagens sejam apresentadas com o mesmo nível de ruído (já que o ruído é atribuído aleatoriamente)?

Robert Long

Sim, existem limites no barulho. Mas como não tenho espaço suficiente neste comentário, adiciono as informações à minha postagem. Obrigado por ser tão meticuloso.

Simeon

Respostas:

Primeiro:

"Lembre-se de que todos os modelos estão errados; a questão prática é quão errados eles devem estar para não serem úteis".

Box, GEP; Draper, NR (1987), Construção empírica de modelos e superfícies de resposta, John Wiley & Sons.

Portanto, não existe uma única maneira correta de modelar seus dados.

A questão de pesquisa é amplamente questionadora sobre a associação do tipo de background na percepção da categoria, no entanto, existem 2 questões distintas:

O background = 3 (face) está associado à resposta = 0 (face) (hipótese da pesquisa: Sim)
O background = 2 (objeto) está associado à resposta = 1 (objeto) (hipótese da pesquisa: Não)

Sua configuração é fatorial. Você está variando os níveis de fatores ( Category, Noisee Background) e medindo a resposta para diferentes combinações destes. Seu interesse particular está na associação de antecedentes (um fator de três níveis) à resposta (uma variável binária); portanto, uma análise de regressão logística parece responder às perguntas.

A estimativa para background=2responde à pergunta: qual é a diferença nas chances de logar de responder com objeto quando o plano de fundo é um objeto comparado a quando o plano de fundo é preto. Isso responde à pergunta de pesquisa 2. Para ser consistente com a hipótese de pesquisa, essa estimativa deve ser pequena e / ou não estatisticamente significante.
A estimativa para background=3responde à pergunta: qual é a diferença nas chances de logar de responder com um objeto quando o fundo é uma face, em comparação com quando o fundo é preto. O negativo desta estimativa é, portanto, a diferença nas chances de logar de responder com uma face quando o fundo é uma face, em comparação com quando o fundo é preto. Isso responde à pergunta da pesquisa 1. Para ser consistente com a hipótese da pesquisa, essa estimativa deve ser pequena e / ou não estatisticamente significativa.

No entanto, esse não é o fim da história ....

Obviamente, você repetiu medidas nos participantes, e isso precisa ser controlado, uma vez que as respostas de um participante serão mais parecidas com as respostas do mesmo participante do que as de outros participantes (é provável que haja correlação de medidas dentro cada participante). Isso pode ser controlado incluindo interceptações aleatórias Participantou incluindo Participantum efeito fixo. 5 é considerado por muitos como o número mínimo de níveis para um fator ser usado como efeito aleatório e, como você pretende adicionar mais participantes ao estudo, essa seria minha recomendação. Qualquer um dos métodos controla medidas repetidas, para que você possa executar os dois modelos e apresentarei os dois abaixo.

Você também tem medidas repetidas em cada imagem, onde cada imagem é medida 3 vezes. Assim, também pode haver correlação dentro de cada figura. Como você tem 420 imagens diferentes, não seria uma boa ideia incluir a imagem como um efeito fixo para controlar isso; portanto, uma interceptação aleatória é apropriada. Então, o meu modelo de partida seria um modelo de efeitos mistos com intercepta aleatórios para Picture_IDe Participant, com efeitos fixos para Category, Backgrounde Noise(com o ruído a ser codificado como numérico). Os participantes não são aninhados dentro de figuras e figuras e não aninhados dentro de participantes, portanto, esses são efeitos aleatórios cruzados.

Ao Rusar o lme4pacote, isso seria especificado como:

glmer(Response ~ Category + Background + Noise + (1|Participant) + (1|Picture_ID), data=dt, family=binomial(link=logit))

Devido ao pequeno número de participantes, um modelo alternativo é:

glmer(Response ~ Category + Background + Noise + Participant + (1|Picture_ID), data=dt, family=binomial(link=logit))

A análise pode ser estendida para permitir:

interações entre os efeitos fixos
associação não linear entre a resposta e o ruído (incluindo termos quadráticos e possivelmente de ordem mais alta para o ruído)
a associação de ruído para variar entre participantes e / ou imagem (incluindo coeficientes aleatórios para ruído)

O acima é baseado em contrastes do fundo desejado com o fundo preto - que é face vs preto e objeto vs preto . Se face vs objeto for necessário, isso pode ser tratado recodificando o fator ou especificando o nível de referência diretamente. Se face vs não face ou objeto vs não objeto for necessário, isso poderá ser feito facilmente criando variáveis fictícias.

Robert Long
fonte

Muito obrigado pela sua resposta. Eu sou novo no R, então terei que procurar no pacote lme4 para entender completamente seus exemplos, mas o que você descreve parece muito com o que estou procurando.

Simeon

Acredito que a regressão logística condicional fornecerá os resultados desejados.

Você identificou corretamente a necessidade de usar uma convenção de medidas repetidas ao analisar esses dados. Você tem 5 entrevistados avaliados para o resultado binário do reconhecimento correto / incorreto de face / objeto em várias condições. As inúmeras respostas de uma pessoa geram a necessidade de uma abordagem de medidas repetidas.

Se sua intenção é realmente melhor declarada como se o entrevistado escolhe uma face ou um objeto, você pode usar a mesma abordagem analítica, mas observe que você interpretaria a classificação não correta / incorreta da escolha dos entrevistados. Para uma terceira categoria de "ambos", você precisaria de regressão logística multinomial. Assumirei que você está interessado na classificação correta / incorreta a seguir.

Você declara: "Como cada participante é medido nas três condições de fundo, é um design dependente. Como, para uma foto individual, eu mantenho o ruído constante nas três condições de fundo, é de alguma forma pareado ou correspondido". As condições em avaliação, embora limitadas em valor ou qualidade, não estão "condicionando" sua análise. O uso de fundo cinza, imagem de rosto com 45% de ruído é apenas um vetor de covariáveis que se apresentam quando uma resposta é registrada. Fundo cinza, objeto, 45% de ruído é outro vetor, enquanto branco, rosto, 10% de ruído é outro. A regressão sugerirá se o fundo (código fictício), ruído ou variáveis adicionais estão associadas à resposta correta. A associação entre identificação correta e mudança em qualquer valor, mantendo todos os outros valores constantes, é a interpretação da regressão multivariável. Assim, você obterá uma noção da associação entre background OU uma diferença de uma unidade no ruído OU se uma face / objeto foi mostrada usando regressão logística condicional.

Seu modelo em R seria algo como:

install.packages("survival")
require("survival")
clogit(correct ~ background + noise + pic_type + strata(person), data)

Um modelo mais complicado para cada face ou objeto específico entre as imagens pode ser considerado, mas você diluirá sua capacidade de detectar o efeito desejado do plano de fundo.

Todd D
fonte

A questão não é sobre se os participantes escolhem objetos ou rostos corretamente, é sobre (citando o OP) "se a percepção de ambos os rostos, objetos ou ambos difere significativamente entre os 3 diferentes condições de fundo"

Joe King

A análise da "percepção" só pode ser entendida como uma de duas coisas: (1) escolhendo uma face ou um objeto ou (2) escolhendo corretamente o que é apresentado. O espaço para eventos parece conter apenas essas duas possibilidades. Portanto, não vejo como "ambos" possam ser analisados. O pôster original deve pesar qual é o desejado. Minha resposta reflete o que considero uma ambiguidade em torno do resultado. Ainda não tenho capacidade para comentar, por isso cobri a ambiguidade em minha resposta.

Todd D

Peço desculpas por não ter sido específico sobre o que eu quis dizer com percepção e por ter escolhido um mau exemplo para as diferentes condições. Eu tenho que percorrer um caminho estreito entre não revelar detalhes de um estudo não publicado e (obviamente) estar perto o suficiente da coisa real para que não haja diferenças na análise. Parece que não fiz um bom trabalho e peço desculpas se isso desperdiçou o tempo de alguém. Adicionei mais um bloco de informações que, esperamos, esclarecer todas as questões em aberto. Se alguém se sentir enganado por essa mudança, avise-me e vejo o que posso fazer.

Simeon

@Simeon Ainda não tenho certeza se entendi completamente o seu problema de pesquisa. No entanto, se você quiser testar (1) se o plano de fundo afeta a percepção da face e (2) se o plano de fundo afeta a percepção do objeto, é possível dividir o conjunto de dados se a face ou o objeto foi mostrado. Você pode avaliar o papel do plano de fundo no reconhecimento de objetos para vários planos de fundo quando um objeto é mostrado em uma análise. A outra análise avaliaria os efeitos de segundo plano no reconhecimento de face quando mostrada uma face. Isso aborda sua intenção?

Todd D

Obrigado pela sua resposta. Embora eu não pretenda dividir o conjunto de dados porque o efeito de influenciar a resposta dos participantes em relação aos rostos também pode ocorrer em ensaios que apresentem um objeto barulhento no fundo do rosto.

Simeon