Estou trabalhando em um projeto que envolve a leitura de etiquetas RFID e a comparação da intensidade do sinal que o leitor vê quando você altera a configuração da antena (número de antenas, posição, etc ...). Como parte do projeto, preciso comparar as configurações para ver quais são mais eficazes.
Idealmente, eu seria capaz de executar um teste t não pareado ou uma ANOVA entre duas posições de antena (ou MANOVA entre múltiplas). No entanto, como a resposta está em decibéis logarítmicos, estou me perguntando qual a melhor maneira de prosseguir com isso.
Seria melhor converter os resultados em uma escala linear e comparar com um dos métodos mencionados, ou devo usar decibéis como estão com um teste estatístico diferente para compará-los?
data-transformation
linear-model
descriptive-statistics
Brian Truman
fonte
fonte
mathematical-statistics
funciona muito bem ao solicitar uma prova, a tag correspondente sendo sinônimo da tag anterior.Respostas:
A transformação deve depender de qual escala você deseja sua inferência.
Geralmente, a variação de uma função de não é igual à função da variação de . Porque transformando com e executando inferência estatística (testes de hipóteses ou intervalos de confiança) em , depois a transformação - os resultados dessa inferência a serem aplicados a são inválidos (pois as estatísticas de teste e os ICs exigem uma estimativa da variação).x σ 2 f ( x ) ≠ f ( σ 2 x ) x f f ( x ) f - 1 xx x σ2f( X )≠ f( σ2x) x f f( X ) f- 1 x
Basear ICs em variáveis transformadas + retrotransformação produz intervalos sem as probabilidades nominais de cobertura; portanto, a confiança retrotraduzida sobre uma estimativa baseada em não é confiança em uma estimativa baseada em .xf( X ) x
Da mesma forma, inferências sobre variáveis não transformadas com base em testes de hipótese em variáveis transformadas significam que qualquer um dos itens a seguir pode ser verdadeiro, por exemplo, ao fazer inferências sobre base em alguma variável de agrupamento :yx y
y f ( x ) yx difere significativamente em , mas não difere significativamente em .y f( X ) y
y f ( x ) yx difere significativamente entre , e difere significativamente entre .y f( X ) y
y f ( x ) yx não diferem significativamente entre , e não diferem significativamente entre .y f( X ) y
Em suma, saber se difere significativamente entre os grupos de y não indica se x difere entre y .f( X ) y x y
Portanto, a questão de transformar esses dBs é respondida se você se preocupa com dB ou dB exponencial.
fonte
Estritamente, precisamos ver seus dados para ter alguma chance de dar conselhos definitivos, mas é possível adivinhar.
Como você diz, os decibéis já estão em uma escala logarítmica. É provável que isso signifique, por uma variedade de razões físicas e estatísticas, que eles provavelmente se comportem bem por serem aproximadamente aditivos, homoscedásticos e distribuídos simetricamente, dependendo dos preditores. Mas você pode dar um argumento físico ou de engenharia de como a resposta deve variar conforme você altera suas variáveis de design.
Não conheço nenhum princípio ou teoria possível, o que significa que você é obrigado a exponenciá-los antes de aplicar um teste ou ANOVA. Eu esperava que isso piorasse o comportamento estatístico, não melhor.t
O mesmo tipo de raciocínio geralmente se aplica a outras escalas logarítmicas "pré-transformadas", como pH ou escala Richter.
PS: Não faço ideia do que são as etiquetas RFID.
fonte
Bem, a única maneira de responder definitivamente a essa pergunta é examinar alguns dados em decibéis - existe uma distribuição simples (por exemplo, distribuição gaussiana) que é um bom modelo para isso? Ou o exponencial dos dados é um candidato melhor? Meu palpite é que os dados não exponencializados são mais quase gaussianos e, portanto, para tornar mais simples as análises que se seguem, você deve usá-las, mas eu deixarei que você as julgue.
Discordo de sua análise proposta, que consiste em aplicar um teste de significância aos dados observados de diferentes experimentos (ou seja, diferentes posições da antena). Ao considerar a física disso, deve haver alguma diferença, talvez minúscula, talvez substancial. Porém, a priori, há alguma diferença; portanto, com um conjunto de dados grande o suficiente, você deve rejeitar a hipótese nula de nenhuma diferença. Assim, o efeito de um teste de significância é apenas para concluir "você possui / não possui um grande conjunto de dados". Isso não parece muito útil.
Mais útil seria quantificar a diferença entre as diferentes posições da antena e talvez também levar em conta custos e benefícios para decidir qual posição deve ser selecionada. Às vezes, diferenças quantificadas são chamadas de "análise do tamanho do efeito"; uma pesquisa na web para isso deve gerar alguns recursos. Custos e benefícios estão sob o cabeçalho da teoria da utilidade e da teoria da decisão; novamente uma pesquisa encontrará alguns recursos.
fonte
A escala de decibéis (logarítmica) é útil porque a potência de um sinal geralmente pode ser descrita por uma série (variável) (ou faixa de fluidos) de multiplicações.
Isso é mais simples, se você expressar o logaritmo da potência do sinal, como uma função linear (que, se desejar, requer alguma definição sobre a escala absoluta, neste caso, 0dB se refere a 1 mW)
Sempre que você tiver um processo multiplicativo como:
Espero que o seu termo de erro seja multiplicativo assim. Ou seja: a força do sinal será uma soma de muitos termos de erro distribuídos normais (por exemplo, flutuações de temperatura do amplificador, condições atmosféricas etc.) que ocorrem no expoente da expressão para a força do sinal.
fonte