O que significa Theta?

16

Eu sou um novato em estatísticas e encontrei isso .

Nas estatísticas, θ, a letra grega minúscula 'theta', é o nome usual para um (vetor de) parâmetro (s) de alguma distribuição de probabilidade geral. Um problema comum é encontrar o (s) valor (es) de teta. Observe que não há sentido em nomear um parâmetro dessa maneira. É melhor chamarmos isso de qualquer outra coisa. De fato, muitas distribuições têm parâmetros que geralmente recebem outros nomes. Por exemplo, é comum o uso para nomear a média e o desvio da distribuição normal μ (leia-se: 'mu') e o desvio σ ('sigma'), respectivamente.

Mas ainda não sei o que isso significa em inglês simples?

Kamilski81
fonte
10
θ é apenas um símbolo matemático e significa coisas diferentes em contextos diferentes. Às vezes,θ é usado para se referir a um parâmetro a ser estimado, mas não há resposta real para a pergunta "O que éθ ?". É como perguntar "Qual é a letra A?". Seu link até sugere isso quando diz"Observe que não há sentido em nomear um parâmetro dessa maneira. É melhor chamá-lo de qualquer outra coisa". .
Macro
É apenas uma maneira de nomear um parâmetro estatístico (que define a distribuição da quantidade associada a esse 'parâmetro') com uma letra especial (exceto letras em inglês).
Stat-R
4
Muitos de nós considerariam essa citação um inglês extremamente claro, mas, para progredir, precisamos aceitar que a pergunta não é sobre como ler o inglês. O que, então, poderia ser? Eu afirmo que está nos pedindo para explicar os termos técnicos da citação: aqueles com os quais estamos tão familiarizados que não vemos mais como eles podem ser estranhos para os não-iniciados estatisticamente. Isso exige que abordemos os significados de distribuição e parâmetros (de uma distribuição que é; não de uma curva ajustada ou outro modelo determinístico).
whuber

Respostas:

31

Não é uma convenção, mas muitas vezes representa o conjunto de parâmetros de uma distribuição.θ

Era isso para o inglês simples, vamos mostrar exemplos.

Exemplo 1. Você quer estudar o arremesso de uma tachinha à moda antiga (aquelas com fundo grande circular). Você supõe que a probabilidade de queda seja um valor desconhecido que você chama de . Você pode chamar uma variável aleatória X e dizer que X = 1 quando a tachinha cai apontada para baixo e X = 0 quando cai apontada para cima. Você escreveria o modeloθXX=1X=0

P(X=1)=θP(X=0)=1θ,

e você estaria interessado em estimar (aqui, a probabilidade de queda da tachinha apontar para baixo).θ

Exemplo 2. Você deseja estudar a desintegração de um átomo radioativo. Com base na literatura, você sabe que a quantidade de radioatividade diminui exponencialmente; portanto, você decide modelar o tempo para a desintegração com uma distribuição exponencial. Se é o tempo de desintegração, o modelo ét

f(t)=θeθt.

Aqui é uma densidade de probabilidade, o que significa que a probabilidade de o átomo se desintegrar no intervalo de tempo ( t , t + d t ) é f ( t ) d t . Novamente, você estará interessado em estimar θ (aqui, a taxa de desintegração).f(t)(t,t+dt)f(t)dtθ

Exemplo 3. Você deseja estudar a precisão de um instrumento de pesagem. Com base na literatura, você sabe que as medidas são gaussianas e decide modelar a pesagem de um objeto padrão de 1 kg como

f(x)=1σ2πexp{(xμ2σ)2}.

Aqui é a medida dada pela escala, f ( x ) é a densidade de probabilidade e os parâmetros são μ e σ , então θ = ( μ , σ ) . O parâmetro μ é o peso alvo (a balança é enviesada se μ 1 ) e σ é o desvio padrão da medida toda vez que você pesa o objeto. Novamente, você estará interessado em estimar θ (aqui, o viés e a imprecisão da escala).xf(x)μσθ=(μ,σ)μμ1σθ

gui11aume
fonte
1
Com +1 no FWIW, publiquei recentemente um exemplo trabalhado nas mesmas linhas em stats.stackexchange.com/a/34894 . Embora fosse enganoso interpretá-lo como "inglês simples" - não se intimida com o uso de termos técnicos - fiz um esforço para explicar da maneira mais clara e sucinta possível o que está acontecendo, que suposições são feitas e como trabalha com uma família de distribuições parametrizada para produzir uma estimativa com base nos dados. Para alguns, isso pode ser um complemento informativo para sua resposta aqui.
whuber
1
Ótima resposta! Estou confuso quando você declara que a escala é tendenciosa se mu! = 1, no entanto. De fato, ao "normalizar", a distribuição normal padrão se torna x ~ N (0, 1). Ou, em inglês, mu = 0 e variação = 1. Veja, por exemplo, en.wikipedia.org/wiki/…
Mike Williamson
Apenas quero dizer que o instrumento tem um viés se indicar algo além de 1 kg quando mede um objeto de 1 kg. Talvez a palavra "escala" seja confusa. Aqui apenas designa o instrumento.
gui11aume
3

O que se refere depende de qual modelo você está trabalhando. Por exemplo, na regressão de mínimos quadrados ordinários, você modela uma variável dependente (geralmente chamada Y) como uma combinação linear de uma ou mais variáveis ​​independentes (geralmente chamadas X), obtendo algo comoθ

Yi=b0+b1x1+b2x2+...+bpxp

onde p é o número de variáveis ​​independentes. Os parâmetros a serem estimados aqui são os e θ é um nome para todos os β s . Mas θ é mais geral e pode ser aplicado a qualquer parâmetro que desejemos estimar.βsθβsθ

Peter Flom - Restabelecer Monica
fonte
3
Peter, embora você não disse isso exatamente, eu estou receoso que esta resposta pode dar um novato a impressão incorreta de que o símbolo irá sempre se referir a um vetor de parâmetros e, por outro lado, que esta é a única maneira de se referir a um parâmetro valor. Como meu comentário acima indica, acho que a resposta nada mais é do que " θ é um símbolo matemático", tornando-a não uma questão estatística. θθ
Macro
1
@ Macro Acho que, nesse contexto, fica claro que esse é o significado de que Kamilski queria. Claro, qualquer símbolo pode se referir a qualquer coisa. Mas neste parágrafo, Macro significa você, e não um curso de Economia ou parte do SAS ou outros enfeites. θ
Peter Flom - Restabelece Monica
1
ok, bem, eu não acho que a analogia seja realmente adequada, mas a considerarei uma tentativa de hipérbole. De qualquer forma, estou realmente me referindo a algo muito básico, que é que os iniciantes em matemática confundem a notação como algo inerentemente significativo e como algo diferente do que é - simplesmente um rótulo. Meu argumento era que essa resposta (penso sem querer) não faz nada para dissipar essa ideia. Como você sabe, pode se referir a outras coisas que um estatístico pode encontrar. Por exemplo, os ângulos são frequentemente indicados por θ . θθ
Macro
4
Essa explicação, embora seja clara e tecnicamente correta, não envolve explicitamente nenhuma distribuição e, portanto, parece não ser relevante para a citação na pergunta.
whuber
1

Em inglês simples:

A distribuição estatística é uma função matemática que informa qual é a probabilidade de diferentes valores da sua variável aleatória X que possui a distribuição f , ou seja,f Xf gera uma probabilidade de x . Existemdiferentesum talfunções, mas por agora vamos considerar f como algum tipo de função "geral".f(x)xf

fμσθθμσ(ou seja, é um vetor dos dois valores).

θμμ=0μμμ=50θθ

θ

Tim
fonte