Nas estatísticas, devo assumir que

18

Estou estudando estatística e sempre encontro fórmulas contendo o loge estou sempre confuso se devo interpretá-lo como o significado padrão da logbase 10, ou seja, se nas estatísticas o símbolo log geralmente é assumido como o logaritmo natural ln.

Em particular, estou estudando a estimativa de frequência de Good-Turing como exemplo, mas minha pergunta é mais geral.

Giuseppe Romagnuolo
fonte
2
"Para muitas aplicações, o logaritmo natural da função de probabilidade, chamado de probabilidade de log, é mais conveniente para trabalhar". en.wikipedia.org/wiki/Likelihood_function#Log-likelihood Nas estatísticas, muitas vezes trabalhamos com a função de probabilidade, geralmente é o lnque é considerado. No entanto, os dois estão relacionados :, log(x) = ln(x) / ln(10) = ln(x) / 2.303e a função ln- probabilidades atinge o extremo no mesmo ponto que a função log- probabilidades.
John_West
5
Em algumas áreas de aplicação específicas, quando o é mencionado, a base 10 é pretendida, mas, como Aksakal indica, caso contrário, é a convenção usada em matemática - que um log sem adornos significa log natural. loglog
Glen_b -Reinstala Monica
2
Como @John_West diz e l o g um ( x ) estão-se idêntico a um factor de escala. Portanto, eles são os mesmos apenas que você mede em outra unidade. ln(x)loga(x)
1
@Aksakal; o que você diz diz que a unidade é importante (veja meu comentário acima), com a qual eu concordo. Eu também escrevi para indicar explicitamente a base. Para (algumas) aplicações em estatísticas como probabilidade máxima, esse fator de escala é irrelavante. O máximo não será alterado após a adição do fator de escala. Na referência do OP (boa turing ...), eles querem plotar l o g ( N r ) (ou l o g ( Z r ) ) versus l o g ( r )logalog(Nr)log(Zr)log(r). Isso significa que a unidade muda nos dois eixos do gráfico para que a '' curva '' plotada não seja alterada.
1
A menos que você esteja escrevendo um artigo, mesmo ao usar a probabilidade de log, a escala (base do logaritmo) geralmente é importante. Por exemplo, as estatísticas do teste da razão de verossimilhança de log usam , você teria que ajustar a partir de outra base para usar os valores críticos. Se você está escrevendo um software, é importante acertar a base ao usar funções de probabilidade de log de documentos, etc. Existem muitos casos em que a base é importante para afirmar que isso não importa. ln
Aksakal

Respostas:

20

É seguro assumir que, sem o base explícito = ln nas estatísticas, porque o log da base 10 não é usado com muita frequência nas estatísticas. No entanto, outros pôsteres trazem um argumento de que o log 10 ou outras bases podem ser comuns em alguns outros campos em que a estatística é aplicada, por exemplo, teoria da informação. Então, quando você lê artigos em outros campos, às vezes fica confuso.log=lnlog10

A página de entropia da Wikipedia é um bom exemplo de uso confuso de . Na mesma página que significam base 2, e e qualquer base. Você pode descobrir pelo contexto a que se refere, mas requer a leitura do texto. Esta não é uma boa maneira de apresentar o material. Compare-o com a página Logaritmo, onde a base é mostrada claramente em todas as fórmulas ou ln é usado. Pessoalmente, acho que esse é o caminho a seguir: sempre mostre a base quando o sinal de log for usado. Isso também seria compatível com a ISO, pois o padrão não define o uso de base não especificada com o símbolo de log, como @Henry apontou.logelnloglog

Finalmente, a norma ISO 31-11 prescreve sinais e lg para os logaritmos da base 2 e 10. Ambos são raramente usados ​​nos dias de hoje. Lembro que usamos o LG no ensino médio, mas isso foi em outro século em outro mundo. Eu nunca vi isso desde que usado em um contexto estatístico. Não existe nem a etiqueta para lb no LaTeX.lblglglb

Aksakal
fonte
1
Os logaritmos da Base 2 também são bastante comuns em alguns campos. Log não adornado raramente é a base 10, mas nem sempre é a base e .
Nuclear Wang
Útil, mas acho que "raramente" é muito forte. Existem campos substantivos em que as pessoas podem conhecer apenas ou, na melhor das hipóteses, se sentirem mais familiarizadas com os logaritmos da base 10. Note-se que muitos gráficos mostram escalas logarítmicas utilizando potências de 10. Alguém preferindo logaritmos naturais não encontra dificuldade em descodificar tais escalas, mas a presunção é de base 10.
Nick Cox
@NickCox, OP especifica especificamente "estatísticas" como um campo e não vejo o logaritmo da base 10 usado nas estatísticas com frequência.
Aksakal
ISO 31-11 parece especificar de log e , e deixar um sem adornos log indefinidolnlogelog
Henry
1
@NickCox, eu suavizou a linguagem, você trazer um ponto justo
Aksakal
14

Depende.

Fora de alguns contextos, como converter um valor em decibéis, os logaritmos da base 10 são bastante raros em equações. No entanto, os gráficos em escala de log geralmente estão na base 10, embora isso deva ser bastante fácil de verificar pelas etiquetas nos eixos.

Em um contexto matemático, é provável que um sem adornos seja o log natural (ou seja, log e ou ln ). Por outro lado, a ciência da computação geralmente usa logaritmos de base 2 ( log 2 ) e nem sempre são claramente marcados como tal. A boa notícia é que você pode converter entre bases trivialmente e usar a base "errada" fará com que sua resposta seja desativada apenas por um fator constante.loglogelnlog2

No artigo de 1995 de Gale, "Good-Turing Without Tears" , os logaritmos no texto são realmente o (o mesmo diz na página 5), ​​mas o código R / S + no apêndice usa a função, que na verdade é log e ou ln . Como o @Henry aponta abaixo, isso não faz diferença prática.log10loglogeln

Se eu fosse forçado a adivinhar, aqui estão algumas heurísticas:

  • Se potências de 2, ou 10 também estiverem presentes, é provável que os logs tenham a base correspondente.e

  • Se surgir da integração de (ou, geralmente, envolve cálculo), é provável que seja um log natural.1/x

  • Se surgir da divisão repetida de algo pela metade (como na pesquisa binária), é provável que seja o . De maneira mais geral, algo pode ser dividido por n aproximadamente log n vezes.log2nlogn

  • Cálculos teóricos da informação geralmente usam o , especialmente no trabalho moderno. No entanto, você pode verificar as unidades para ter certeza: bitslog 2 , natsln e banslog 10 .log2bitslog2natslnbanslog10

  • Encontrar o ponto em que uma função cai ou sobe para , (37% e 63%, respectivamente) de um valor inicial sugere um log natural.1e or 11e

Matt Krause
fonte
5
+1. Uma pequena dica é que, se exponenciais forem encontrados nas proximidades, o logaritmo natural é mais provável e, inversamente, com potências de 10 ou 2. Se a base usada não for clara, tente reproduzir os cálculos de exemplo dos autores. exp()
Nick Cox
2
Como os gráficos nas páginas 6 e 7 do artigo de Gale mostram as unidades originais em uma escala de log, e os cálculos são direcionados à inclinação de uma relação log-log, ou seja, na expressão log ( N r ) = a + b log ( r ) que corresponde a N r = a r b , não faz diferença prática, neste casoblog(Nr)=a+blog(r)Nr=Arb
Henry
2
Outro exemplo de é quando tecendo dados do mercado de ações, quando se utiliza um preço log eixo é sempre base 10.base10
Marcus D
3

Para responder à sua pergunta: não, você não pode assumir uma notação fixa geral para o logaritmo.

Uma pergunta semelhante foi discutida recentemente no SE.Math: Qual é a diferença entre os três tipos de logaritmos? do ponto de vista matemático. Geralmente, existem notações diferentes que dependem de hábitos ( parece útil em pesquisas médicas ) ou idioma (por exemplo, em alemão, russo, francês). Infelizmente, a mesma notação às vezes acaba representando definições diferentes. Citando o link SE.Math acima:log10

lnxlogexelogx10log10

log2log2loge

0

loglogelog10

Laurent Duval
fonte
0

eln(L^)L^k

AIC=2(kln(L)).

Assim, parece que se você usar qualquer outra base para o logaritmo na AIC, poderá acabar chegando à conclusão errada e selecionando o modelo errado.

Bjørn Kjos-Hanssen
fonte