Estou fazendo o curso de Andrew Ng sobre Machine Learning através do Coursera . Para equações, sobrescritos são usados em vez de subscritos. Por exemplo, na seguinte equação é usada em vez de :
Aparentemente, essa é uma prática comum. Minha pergunta é por que usar sobrescritos em vez de subscritos? Os sobrescritos já são usados para exponenciação. Concedido, parece que sou capaz de desambiguar entre os casos de uso sobrescrito e exponenciação prestando atenção à presença ou não de parênteses, mas ainda parece confuso.
machine-learning
notation
entpnerd
fonte
fonte
i
indexação está no tamanho do conjunto de dados ou nos elementos do vetorx
? Se o primeiro, isso é totalmente padrão. Neste último caso, isso é totalmente fora do padrão. E a razão pela qual o sobrescrito é usado é porque às vezes você deseja se referir ao elemento do vetor usando o subscrito.Respostas:
Se denota um vetor , é uma notação padrão para a ésima coordenada de , ou seja,x ∈ R m x i i x x = ( x 1 , x 2 , … , x m ) ∈ R m .x x ∈ Rm xEu Eu x
Se você tem uma coleção de desses vetores, como você indicaria um ésimo vetor? Você não pode escrever , isso tem outro significado padrão. Às vezes, as pessoas escrevem e é por isso que acredito que Andrew Ng o faça.i x i x ( i )n Eu xEu x( I )
Ou seja,
fonte
O uso de super scripts, como você afirmou, acredito que não é muito comum na literatura de aprendizado de máquina. Eu teria que revisar as anotações do curso de Ng para confirmar, mas se ele colocar esse uso lá, eu diria que ele seria a origem da proliferação dessa notação. Esta é uma possibilidade. De qualquer maneira, para não ser muito desagradável, mas não acho que muitos dos alunos do curso on-line estejam publicando literatura sobre aprendizado de máquina, portanto, essa notação não é muito comum na literatura real. Afinal, esses são cursos introdutórios de aprendizado de máquina, e não de nível de doutorado.
O que é muito comum nos super scripts é denotar a iteração de um algoritmo usando super scripts. Por exemplo, você pode escrever uma iteração do método de Newton como
onde é o hessiano e é o gradiente.H( θ( T )) ∇ θ( T )
(... Sim, essa não é a melhor maneira de implementar o método de Newton devido à inversão da matriz Hessiana ...)
Aqui, representa o valor de na iteração . Esse é o uso mais comum (mas certamente não apenas) dos super scripts que eu conheço.θ( T ) θ tt h
EDIT: Para esclarecer, na pergunta original, parecia sugerir que na notação ML, era equivalente à notação da estatística . Na minha resposta, afirmo que isso não é realmente prevalente na literatura sobre ML. Isso é verdade. No entanto, como apontado por @amoeba, há muita notação sobrescrita na literatura de ML para dados, mas nesses casos normalmente não significa a observação de um único vetor .x( I ) xEu x( I ) Eut h x
fonte
=
==
Em matemática, sobrescritos são usados à esquerda e à direita, dependendo do campo. A escolha é sempre um legado histórico, nada mais. Quem entrou em campo pela primeira vez estabeleceu a convenção de usar sub ou sobrescritos.
Dois exemplos Sobrescritos são usados para denotar derivadas:f( X )( N )
Portanto, a escolha de sobrescritos por Ng também é puramente histórica. Não há motivo real para usá-los ou não, ou preferi-los a subscritos. Na verdade, acredito que aqui as pessoas da ML estão usando notação tensorial. Eles definitivamente são bem versados no assunto, por exemplo, veja este artigo.
fonte