Existem vários usos distintos: estimativa da densidade do kernel truque do kernel suavização do kernel Por favor, explique o que o "núcleo" neles significa, em inglês simples, com suas próprias
Técnicas de suavização de kernel, como estimativa de densidade de kernel (KDE) e regressão de kernel Nadaraya-Watson, estimam funções por interpolação local a partir de pontos de dados. Não deve ser confundido com [kernel-trick], para os kernels usados, por exemplo, nos SVMs.
Existem vários usos distintos: estimativa da densidade do kernel truque do kernel suavização do kernel Por favor, explique o que o "núcleo" neles significa, em inglês simples, com suas próprias
plot(density(rexp(100)) Obviamente, toda a densidade à esquerda de zero representa viés. Estou procurando resumir alguns dados para não estatísticos e quero evitar perguntas sobre por que os dados não negativos têm densidade à esquerda de zero. Os gráficos são para verificação aleatória; Quero...
Para estimadores univariados de densidade de kernel (KDE), eu uso a regra de Silverman para calcular :hhh 0.9min(sd,IQR/1.34)×n−0.20.9min(sd,IQR/1.34)×n−0.2\begin{equation} 0.9 \min(sd, IQR/1.34)\times n^{-0.2} \end{equation} Quais são as regras padrão para o KDE multivariado (assumindo um kernel...
Estou tentando entender melhor a estimativa da densidade do kernel. Usando a definição da Wikipedia: https://en.wikipedia.org/wiki/Kernel_density_estimation#Definition fh^( x ) = 1n∑ni = 1Kh( x - xEu)= 1n h∑ni = 1K( x - xEuh)fh^(x)=1n∑i=1nKh(x−xi)=1nh∑i=1nK(x−xih) \hat{f_h}(x) =...
A estimativa da densidade da janela de Parzen é descrita como p(x)=1n∑i=1n1h2ϕ(xi−xh)p(x)=1n∑i=1n1h2ϕ(xi−xh) p(x)=\frac{1}{n}\sum_{i=1}^{n} \frac{1}{h^2} \phi \left(\frac{x_i - x}{h} \right) onde é o número de elementos no vetor, x é um vetor, p ( x ) é uma densidade de probabilidade de x , h é...
Depois de executar a análise de componentes principais (PCA), quero projetar um novo vetor no espaço do PCA (ou seja, encontrar suas coordenadas no sistema de coordenadas do PCA). Eu calculei o PCA na linguagem R usando prcomp. Agora eu devo poder multiplicar meu vetor pela matriz de rotação PCA....
Esta questão é motivada por discussões em outros lugares . Núcleos variáveis são frequentemente usados na regressão local. Por exemplo, o loess é amplamente usado e funciona bem como uma regressão mais suave, e é baseado em um kernel de largura variável que se adapta à escassez de dados. Por...
Eu li (por exemplo, aqui ) que o núcleo Epanechnikov é ideal, pelo menos em um sentido teórico, ao fazer uma estimativa da densidade do núcleo. Se isso for verdade, por que o Gaussiano aparece com tanta frequência quanto o kernel padrão ou, em muitos casos, o único kernel, nas bibliotecas de...
Estou tentando usar a função ' densidade ' em R para fazer estimativas de densidade do kernel. Estou tendo alguma dificuldade em interpretar os resultados e comparar vários conjuntos de dados, pois parece que a área sob a curva não é necessariamente 1. Para qualquer função de densidade de...
Os testes de permutação (também chamados de teste de randomização, teste de re-randomização ou teste exato) são muito úteis e úteis quando a suposição de distribuição normal exigida por, por exemplo, t-testnão é atendida e quando a transformação dos valores pela classificação do teste...
Eu tenho uma amostra de 100 pontos que são contínuos e unidimensionais. Estimei sua densidade não paramétrica usando métodos de kernel. Como posso tirar amostras aleatórias dessa distribuição
Alguém poderia explicar em inglês simples qual é a diferença entre as regras práticas de Scott e Silverman para a seleção de largura de banda? Especificamente, quando é um melhor que o outro? Está relacionado à distribuição subjacente? Número de amostras? PS Estou me referindo ao código no SciPy...
Preciso estimar a função densidade com base em um conjunto de observações usando o estimador de densidade do kernel. Com base no mesmo conjunto de observações, também preciso estimar a primeira e a segunda derivada da densidade usando as derivadas do estimador de densidade do núcleo. A largura de...
Estou procurando um método para calcular a área de sobreposição entre duas estimativas de densidade de kernel em R, como uma medida de similaridade entre duas amostras. Para esclarecer, no exemplo a seguir, eu precisaria quantificar a área da região sobreposta
Como é definida a variação de longo prazo no domínio da análise de séries temporais? Eu entendo que é utilizado no caso de haver uma estrutura de correlação nos dados. Assim, o nosso processo estocástico não seria uma família de X1,X2…X1,X2…X_1, X_2 \dots iid variáveis aleatórias, mas sim apenas...
Depois de passar por uma matemática um pouco concisa, acho que tenho uma leve intuição da estimativa da densidade do núcleo. Mas também estou ciente de que estimar a densidade multivariada para mais de três variáveis pode não ser uma boa ideia, em termos das propriedades estatísticas de seus...
Estou usando o Bayes para resolver um problema de cluster. Depois de fazer alguns cálculos, acabo com a necessidade de obter a razão de duas probabilidades: P(A)/P(B)P(A)/P(B)P(A)/P(B) para obter P(H|D)P(H|D)P(H|D) . Essas probabilidades são obtidas pela integração de dois KDEs multivariados 2D...
Estou saindo dessa pergunta , caso alguém queira seguir a trilha. Basicamente, eu tenho um conjunto de dados ΩΩ\Omega composto por NNN objetos em que cada objeto tem um determinado número de valores medidos anexados (dois neste
Ao visualizar dados unidimensionais, é comum usar a técnica de Estimativa de densidade do kernel para contabilizar larguras de compartimento escolhidas incorretamente. Quando meu conjunto de dados unidimensional tem incertezas de medição, existe uma maneira padrão de incorporar essas...
Eu apenas pensei em uma maneira pura (não necessariamente boa) de criar estimativas de densidade unidimensional e minha pergunta é: Esse método de estimativa de densidade tem um nome? Caso contrário, é um caso especial de algum outro método na literatura? Aqui está o método: Nós temos um vector...