Perguntas com a marcação «k-nearest-neighbour»

Classificadores k-vizinhos mais próximos Esses classificadores são baseados em memória e não requerem modelo para serem adequados. Dado um ponto de consulta x0, encontramos os k pontos de treinamento x (r), r = 1, ..., k mais próximos da distância de x0 e, em seguida, classificamos com voto majoritário entre os k vizinhos.

28
Cálculo da repetibilidade dos efeitos de um modelo mais antigo

Acabei de me deparar com este artigo , que descreve como calcular a repetibilidade (também conhecida como confiabilidade, também conhecida como correlação intraclasse) de uma medição via modelagem de efeitos mistos. O código R seria: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the...

18
complexidade computacional k-NN

Qual é a complexidade de tempo do algoritmo k -NN com abordagem de pesquisa ingênua (sem árvore kd ou similar)? Estou interessado em sua complexidade de tempo, considerando também o hiperparâmetro k . Eu encontrei respostas contraditórias: O (nd + kn), onde n é a cardinalidade do conjunto de...

15
Escolhendo o K ideal para KNN

Realizei um CV 5 vezes para selecionar o K ideal para o KNN. E parece que quanto maior o K fica, menor o erro ... Desculpe por não ter uma lenda, mas as cores diferentes representam tentativas diferentes. Existem 5 no total e parece que há pouca variação entre eles. O erro sempre parece diminuir...

15
Por que você precisa escalar dados no KNN

Alguém poderia me explicar por que você precisa normalizar os dados ao usar o K vizinhos mais próximos. Eu tentei procurar isso, mas ainda não consigo entender. Encontrei o seguinte link: https://discuss.analyticsvidhya.com/t/why-it-is-necessary-to-normalize-in-knn/2715 Mas nesta explicação,...

14
Pacotes R de imputação KNN

Estou procurando um pacote de imputação KNN. Eu estive analisando o pacote de imputação ( http://cran.r-project.org/web/packages/imputation/imputation.pdf ), mas por algum motivo a função de imputação do KNN (mesmo quando segue o exemplo da descrição) parece apenas imputar valores zero (conforme...

13
Lidar com laços, pesos e votação em kNN

Estou programando um algoritmo kNN e gostaria de saber o seguinte: Tie-breaks: O que acontece se não houver um vencedor claro na votação majoritária? Por exemplo, todos os k vizinhos mais próximos são de classes diferentes, ou para k = 4 existem 2 vizinhos da classe A e 2 vizinhos da classe B? O...

12
Estimadores adaptativos de densidade de kernel?

Alguém pode relatar sua experiência com um estimador de densidade de kernel adaptável? (Existem muitos sinônimos: adaptável | variável | largura variável, KDE | histograma | interpolador ...) A estimativa da densidade variável do kernel diz "variamos a largura do kernel em diferentes regiões do...

11
Distância Pros of Jeffries Matusita

De acordo com algum artigo que estou lendo, a distância de Jeffries e Matusita é comumente usada. Mas não consegui encontrar muita informação, exceto a fórmula abaixo JMD (x, y) =∑(xi−−√2−yi−−√2)2−−−−−−−−−−−−−√2∑(xi2−yi2)22\sqrt[2]{\sum(\sqrt[2]{x_i}-\sqrt[2]{y_i})^2} É semelhante à distância...