Perguntas com a marcação «information-retrieval»

21
Medição de similaridade de documentos

Para agrupar documentos (texto), você precisa de uma maneira de medir a semelhança entre pares de documentos. Duas alternativas são: Compare documentos como vetores de termos usando Cosine Similarity - e TF / IDF como os pesos dos termos. Compare a distribuição de probabilidade de cada documento...

21
Como projetar um novo vetor no espaço PCA?

Depois de executar a análise de componentes principais (PCA), quero projetar um novo vetor no espaço do PCA (ou seja, encontrar suas coordenadas no sistema de coordenadas do PCA). Eu calculei o PCA na linguagem R usando prcomp. Agora eu devo poder multiplicar meu vetor pela matriz de rotação PCA....

9
Como comparar eventos observados x eventos esperados?

Suponha que eu tenha uma amostra de frequências de 4 eventos possíveis: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 e tenho as probabilidades esperadas de meus eventos ocorrerem: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Com a soma das frequências observadas dos meus quatro eventos (18), posso calcular as...