Qual é a diferença entre aprendizado offline e online ? É apenas uma questão de aprender sobre todo o conjunto de dados (offline) versus aprender de forma incremental (uma instância de cada vez)? Quais são os exemplos de algoritmos usados em
Os algoritmos online referem-se a cálculos que são realizados iterativamente, com dados chegando durante o cálculo. Para perguntas sobre Internet, use a tag "internet".
Qual é a diferença entre aprendizado offline e online ? É apenas uma questão de aprender sobre todo o conjunto de dados (offline) versus aprender de forma incremental (uma instância de cada vez)? Quais são os exemplos de algoritmos usados em
Um artigo "Computando com precisão a variação de execução" em http://www.johndcook.com/standard_deviation.html mostra como calcular a média de execução, a variação e os desvios padrão. Existem algoritmos nos quais os parâmetros de um modelo de regressão linear ou logística podem ser similarmente...
Ultimamente, tenho trabalhado com grandes conjuntos de dados e encontrei muitos documentos sobre métodos de streaming. Para nomear alguns: Líder seguidor-regularizado e descida espelhada: teoremas de equivalência e regularização L1 (
Eu tenho um pequeno problema que está me deixando em pânico. Eu tenho que escrever o procedimento para um processo de aquisição on-line de uma série temporal multivariada. A cada intervalo de tempo (por exemplo, 1 segundo), recebo uma nova amostra, que é basicamente um vetor de ponto flutuante do...
Atualmente, leio o artigo Efficient Online e Batch Learning usando a divisão forward-backward de John Duchi e Yoram Singer. Estou muito confuso sobre o uso dos termos 'Online' e 'Lote'. Pensei 'Online' significa que atualizamos os parâmetros de peso após o processamento de uma unidade dos dados de...
Eu tenho uma matriz de nnn valores reais, que tem média μoldμold\mu_{old} e desvio padrão σoldσold\sigma_{old} . Se um elemento da matriz xixix_i for substituído por outro elemento xjxjx_j , a nova média será μnew=μold+xj−xinμnew=μold+xj−xin\mu_{new}=\mu_{old}+\frac{x_j-x_i}{n} A vantagem...
Pergunta Geral Digamos que temos dados iid x1x1x_1 , , ... entrando. Queremos calcular recursivamente a estimativa de probabilidade máxima de . Ou seja, tendo calculado observamos um novo x_n e desejamos atualizar de alguma forma incremental nossa estimativa \ hat {\ boldsymbol {\ theta}} _...
Digamos que eu tenha um classificador de regressão logística. No aprendizado em lote normal, eu teria um termo regularizador para evitar o excesso de ajustes e manter meus pesos pequenos. Eu também normalizava e dimensionava meus recursos. Em um ambiente de aprendizado on-line, estou recebendo um...
Existem fórmulas on-line conhecidas para calcular médias móveis exponencialmente ponderadas e desvios padrão de um processo (xn)n=0,1,2,…(x_n)_{n=0,1,2,\dots} . Para a média, μn=(1−α)μn−1+αxn\mu_n = (1-\alpha) \mu_{n-1} + \alpha x_n e pela variação σ2n=(1−α)σ2n−1+α(xn−μn−1)(xn−μn)\sigma_n^2 =...
Eu estava usando o termo "Caso Heywood" de maneira informal para me referir a situações em que uma estimativa on-line e 'resposta finita' atualizada iterativamente da variação se tornou negativa devido a problemas de precisão numérica. (Estou usando uma variante do método de Welford para adicionar...
Preciso calcular quartis (Q1, mediana e Q3) em tempo real em um grande conjunto de dados sem armazenar as observações. Tentei pela primeira vez o algoritmo do quadrado P (Jain / Chlamtac), mas não estava satisfeito com ele (um pouco de uso da CPU e não estava convencido pela precisão, pelo menos no...
Isso foi inspirado pela regressão linear online eficiente , que achei muito interessante. Existem textos ou recursos dedicados à computação estatística em larga escala, pelos quais a computação com conjuntos de dados grandes demais para caber na memória principal e talvez variada demais para...
Alguém pode me apontar na direção de um algoritmo online (recursivo) para a regularização de Tikhonov (mínimos quadrados regularizados)? Em uma configuração offline, eu calcularia β^=(XTX+λI)−1XTYβ^=(XTX+λI)−1XTY\hat\beta=(X^TX+λI)^{−1}X^TY usando meu conjunto de dados original, onde λλλ é...
Ultimamente, tenho tentado aprender mais sobre o aprendizado on-line (é absolutamente fascinante!), E um tema que não consegui entender é como pensar na seleção de modelos em contextos offline versus online. Especificamente, suponha que treinar um classificador off-line, com base em um conjunto de...
Eu quero implementar uma regressão de processo gaussiana incremental usando uma janela deslizante sobre os pontos de dados que chegam um por um através de um fluxo. Deixe denotam a dimensionalidade do espaço de entrada. Portanto, todo ponto de dados possui um número d de
Quais são as boas estratégias para executar a regressão gaussiana de processos quando a função que estou tentando aproximar das mudanças ao longo do tempo? A abordagem ingênua que me vem à mente é usar apenas os N pontos de dados mais recentes para realizar a regressão. Quais são as melhores...
Desejo processar imagens de microscopia segmentadas automaticamente para detectar imagens e / ou segmentações defeituosas, como parte de um pipeline de geração de imagens de alto rendimento. Há vários parâmetros que podem ser calculados para cada imagem e segmentação brutas e que se tornam...
Quais podem ser boas técnicas para enfrentar esse problema abstrato? Você tem um fluxo de dados de um sinal contínuo, como o de um sensor físico. Esse sinal tem valores reais (discretizados), nenhum atributo; características adicionais (por exemplo, potência, correlação automática, entropia) podem...
Eu tenho lidado com o seguinte problema. Eu tenho uma espécie de sistema de tempo real e, a cada período de tempo, leio seu valor atual, criando uma série temporal (como 1, 12, 2, 3, 5, 9, 1, ...). Gostaria de conhecer métodos (estatística e aprendizado de máquina) para prever o próximo valor de...
Suponha que eu tenha uma amostra de frequências de 4 eventos possíveis: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 e tenho as probabilidades esperadas de meus eventos ocorrerem: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Com a soma das frequências observadas dos meus quatro eventos (18), posso calcular as...