Conheço a microeconometria de Cameron e Trivedi usando Stata. Quais são outros bons textos para aprender Stata?
Conheço a microeconometria de Cameron e Trivedi usando Stata. Quais são outros bons textos para aprender Stata?
Estamos plotando métricas de séries temporais no contexto das operações de rede / servidor. Os dados têm uma taxa de amostragem de 5 minutos e consistem em itens como utilização da CPU, taxa de erro, etc. Estamos adicionando uma linha de "limite" horizontal aos gráficos, para indicar visualmente...
Como você sabe, existem dois tipos populares de validação cruzada, dobra K e subamostragem aleatória (conforme descrito na Wikipedia ). No entanto, eu sei que alguns pesquisadores estão fazendo e publicando artigos em que algo que é descrito como um CV dobrável em K é de fato uma subamostragem...
Em uma resposta a essa pergunta sobre o tratamento de dados categóricos como contínuos , a escala ideal foi mencionada. Como esse método funciona e como é
Forneceu um tamanho de amostra "N" que pretendo usar para prever dados. Quais são algumas das maneiras de subdividir os dados para que eu use algumas delas para estabelecer um modelo e os demais dados para validar o modelo? Sei que não há resposta em preto e branco para isso, mas seria...
Simplificando um pouco, tenho cerca de um milhão de registros que registram o tempo de entrada e saída das pessoas em um sistema que dura cerca de dez anos. Todo registro tem um horário de entrada, mas nem todo registro tem um horário de saída. O tempo médio no sistema é de ~ 1 ano. Os horários de...
Qual a diferença entre pesquisa operacional e análise
Ouvi dizer que muitas quantidades que ocorrem na natureza são normalmente distribuídas. Isso normalmente é justificado usando o teorema do limite central, que diz que, quando você calcula a média de um grande número de variáveis aleatórias de iid, obtém uma distribuição normal. Assim, por...
Eu tenho um modelo de regressão linear com a amostra e as observações variáveis e quero saber: Se uma variável específica é significativa o suficiente para permanecer incluída no modelo. Se outra variável (com observações) deve ser incluída no modelo. Quais estatísticas podem me ajudar? Como...
Estou trabalhando nos dados de infecção por doenças e estou intrigado com a possibilidade de lidar com os dados como "categóricos" ou "contínuos". "Contagem de infecções" o número de casos de infecção encontrados em um período específico de tempo, a contagem é gerada a partir de dados...
Estou usando um gráfico de controle para tentar trabalhar com alguns dados de infecção e emitirá um alerta se a infecção for considerada "fora de controle". Os problemas chegam quando chego a um conjunto de dados em que na maioria das vezes os pontos de tempo têm infecção zero, com apenas algumas...
Estou com dificuldades para selecionar a maneira correta de visualizar dados. Digamos que temos livrarias que vendem livros , e todo livro tem pelo menos uma categoria . Para uma livraria, se contarmos todas as categorias de livros, adquirimos um histograma que mostra o número de livros que se...
Eu tenho um detector que irá detectar um evento com alguma probabilidade p . Se o detector diz que ocorreu um evento, esse é sempre o caso, portanto, não há falsos positivos. Depois de executá-lo por algum tempo, recebo k eventos detectados. Gostaria de calcular qual foi o número total de eventos...
Estou tentando criar um modelo de previsão de regressão de séries temporais para uma variável de resultado, em valor em dólares, em termos de outros preditores / variáveis de entrada e erros correlacionados automaticamente. Esse tipo de modelo também é chamado de modelo de regressão dinâmica....
Qual é a diferença entre ter algo estatisticamente significativo (como uma diferença entre duas amostras) e declarar se um grupo de números é independente ou dependente.
Eu tenho duas implementações de um algoritmo genético que devem se comportar de forma equivalente. No entanto, devido a restrições técnicas que não podem ser resolvidas, sua saída não é exatamente a mesma, dada a mesma entrada. Ainda assim, gostaria de mostrar que não há diferença significativa de...
Saudações, Atualmente, estou fazendo o seguinte em R: require(zoo) data <- read.csv(file="summary.csv",sep=",",head=TRUE) cum = zoo(data$dcomp, as.Date(data$date)) data = zoo(data$compressed, as.Date(data$date)) data <- aggregate(data, identity, tail, 1) cum <- aggregate(cum, identity,...
Apesar de várias tentativas de ler sobre o bootstrap, pareço sempre bater em uma parede de tijolos. Gostaria de saber se alguém pode dar uma definição razoavelmente não técnica de bootstrapping? Sei que não é possível neste fórum fornecer detalhes suficientes para que eu possa entendê-lo...
Para a seleção de preditores na regressão linear multivariada com preditores adequados, quais métodos estão disponíveis para encontrar um subconjunto 'ótimo' dos preditores sem testar explicitamente todos os subconjuntos 2 p ? Em 'Applied Survival Analysis', Hosmer & Lemeshow fazem referência...
por exemplo. se eu tiver uma pontuação de crédito variável de classe com duas classes boa e ruim, em que # (bom) = 700 e # (ruim) = 300. Não quero reduzir meus dados. qual técnica devo usar? Eu estava usando SVM, mas está dando tudo de bom em