Estatísticas e Big Data

9
Qual é a média e a variação da distribuição gama?

Existem duas formas para a distribuição Gamma, cada uma com definições diferentes para os parâmetros de forma e escala. Em vez de perguntar como o formulário é usado para a implementação do gsl_ran_gamma , provavelmente é mais fácil solicitar as definições associadas para a média e o desvio padrão...

9
Detectando partes de uma música

Espero que isso não seja muito subjetivo ... Estou procurando alguma direção nos esforços para detectar as diferentes "partes" de uma música, independentemente do estilo musical. Não tenho ideia de onde procurar, mas confiando no poder dos outros sites do StackOverflow, achei que alguém aqui...

9
Como somar duas variáveis ​​que estão em escalas diferentes?

Se eu tiver duas variáveis ​​seguindo duas distribuições diferentes e tendo desvios padrão diferentes ... Como preciso transformar duas variáveis ​​para que, quando somar, os dois resultados não sejam "conduzidos" por um mais volátil. Por exemplo ... A variável A é menos volátil que a variável B...

9
Clustering com medidas de distância assimétricas

Como você agrupa um recurso com uma medida de distância assimétrica? Por exemplo, digamos que você esteja agrupando um conjunto de dados com dias da semana como um recurso - a distância de segunda a sexta-feira não é a mesma que a distância de sexta a segunda-feira. Como você incorpora isso na...

9
A distribuição máxima de entropia é consistente com determinadas distribuições marginais e a distribuição dos produtos pelas marginais?

Geralmente, existem muitas distribuições conjuntas consistentes com um conjunto conhecido de distribuições marginais .P(X1=x1,X2=x2,...,Xn=xn)P(X1=x1,X2=x2,...,Xn=xn)P(X_1 = x_1, X_2 = x_2, ..., X_n = x_n)fi(xi)=P(Xi=xi)fi(xi)=P(Xi=xi)f_i(x_i) = P(X_i = x_i) Destas distribuições conjuntas, o...

9
Como escolher o número de divisões em rpart ()?

Eu tenho usado rpart.controlpara minsplit=2, e obteve os seguintes resultados de rpart()função. Para evitar o ajuste excessivo dos dados, preciso usar as divisões 3 ou 7? Não devo usar divisões 7? Por favor deixe-me saber. Variáveis ​​realmente usadas na construção de árvores: [1] ct_a ct_b...

9
Compreendendo os resultados da regressão de crista

Eu sou novo na regressão cume. Quando apliquei a regressão linear, obtive os seguintes resultados: >myridge = lm.ridge(y ~ ma + sa + lka + cb + ltb , temp, lamda = seq(0,0.1,0.001)) > select(myridge) modified HKB estimator is 0.5010689 modified L-W estimator is 0.3718668 smallest value of...