Estatísticas e Big Data

7
Quantifique a semelhança de sacos de palavras

Eu tenho dois conjuntos de dados que contêm as palavras mais comuns e suas frequências de dois artigos diferentes. por exemplo: A = [apple: 23, healthy: 15, tasty: 4] B = [apple: 19, healthy: 21, bad: 7] Ambos os conjuntos de dados contêm palavras semelhantes. Quero encontrar uma medida que...

7
Quantos americanos, escolhidos aleatoriamente, são necessários para ter 50% de chance de dois morarem no mesmo estado ou em estados adjacentes?

fundo Estou estudando coincidências comuns e coincidências "próximas" que, no entanto (indevidamente) impressionam a pessoa comum. A pergunta abaixo é uma extensão do famoso problema do aniversário , que pergunta "Quantas pessoas, escolhidas aleatoriamente, são necessárias para que haja 50% de...

7
Se , qual o tamanho ?

Se , onde e for uma sequência de variáveis ​​aleatórias positivas, qual o tamanho ?E|Xn|=O(an)E|Xn|=O(an)\mathbb{E}|X_n|=O(a_n)an→0an→0a_n\to 0XnXnX_nYn=Xnln(1Xn)Yn=Xnln⁡(1Xn)Y_n = X_n\ln\left(\frac{1}{X_n}\right) Minha tentativa: pela desigualdade de Markov implica e . Resta avaliar . Para alguma...

7
Cálculo da probabilidade de x1> x2

Sou autodidata sobre probabilidade usando R, modelos lineares e cálculos de probabilidade. Atualmente, estou preso em como comparar duas previsões de um modelo. Os dados que estou usando são baixados (grátis) a partir daqui: wmbriggs.com/public/sat.csv df <- read.csv("sat.csv") # Load data lm...