Dados dois conjuntos de dados de números reais positivos X e Y, ambos do mesmo tamanho e 0 <= Y <= X para cada linha; o CDF empírico de X pode cruzar o CDF empírico de Y?
fonte
Dados dois conjuntos de dados de números reais positivos X e Y, ambos do mesmo tamanho e 0 <= Y <= X para cada linha; o CDF empírico de X pode cruzar o CDF empírico de Y?
O CDF é a proporção da amostra igual ou inferior a t .
Considere ordenar suas linhas aumentando (e com um valor fixo de y , ordenando aumentando x ).
Então, para cada linha (linha , digamos), a altura de cada cdf é i / n *, e as abcissas correspondentes para a amostra x estão sempre à direita da abcissa para a amostra y. As funções step podem coincidir, mas o ecdf da amostra x nunca estará acima / à esquerda do ecdf da amostra y.
De fato, imagine que "desenhemos na trama" todos os saltos verticais no ecdf. Em seguida, uma linha horizontal traçada através da trama em algum valor de vai atacar os passos ecdf em um determinado valor de y e x que aparece na nossa mesa listando os valores das amostras, a fim (de fato, para um dado valor de F , é fácil determine qual linha será † ), que sempre tem y i ≤ x i .
* (é um pouco mais complicado quando há valores duplicados, mas não de maneira que mude substancialmente o argumento)
A resposta de Glen_b está correta, mas acho que há uma maneira ainda mais simples de demonstrar isso.
Apenas formalize o que foi escrito acima:
Nota: Existem algumas suposições implícitas nesta demonstração de que o número de pontos de dados é finito. Eu acho que é possível ter conjuntos de dados infinitos do mesmo tamanho (ou seja, cardinalidade). Estou bastante certo de que o resultado é válido, mas muito menos certo sobre a prova desse resultado.