Um instrutor da minha universidade fez uma pergunta como essa (não para trabalhos de casa, pois a aula terminou e eu não participei). Não consigo descobrir como abordar isso.
A questão diz respeito a 2 sacas cada uma contendo uma variedade de diferentes tipos de frutas:
A primeira sacola contém os seguintes frutos selecionados aleatoriamente:
+ ------------- + -------- + --------- + | diâmetro cm | massa g | podre? | + ------------- + -------- + --------- + | 17,28 | 139,08 | 0 | 6,57 | 91,48 | 1 | | 7,12 | 74,23 | 1 | | 16,52 | 129,8 | 0 | 14,58 | 169,22 | 0 | 6,99 | 123,43 | 0 | 6,63 | 104,93 | 1 | | 6,75 | 103,27 | 1 | | 15,38 169,01 1 | | 7,45 | 83,29 | 1 | | 13.06 157,57 | 0 | 6,61 | 117,72 | 0 | 7,19 | 128,63 | 0 + ------------- + -------- + --------- +
A segunda sacola contém 6 frutas selecionadas aleatoriamente na mesma loja que a primeira sacola. A soma de seus diâmetros é de 64,2 cm e 4 estão podres.
Faça uma estimativa para a massa da segunda bolsa.
Vejo que parece haver dois tipos diferentes de frutas com diâmetros e massas normalmente distribuídos, mas estou perdido em como proceder.
regression
estimation
rutilusk
fonte
fonte
Respostas:
Vamos começar plotando os dados e dar uma olhada neles. Como é uma quantidade muito limitada de dados, será um pouco ad hoc com muitas suposições.
Portanto, estes são os dados, pontos vermelhos representam frutos podres:
Você está certo ao supor que parece haver dois tipos de frutas. As suposições que faço são as seguintes:
Como é dado que a soma do diâmetro é 64,2 cm, é mais provável que dois frutos sejam grandes e quatro pequenos. Agora existem 3 casos para o peso. Existem 2, 3 ou 4 frutos pequenos podres ( um fruto grande sendo podre não afeta a massa por suposição ). Então agora você pode obter limites em sua massa calculando esses valores.
Podemos estimar empiricamente a probabilidade de o número de frutos pequenos estar podre. Usamos as probabilidades para ponderar nossas estimativas de massa, dependendo do número de frutos podres:
Dando-nos uma estimativa final de 691.5183g . Eu acho que você precisa fazer a maioria das suposições que fiz para chegar a uma conclusão, mas acho que pode ser possível fazer isso de uma maneira mais inteligente. Também faço amostras empiricamente para obter a probabilidade de número de pequenos frutos podres, que é apenas preguiça e pode ser feito "analiticamente".
fonte
Eu proporia a seguinte abordagem:
Tudo isso é gerenciável por um script simples.
fonte
Várias abordagens incluem, do mais simples ao complexo,
. . .
métodos combinatórios
As abordagens são organizadas em ordem de simplicidade de cálculo, não na ordem de qualquer abordagem ser melhor, ou de alguma forma boa. A seleção de qual abordagem usar depende de quais características da população são conhecidas ou assumidas. Por exemplo, se as massas de frutas na população da loja são normalmente distribuídas e independentes de diâmetros e status de podridão, pode-se usar a primeira abordagem mais simples, sem vantagens (ou mesmo desvantagens do erro de amostragem de várias variáveis) do uso de abordagens mais complexas . Se não forem variáveis aleatórias distribuídas de forma idêntica independentes, uma escolha mais complexa, dependendo das informações conhecidas ou assumidas sobre a população, pode ser melhor.
fonte