Estouro de heap de threads de Haskell apesar do uso de memória total de apenas 22 MB?

Estou tentando paralelizar um ray-tracer. Isso significa que tenho uma lista muito longa de pequenos cálculos. O programa vanilla é executado em uma cena específica em 67,98 segundos e 13 MB de uso de memória total e produtividade de 99,2%. Na minha primeira tentativa, usei a estratégia paralela...