Eu acho que há alguns fios cruzados aqui. O MLE, como referido na literatura estatística, é a Estimativa de Máxima Verossimilhança. Este é um estimador . O algoritmo EM é, como o nome indica, um algoritmo que é frequentemente usado para calcular o MLE. Estas são maçãs e laranjas.
Quando o MLE não está na forma fechada, um algoritmo comumente usado para encontrá-lo é o algoritmo de Newton-Raphson, que pode ser o que você está se referindo quando afirma que "também pode ser resolvido com o MLE". Em muitos problemas, esse algoritmo funciona muito bem; para problemas de "baunilha", normalmente é difícil de derrotar.
No entanto, existem muitos problemas em que falha, como modelos de mistura. Minha experiência com vários problemas computacionais tem sido que, embora o algoritmo EM nem sempre seja a escolha mais rápida, geralmente é o mais fácil por várias razões. Muitas vezes, com novos modelos, o primeiro algoritmo usado para encontrar o MLE será um algoritmo EM. Então, vários anos depois, os pesquisadores podem descobrir que um algoritmo significativamente mais complicado é significativamente mais rápido. Mas esses algoritmos não são trivalentes.
Além disso, especulo que grande parte da popularidade do algoritmo EM é o sabor estatístico dele, ajudando os estatísticos a se sentirem diferenciados dos analistas numéricos.