https://www.reddit.com/r/ProgrammerHumor/comments/31vkjr/reasons_why_people_who_work_with_computers_seem/

https://xkcd.com/303/

Quase todos os campos de TI tem problemas com computador. No caso de Aprendizado de Máquina o problema era o treinamento dos algoritmos haha. Ainda bem que atualmente temos várias soluções para fazer isso remotamente com recursos escaláveis!

A AWS, a Google e a Microsoft tem seus próprios serviços para oferecer tanto para treino de modelos de aprendizado quanto para deploy dos mesmos. Um problema frequente com esses serviços gerenciados é a falta de controle total dos serviços pois cada qual tem suas limitações.

Muitas vezes um cientista de dados não tem domínio completo sobre o controle de recursos, escalabilidade e deploy e acaba cedendo sem hesitar a esses serviços. Em sistemas de grande escala, no entanto, pode ser mais interessante analisar oportunidades de implementação própria em máquinas completamente gerenciadas, como é o caso do EC2 ou do GCP.

Assim como com o Homem Aranha com grandes poderes vem grandes responsabilidades. Ao tomar a decisão de gerenciar suas máquinas toda a questão de gerência de recursos, persistência, escalabilidade, segurança, entre muitos outros aspectos subitamente se tornam relevantes. Vale sempre a pena discutir com a equipe qual a melhor solução a se tomar.