Kubernetes versus Amazon ECS para científicos de datos
Kubernetes versus Amazon ECS para cientificos de datos
Artículo original:
Kubernetes vs. Amazon ECS for Data Scientists
En este artículo analizaremos dos soluciones de administración de contenedores, Kubernetes y Amazon Elastic Container Service (ECS), desde una perspectiva adecuada para los que son, como para los que quieren ser científicos de datos.
Autor Devin Partida, Editor jefe de ReHack.com
En el desarrollo de su actividad como científico de datos, seguramente encontrará oportunidades para utilizar soluciones de administración de contenedores. En este artículo veremos dos tipos de soluciones, Kubernetes y Amazon Elastic Container Service (ECS), desde una perspectiva adecuada para aquellos que son, así como para los que quieren ser científicos de datos.
Ambas opciones admiten la implementación de modelos de aprendizaje automático
Por otra parte, hay un kit de herramientas de aprendizaje automático para usuarios de Kubernetes llamado Kubeflow. Es una solución de código abierto, portátil y escalable. Los usuarios pueden aplicarlo a cualquier implementación de Kubernetes nueva o existente.
Ambas elecciones son seguras
Al observar las comparaciones entre Kubernetes y ECS, no se sorprenda al encontrar detalles sobre las zonas de disponibilidad y la confiabilidad general. Elegir un servicio confiable puede ayudarle a evitar interrupciones que podrían hacer descarrilar temporalmente sus proyectos de ciencia de datos.
ECS se ejecuta en 69 zonas de disponibilidad y 22 regiones. Además, ECS cae bajo el paraguas de Amazon Web Services (AWS). Eso significa que garantiza una tasa de tiempo de actividad de al menos el 99,99%.
Kubernetes potencia la confiabilidad con un enfoque en el que se distribuyen los pods de Kubernetes entre los nodos para hacerlos más tolerantes a los fallos de las aplicaciones. Además, la alta disponibilidad de Kubernetes se extiende tanto a nivel de infraestructura como de aplicación.
Además, con el lanzamiento de Kubernetes 1.2 apareció el soporte para ejecutar clústeres únicos en múltiples zonas de disponibilidad ofrecidas por los proveedores de la nube. Sin embargo, las zonas seleccionadas deben estar en la misma región y las debe proporcionar el mismo servicio en la nube.
Esa versión de Kubernetes ofrecía una selección de múltiples zonas automáticamente a los usuarios de AWS y Google Compute Engine (GCE). Sin embargo, la aplicación de las etiquetas adecuadas a los nodos y volúmenes crea el soporte para servicios en la nube adicionales.
Amazon ECS es parte del ecosistema existente
Amazon ECS es parte del ecosistema de AWS. Eso supone ventajas en algunos casos y desventajas en otros. Por ejemplo, es más fácil y rápido realizar la configuración inicial en comparación con Kubernetes porque podemos hacerlo a través de la Consola de administración de AWS y no es necesario configurar el panel de control que requiere Kubernetes.
Sin embargo, ECS también tiene un alto nivel de dependencia del proveedor, lo que le impide migrar una aplicación en contenedores a cualquier otro proveedor o plataforma. Por el contrario, Kubernetes es una solución de código abierto que permite mover contenedores a otros lugares, incluso a proveedores híbridos y de múltiples nubes.
Sin embargo, AWS lanza regularmente nuevos productos de interés para los científicos de datos. Por ejemplo, en 2018, la empresa lanzó un mercado de aprendizaje automático que contiene más de 150 nuevos modelos y algoritmos para hacer pruebas. También puede encontrar desgloses detallados de los productos de AWS que podrían respaldar sus proyectos de ciencia de datos.
Si ya utiliza muchos productos ofrecidos por AWS o planea hacerlo pronto, elegir ECS podría tener más sentido que optar por Kubernetes. De lo contrario, puede encontrar que ECS es demasiado restrictivo.
Se puede disponer fácilmente de los tutoriales de Kubernetes centrados en la ciencia de datos
Es fácil para los científicos de datos encontrar información general sobre el uso de ECS, pero los detalles específicos sobre cómo usar ECS en el trabajo no son tan habituales. Esta realidad puede suponer que las personas dediquen más tiempo del esperado a aprender a aplicar ECS a proyectos de ciencia de datos, particularmente en las primeras etapas de su uso.
Aunque algunos cursos para científicos de datos explican cómo usar ECS, el contenido a menudo abarca solo módulos individuales con clases que abordan una variedad más amplia de temas de ciencia de datos dentro del plan de estudios.
Por otro lado, puede encontrar fácilmente explicaciones de Kubernetes dirigidas a científicos de datos. Esto hace que sea más fácil imaginar por qué es posible que quiera utilizarlo en lugar de otros servicios. De manera similar, los creadores de contenido dan ejemplos de la vida real de cómo aplicar Kubernetes a proyectos de ciencia de datos, así como predecir las tasas de abandono de los clientes.
Los costes de ECS pueden ser más evidentes
Algunos científicos de datos pueden querer trabajar con ECS o Kubernetes cuando son ellos mismos los que pagan los costes en lugar de depender de un empleador. En tales casos, calcular los gastos asociados con ECS puede presentar menos desafíos porque AWS ofrece calculadoras de precios para evitar sorpresas.
También hay niveles gratuitos asociados con los productos de AWS. Eso parece algo bueno al principio. Sin embargo, los usuarios informan haber recibido facturas elevadas después de que expirara su el el periodo de elegibilidad para servicios gratuitos sin que se dieran cuenta.
La razón principal por la que el cálculo de precios con Kubernetes no es tan simple es la creciente red de proveedores de servicios certificados que pueden ayudar a las personas a comenzar a usar Kubernetes. Algunas de esas entidades también ofrecen productos con compatibilidad integrada con Kubernetes.
That means the prices you pay for using Kubernetes through those providers will vary. The ideal approach is to create a list of products or companies that interest you and offer Kubernetes support. Then, take the time to research their pricing structures and see which ones seem most appropriate for your budget and the extent of data science work you want to do with Kubernetes.
Eso significa que los precios que paga por usar Kubernetes a través de esos proveedores variarán. El enfoque ideal es crear una lista de productos o empresas que le interesen y que ofrezcan soporte de Kubernetes. Luego, tómese el tiempo para investigar las estructuras de precios y ver cuáles parecen las más apropiadas a su presupuesto y el alcance del trabajo de ciencia de datos que desea hacer con Kubernetes.
No existe la opción universalmente adecuada
Esta descripción general muestra por qué los científicos de datos no deben tomar decisiones apresuradas al elegir entre Kubernetes y ECS. Ambos tienen pros y contras que, en última instancia, podrían afectar a los proyectos de ciencia de datos.
However, allowing enough time to learn about each solution is a smart move. Consider any projects in your pipeline that may apply to your use of a containerization solution. Then, review each product's features and determine which ones are most relevant to your situation and expectations. Scrutinizing each option this way will lead to well-informed decisions.
Sin embargo, destinar el tiempo suficiente para aprender sobre cada solución es una decisión inteligente. Considere cualquier proyecto en su cartera que pueda aplicarse a su uso de una solución de uso de contenedores. Luego, revise las características de cada producto y determine cuáles son más relevantes para su situación y expectativas. Examinar cada opción de esta manera conducirá a decisiones bien informadas.
Bio: Devin Partida escribe sobre big data y tecnología, es además el editor jefe de ReHack.com.
Enlaces relacionados:

Comentarios
Publicar un comentario