Q:
¿Qué es mejor, una plataforma o un algoritmo de aprendizaje automático para traer su propio AWS?
UN:En la actualidad, muchas empresas integran soluciones de aprendizaje automático en su conjunto de herramientas de análisis para mejorar la gestión de la marca, mejorar la experiencia del cliente y aumentar la eficiencia operativa. Los modelos de aprendizaje automático son el componente central de las soluciones de aprendizaje automático. Los modelos se entrenan utilizando algoritmos matemáticos y grandes conjuntos de datos para hacer predicciones confiables. Dos ejemplos comunes de predicciones son: (1) determinar si un conjunto de transacciones financieras indica fraude o (2) evaluar el sentimiento del consumidor en torno a un producto, en función de la información recopilada de las redes sociales.
Amazon SageMaker es un servicio totalmente administrado que permite a los desarrolladores y científicos de datos construir, entrenar e implementar modelos de aprendizaje automático. En SageMaker, puede usar algoritmos listos para usar o seguir el camino de traer su propia solución personalizada. Ambas opciones son válidas y sirven igualmente como la base para una solución de aprendizaje automático exitosa.
(Nota del editor: puede ver otras alternativas a SageMaker aquí).
Los algoritmos listos para usar de SageMaker incluyen ejemplos populares y altamente optimizados para clasificación de imágenes, procesamiento de lenguaje natural, etc. La lista completa se puede encontrar aquí .
- Ventajas listas para usar: estos algoritmos se han optimizado previamente (y están experimentando una mejora continua). Puede estar activo, en ejecución y desplegado rápidamente. Además, está disponible el ajuste automático de hiperparámetros de AWS.
- Consideraciones listas para usar: las mejoras continuas mencionadas anteriormente pueden no producir resultados tan predecibles como si tuviera un control completo sobre la implementación de sus algoritmos.
Si estos algoritmos no son adecuados para su proyecto, tiene otras tres opciones: (1) la Biblioteca Apache Spark de Amazon, (2) el código personalizado de Python (que usa TensorFLow o Apache MXNet) o (3) “traiga el suyo” donde esencialmente no tienen restricciones, pero necesitarán crear una imagen de Docker para entrenar y servir su modelo (puede hacerlo usando las instrucciones aquí ).
El enfoque de traer su propio le ofrece total libertad. Esto puede resultar atractivo para los científicos de datos que ya han creado una biblioteca de código algorítmico personalizado y / o patentado que puede no estar representado en el conjunto actual listo para usar.
- Ventajas de Bring-Your-Own: permite un control completo sobre toda la tubería de ciencia de datos junto con el uso de IP patentada.
- Consideraciones propias: se requiere dockerización para entrenar y servir el modelo resultante. Incorporar mejoras algorítmicas es su responsabilidad.
Independientemente de su elección de algoritmo, SageMaker en AWS es un enfoque que vale la pena considerar, dada la cantidad de enfoque que se ha puesto en la facilidad de uso desde una perspectiva de ciencia de datos. Si alguna vez ha intentado migrar un proyecto de aprendizaje automático de su entorno local a uno alojado, se sorprenderá gratamente de lo perfecto que es SageMaker. Y si está comenzando desde cero, ya está varios pasos más cerca de su objetivo, dado cuánto ya está al alcance de su mano.