Programa del Curso

Revisión de Apache Airflow Conceptos básicos

  • Conceptos básicos: DAG, tareas y operadores
  • Arquitectura y componentes del flujo de aire
  • Resumen de casos de uso y flujos de trabajo comunes

Optimización del rendimiento del flujo de trabajo

  • Identificación de cuellos de botella en las tuberías de flujo de aire
  • Técnicas de optimización a nivel de tarea
  • Aprovechar los reintentos de tareas, el paralelismo y la simultaneidad

Administración de dependencias complejas

  • Definición de dependencias dinámicas en flujos de trabajo
  • Control de flujos de trabajo condicionales y de bifurcación
  • Uso eficaz de grupos de tareas y sub-DAG

Funciones avanzadas en Apache Airflow

  • Creación de operadores y enlaces personalizados
  • Implementación de sensores para disparadores externos
  • Integración de servicios y plugins de terceros

Escalado Apache Airflow Despliegues

  • Enfoques de escalado horizontal y vertical
  • Uso de ejecutores de apio para la ejecución distribuida
  • Prácticas recomendadas para escalar en entornos de nube

Flujos de trabajo de supervisión y depuración

  • Configuración del registro y las alertas para la supervisión del flujo de trabajo
  • Uso de la interfaz de usuario y la CLI de Airflow para solucionar problemas
  • Identificación y resolución de problemas comunes en las implementaciones de Airflow

Aseguramiento Apache Airflow

  • Autenticación y control de acceso en Airflow
  • Protección de datos confidenciales y configuraciones de entorno
  • Implementación de registros de auditoría para flujos de trabajo

Enterprise Use Cases y Mejores Prácticas

  • Diseño de flujos de trabajo sólidos para entornos de producción
  • Aprovechamiento de Airflow para la ingeniería de datos y las canalizaciones ETL
  • Exploración de estudios de casos del mundo real de implementaciones escalables de Airflow

Resumen y próximos pasos

Requerimientos

  • Conocimientos básicos de Apache Airflow
  • Familiaridad con los conceptos de programación y orquestación de flujos de trabajo Python
  • Experiencia en la gestión e implementación de aplicaciones en entornos Linux

Audiencia

  • Ingenieros de datos
  • DevOps Profesionales
  • Desarrolladores de software
 21 Horas

Número de participantes


Precio por Participante​

Testimonios (1)

Próximos cursos

Categorías Relacionadas