Lugar de trabajo: Ciudad de México
Descripción del Puesto
Ingeniero de datos con habilidades intermedias en Databricks , experiencia en la creación y gestión de pipelines de datos utilizando Databricks, así como sólidos conocimientos en Python. Responsable de desarrollar y mantener pipelines de datos eficientes y escalables, así como de colaborar estrechamente con equipos multidisciplinarios para satisfacer las necesidades de análisis de datos de la organización.
Responsabilidades
1. Desarrollar y mantener pipelines de datos utilizando Databricks para la ingestión, transformación y carga de datos desde múltiples fuentes.
2. Colaborar con equipos de ingeniería y análisis de datos para comprender los requisitos y diseñar soluciones efectivas.
3. Optimizar el rendimiento y la eficiencia de los pipelines de datos para garantizar la escalabilidad y la fiabilidad del sistema.
4. Realizar pruebas exhaustivas y depurar problemas para garantizar la integridad y la calidad de los datos.
5. Automatizar tareas repetitivas y mejorar los procesos utilizando herramientas y scripts en Python y SQL.
6. Documentar y mantener la documentación técnica relevante relacionada con los pipelines de datos y los procesos de ETL.
7. Colaborar con otros equipos para desarrollar dashboards/front ends, informes y análisis basados en los datos procesados.
Requisitos