Suprema Corte de Justicia de la NaciónData Engineer
Nov. 2019 - Jan. 2023Ciudad de México y alrededores, México1. Creación de procesos ETL de diferentes fuentes de datos (BD's, REST WS, File Systems, etc) con Python.
2. Creación de pipelines y procesamiento de datos con Apache Spark, Apache Airflow, Logstash en tiempo casi real (NRT).
3. Carga de datos a un Data Lake (HDFS).
4. Indexación de información a Elasticsearch y SolrCloud.
5. Creación de pipelines con el Elastic Stack (Beats, Logstash, Elasticsearch, Kibana).
6. Diseño de API REST para la interoperabilidad de datos con aplicaciones.
7. Data Governance conforme a la guía de referencia DAMA-DMBOK.