Administración y monitoreo de ecosistema big data (Indispensable cloudera, azure o gcp).
Conocimiento de almacenamiento y procesamiento distribuido Procesamiento de grandes volumenes de información.
Diseño e implementación de flujos de datos sobre datos estructurados y no estructurados.
Ingesta, limpieza, homogeneización e integración de diferentes fuentes de datos.
Diseño y desarrollo de modelos de datos para el manejo de la información.
Interacción en el diseño de arquitecturas Big Data.
Generar mecanismos de control y validación del flujo de datos.
Implementación de scripts con python, pyspark, t-sql, shell scripting.
Conocimiento de gestores de motores de bases de datos estructurados y no estructurados.
Interacción e implementación en la creación de estandares de modelado y control de flujo de datos Automatización de flujos de datos.
Análisis del comportamiento de flujos de datos.
Implementación de soluciones de Big Data para la gestion de datos: Hbase, hive, SparkA lo largo de más de 27 años hemos incursionado y evolucionado en distintas áreas atendiendo en el continente americano a clientes privados, corporativos y sector gobierno.
Contribuimos en la consecución de proyectos de Seguridad Nacional.
Esto ha implicado grandes retos tecnológicos, humanos, de infraestructura y de organización, a los cuales respondemos hoy con grandes áreas de especialización.
Tenemos un estricto proceso de desarrollo de ingeniería y control de calidad, por lo que contamos con procesos y personal certificados por importantes organismos internacionales y nacionales como la norma ISO 9001:2015, ISO 27001:2013, ISO/IEC 20000-1, ITIL, Scrum, PMI y las otorgadas por los fabricantes más importantes del mundo en tecnología de seguridad electrónica.**Requisitos**:SQL.
2 años como minimo Python o Scala.
3 años como minimo.
Diseño de pipelines y streaming: flume, sqoop, kafka, spark-streaming Diseño de servicios publisher subscriber.
2 años como minimo Transformación de datos en ecosistemas big data: python, spark o manejo de datos tradicionales (ETLS, ingestas o modelado) 4 años como minimo.
Manejo de datos no estructurados.
2 años como minimo Conocimiento de Dashboard: kibana,tableau, grafana.
1 años como minimo (opcional) Mantenimiento de ecosistema Big Data, Cloudera.
2 años como minimo.