Ich entwerfe und implementiere skalierbare Microsoft Fabric Datenplattformlösungen, die maßgeschneidert sind

Einige Informationen wurden automatisch übersetzt.

Indien

Ich spreche Englisch

Leitender Dateningenieur

Ich bin ein Senior Data Engineer bei Arif Pasha Company mit mehreren Jahren Erfahrung in der Entwicklung, dem Aufbau und der Optimierung großer Datenplattformen. Mein Fokus liegt auf der Entwicklung z...
Über diesen Service


  • Arbeiten an der Konfiguration der Datenaufnahme mit Apache SQOOP und FLUME in das Ziel-HDFS.
  • Gute Erfahrung mit Hadoop-2.0 Version und Cloudera Manager CDH3.
  • Erfahrung mit AWS Cloud-Implementierung auf EC2, EMR, S3 und anderen Diensten, Spark SQL mit MySQL (JDBC) Quelle, PySpark RDD Aktionen & Transformationen und Dataframe API.
  • Spark-Architektur und Komponenten: Spark Core & PySpark SQL mit Dataframes, Big Data Technologien: Hadoop (CDH Distribution), MapReduce Framework & Spark-Ökosystem.
  • Hadoop High-Level-Sprachen: Hive 0.8.0. Datenanalyse mit Spark Core & Spark SQL & Spark Streaming.
  • Abwicklung von Datenanalyseprojekten mit Hadoop-basierten Tools und dem Python Data Science Stack. Interaktion mit Kunden, Bearbeitung ihrer Anfragen und Lösung von Problemen.
  • Kenntnisse im End-to-End-Projektworkflow.

Zielplattform:

Snowflake

Google BigQuery

Amazon Redshift

Tools und Plattformen:

Fivetran

Airbyte

Google Cloud Dataflow

Mein Portfolio

Verwandte Tags