Ich werde eine dockerisierte Big Data Pipeline mit Spark und Hadoop aufbauen

Einige Informationen wurden automatisch übersetzt.

Tschechien

Ich spreche Englisch, Tschechisch

14 Aufträge abgeschlossen

DOTNET, C sharp, ETL Pipelines

Über 4 Jahre Erfahrung im Bereich Fintech mit .NET / C# (insgesamt über 6 Jahre). Ich entwickle und pflege geschäftskritische Systeme für die Infrastruktur im Investmentbanking. Ich kann dir folgende...
Über diesen Service

Ich richte eine vollständig Dockerisierte Big Data Pipeline mit Apache Spark und Hadoop ein, bereit für Echtzeit-Datenverarbeitung oder Batch-ETL-Workflows – ideal für lokale und Cloud-Deployments.


Was enthalten ist (basierend auf deinem gewählten Paket):


  • Docker Compose Setup für Spark + Hadoop
  • Vorgefertigter Beispiel-Spark-Job
  • Integrierter HDFS-Ausgang
  • Sauberer, modularer Code mit Kommentaren
  • Schritt-für-Schritt-Anleitung für lokale oder Cloud-Nutzung


Anwendungsfälle:


  • IoT-Sensordatenaufnahme und -transformation
  • Analyse von Finanztransaktionen
  • Batch-Verarbeitung großer CSV/JSON-Datensätze
  • Zeitreihen-Pipeline zu HDFS für Langzeitspeicherung
  • Optionale GPT-KI-Erweiterung mit OpenAI API für Zusammenfassung oder Tagging


Perfekt für Entwickler, Startups oder Teams, die eine schnelle Lösung für skalierbare Dateninfrastruktur brauchen.


Benötigst du Extras wie eine REST API, OpenAI-Integration, Monitoring (Grafana/Prometheus) oder AWS EC2-Deployment? Sag einfach Bescheid!


Bitte beachten :


  • Lieferumfang hängt vom gewählten Paket ab
  • Maßgeschneiderte Angebote sind möglich – schreib mir einfach!
  • Enthalten sind 2 Nachfassnachrichten zur Klärung nach der Lieferung
  • Du bist verantwortlich für Tests und Betrieb in deiner eigenen Umgebung
  • Die Nutzung von OpenAI erfordert deinen eigenen API-Schlüssel

Zielplattform:

PostgreSQL

mySQL

Apache Hive

Amazon S3

Andere

Tools und Plattformen:

Kafka Connect

Apache NiFi

Andere

Mein Portfolio