Ich werde eine Echtzeit-Datalakehouse-Pipeline aufbauen

Einige Informationen wurden automatisch übersetzt.

Sri Lanka

Ich spreche Singhalesische Sprache, Englisch

Python-Entwickler, FastAPI, Web Scraping, AI-Automatisierung, Data Engineering

Ich bin ein Data Engineer mit über 3 Jahren Branchenerfahrung in der Entwicklung von RESTful APIs, Web-Scraping-Systemen und KI-gestützten Anwendungen. Ich spezialisiere mich auf FastAPI, Streamlit un...
Über diesen Service

Möchtest du eine Echtzeit-Datenpipeline erstellen, die dein Data Warehouse immer aktuell hält, ohne manuelle ETL-Jobs?


Ich entwerfe und liefere eine vollständig automatisierte, End-to-End-Datalakehouse-Pipeline, die jede Änderung in deiner Datenbank sofort erfasst, durch Kafka streamt und als abfragbare Delta Lake-Tabellen speichert, alles gesteuert und überwacht von Apache Airflow.

Was du bekommst:


  • Live CDC von deiner MySQL-Datenbank (keine Ausfallzeiten, keine manuellen Exporte)
  • Skalierbare Stream-Verarbeitung mit Apache Spark
  • S3-kompatibler Delta Lake-Speicher (MinIO), Abfrage mit Trino oder Spark SQL
  • Airflow DAG für automatische Gesundheitschecks und Pipeline-Überwachung
  • Vollständig Dockerisiert, läuft auf deinem Server oder Cloud-VM
  • Einrichtungsanleitung und Dokumentation inklusive


Perfekt für Startups, Daten-Teams und Unternehmen, die zuverlässige, Echtzeit-Datenverfügbarkeit ohne komplexe Infrastruktur von Grund auf benötigen.

Zielplattform:

Databricks Lakehouse

PostgreSQL

mySQL

Apache Hive

Tools und Plattformen:

Airbyte

Kafka Connect

Debezium

Apache NiFi

Mein Portfolio