Ich richte eine selbst gehostete Event-Analytics-Pipeline mit Raw Data Load in BigQuery ein
Data Engineer und Analytics Engineer
Über diesen Service
Wenn du die Kontrolle über deine Analytics-Daten haben möchtest, ohne vollständig auf Drittanbieter-Tracking-Plattformen angewiesen zu sein, kann ich für dich eine selbst gehostete Event-Pipeline aufsetzen.
Dieses Projekt ist für Teams gedacht, die eine saubere, praktische Analytics-Basis wollen:
- benutzerdefiniertes Event-Tracking
- Raw Data Ownership
- portabler Speicher
- BigQuery-kompatible Abfragen
- Unterstützung für Web, Backend, App oder Spiele
Was ich liefern werde
- Bereitstellung einer Event-Ingestion-API
- API-Schlüssel-basiertes Event-Sammeln
- Event-Pufferung durch NATS JetStream
- Raw Event Storage als partitionierte Parquet-Dateien in Google Cloud Storage
- Einrichtung einer BigQuery-External-Table für Abfragen der Rohdaten
- Konfiguration für dein erstes Event-Producer-Setup
- Open-Source-Version von Metabase (optional)
Typische Anwendungsfälle
- Produkt-Analytics für Web/Mobile Apps, Browser-Erweiterungen
- Benutzerdefiniertes Backend-Event-Tracking-System
- Raw Event Foundation vor Dashboards oder BI
- Game-Analytics
Wichtiger Scope-Hinweis
Dieses Projekt richtet die Event-Ingestion und die Raw-Analytics-Backbone ein.
Es beinhaltet nicht:
- ein fertiges Analytics-Dashboard
- fortgeschrittene BI-Implementierung
- eine vollständige Produkt-Analytics-UI
Projektanforderungen
- Subdomain
- GCP-Projekt, VM, die ich beim Setup unterstütze
Zielplattform:
Google BigQuery
•
Google Cloud Storage
Tools und Plattformen:
Andere
FAQ
Automatische Übersetzung
Was ist DataQuery (aktuelles Projektangebot)?
DataQueryEvent ist eine selbst gehostete Event-Tracking-, Ingestion- und Raw-Storage-Pipeline für Produkt-, Anwendungs- und Spiel-Analytics. Es ist ein Open-Source-Projekt, das von mir entwickelt und gepflegt wird.
Ist DataQuery eine SaaS-Analytics-Plattform?
Nein. DataQuery ist eine selbst gehostete Analytics-Pipeline, die in deine Infrastruktur deployed wird.
Wer hostet das System?
Du bist es. Das standardmäßige Setup nutzt deine eigene VM und Google Cloud-Dienste, wo nötig.
Was passiert, wenn das Event-Volumen wächst?
Das Standard-Setup beginnt einfach, meist auf einer VM, und kann später skaliert werden, wenn dein Traffic steigt. Cloud-VMs sind leicht skalierbar, die Rechenleistung kann meist durch eine Aktualisierung der Einstellungen in der Oberfläche erhöht werden.
Wo werden Raw Data gespeichert?
Raw Events werden in der Blob-Storage im Parquet-Format geschrieben (standardmäßig Google Cloud Storage).
Welche Produkte können das nutzen?
Web-Apps, Websites, Mobile Apps, Chrome-Erweiterungen, Spiele und Backend-Services.
Besitze ich die Daten?
Ja. Das System ist auf Raw Data Ownership und Portabilität ausgelegt.
Kannst du beim Definieren des Event-Schemas helfen?
Ja. Ich kann dir helfen, Event-Namen, Parameter und Producer-Grenzen zu strukturieren.
Enthält das Dashboards?
Nein, dieses Projekt konzentriert sich auf Ingestion und Raw-Analytics-Infrastruktur, aber ich kann eine Open-Source-Version von Metabase für deine BI-Bedürfnisse bereitstellen. Dashboards-Entwicklung kann separat hinzugefügt werden.
