Ich prüfe deine rag vector search leistung und optimiere sie


Über diesen Service
Automatische Übersetzung
Dein RAG ist in Produktion, liefert aber schlechte Ergebnisse. Die Latenz ist langsam. Die Kosten steigen. Halluzinationen schleichen sich ein. Klingt bekannt?
Ich prüfe und behebe RAG-Pipelines, die auf dem Papier richtig aussehen, aber in der Praxis versagen. Über 10 Jahre Erfahrung im Backend-Bereich, aktuell leite ich die AI-Suchmigration für einen der größten Einzelhändler Lateinamerikas (über 50K Produkte, 1M+ tägliche Nutzer).
Was ich prüfe:
- Embedding-Modell passend für dein Gebiet
- - Chunking-Strategie und Überlappung
- - Retrieval-Recall und Präzision (mit Eval-Set)
- - Effektivität beim Reranking
- - Hybride Suchgewichte (Keyword vs. semantisch)
- - Latenz pro Stage und Kosten pro Anfrage
- - Halluzinationsmuster
Was du bekommst:
- Schriftlicher Diagnosbericht mit priorisierten Fixes
- - Code-Änderungen für die wichtigsten Probleme (Standard / Premium)
- - Eval-Set, damit du den Fortschritt messen kannst
- - Monitoring-Setup (Premium)
Stack: Python, OpenAI, Anthropic, Pinecone, Weaviate, Qdrant, pgvector, LangChain.
Sende mir dein Stack und eine Beispielanfrage, die fehlschlägt. Ich sage dir, was wahrscheinlich kaputt ist, bevor du zahlst.
Lerne Martin Poli kennen
Senior RAG and AI Search Engineer for Backend at Scale
- AusUruguay
- Mitglied seitMärz 2020
Sprachen
Englisch
Automatische Übersetzung
Mein Portfolio
FAQ
Automatische Übersetzung
Benötigen Sie Zugriff auf meine Codebasis?
Bei nur Audit (Basic) nein, ich arbeite anhand deiner Beschreibung und Beispielanfragen. Für Implementierung (Standard/Premium) ja, mit Lesezugriff auf das Repo und einer Testumgebung.

