Ich prüfe deine rag vector search leistung und optimiere sie

V
valhallasoft
V
valhallasoft
Martin Poli
Einige Informationen wurden automatisch übersetzt.

Über diesen Service

Automatische Übersetzung

Dein RAG ist in Produktion, liefert aber schlechte Ergebnisse. Die Latenz ist langsam. Die Kosten steigen. Halluzinationen schleichen sich ein. Klingt bekannt?


Ich prüfe und behebe RAG-Pipelines, die auf dem Papier richtig aussehen, aber in der Praxis versagen. Über 10 Jahre Erfahrung im Backend-Bereich, aktuell leite ich die AI-Suchmigration für einen der größten Einzelhändler Lateinamerikas (über 50K Produkte, 1M+ tägliche Nutzer).


Was ich prüfe:

  • Embedding-Modell passend für dein Gebiet
  • - Chunking-Strategie und Überlappung
  • - Retrieval-Recall und Präzision (mit Eval-Set)
  • - Effektivität beim Reranking
  • - Hybride Suchgewichte (Keyword vs. semantisch)
  • - Latenz pro Stage und Kosten pro Anfrage
  • - Halluzinationsmuster

Was du bekommst:

  • Schriftlicher Diagnosbericht mit priorisierten Fixes
  • - Code-Änderungen für die wichtigsten Probleme (Standard / Premium)
  • - Eval-Set, damit du den Fortschritt messen kannst
  • - Monitoring-Setup (Premium)

Stack: Python, OpenAI, Anthropic, Pinecone, Weaviate, Qdrant, pgvector, LangChain.


Sende mir dein Stack und eine Beispielanfrage, die fehlschlägt. Ich sage dir, was wahrscheinlich kaputt ist, bevor du zahlst.

Lerne Martin Poli kennen

Martin Poli

Senior RAG and AI Search Engineer for Backend at Scale

  • AusUruguay
  • Mitglied seitMärz 2020
  • Sprachen

    Englisch
Senior Platform Engineer with 10+ years building production systems at scale. Currently leading platform infra and AI search for Argentina's largest retail chain (200+ stores, 1M+ users/day), replacing Google Search API with RAG-based semantic search across 50K+ products. What I do best: - RAG, embeddings, OpenAI/Anthropic/Bedrock - Vector DBs: Pinecone, Weaviate, Qdrant, pgvector - Backend at scale: Python, Go, Node.js, PHP 8 - AWS EKS, Karpenter, Terraform, multi-account IaC Have a search problem or an LLM pipeline that won't ship? Send me your stack.

Automatische Übersetzung

Mein Portfolio