Ich entwickle Produktions-RAG-Systeme, die für Latenz, Kosten und Vertrauen ausgelegt sind


Über diesen Service
Automatische Übersetzung
Die meisten RAG-Chatbots sind Demo-Versionen, die im Produktionseinsatz nur gut aussehen, aber beim dritten Nutzerfrage zusammenbrechen. Ich baue die Version, die das nicht tut.
Für Teams, deren Demo (deine, ChatGPT oder die eines Freelancers) zu etwas werden soll, dem Nutzer vertrauen können.
𝗘𝗡𝗚𝗜𝗡𝗘𝗘𝗥𝗧 𝗔𝗚𝗔𝗜𝗡𝗦𝗧 𝗙𝗢𝗨𝗥 𝗕𝗨𝗗𝗚𝗘𝗧𝗦:
Retrieval BM25 + dense + reranker, RAGAS Kontextgenauigkeit >0.75
Latenz unter 800 ms bis zum ersten Token, p95 unter 2,5 s
Kosten typischerweise 0,0008 $ pro Abfrage bei gpt-4o-mini, im Voraus modelliert
Vertrauen, Wahrhaftigkeit >0.85, Quellenangaben, Beobachtbarkeit pro Abfrage
𝗣𝗥𝗢𝗢𝗙, 𝗡𝗢𝗧 𝗣𝗥𝗢𝗠𝗜𝗦𝗘𝗦
Jeder Build wird mit einem Evaluationsbericht gegen DEINE Dokumente und DEINE Q&A-Paare geliefert. Überschreitest du die vereinbarten Schwellenwerte, zahlst du die letzten 30 % nicht. Schriftlich.
𝗖𝗔𝗣𝗔𝗖𝗜𝗧𝗬
Zwei Produktions-Builds pro Monat. Wenn mein Antwort-Badge >24h zeigt, bin ich in dieser Woche voll ausgelastet.
𝗡𝗢𝗧 𝗙𝗢𝗥 𝗬𝗢𝗨 𝗜𝗙
Du suchst nach ChatGPT-Wrappern unter 200 $. Viele davon kannst du gleich buchen.
𝗡𝗘𝗫𝗧 𝗦𝗧𝗘𝗣
Sende eine Problemstellung in einem Absatz, ein Beispiel-Dokument und drei Nutzerfragen. Ich antworte innerhalb von 24h mit einem festen Angebot oder einer Weiterempfehlung.
Lerne Anwar K kennen
AI Software Engineer
- AusPakistan
- Mitglied seitFeb. 2026
- ⌀ Antwortzeit1 Stunde
Sprachen
Englisch
Automatische Übersetzung

