Ich baue eine rag-Pipeline auf AWS Bedrock für deine Dokumente und Daten


Über diesen Service
Automatische Übersetzung
RAG ist einfach zu demonstrieren, aber schwer in die Produktion zu bringen. Die meisten "Chat mit deinen Dokumenten"-Projekte zerfallen, sobald echte Nutzer sie verwenden. Retrieval liefert irrelevante Ausschnitte. Zitate lassen sich nicht auf die Quellen zurückverfolgen. Die Kontextfenster sprengen die Kosten pro Anfrage. Antworten halluzinieren, weil die Retrieval-Schicht nie richtig abgestimmt wurde. Die Demo funktionierte. In der Produktion nicht.
Ich baue RAG so, wie Backend-Entwickler jedes Produktionssystem bauen. Mit echtem Dokumenten-Chunking, nicht mit Standard-Splittern. Embeddings in pgvector oder OpenSearch mit einer Retrieval-Schicht, die du tatsächlich debuggen kannst. Generierung auf AWS Bedrock mit Claude- oder Titan-Modellen. Zitat-Tracking, damit Antworten auf die Quelle verweisen. Metadaten-Filterung, damit Nutzer nur auf Dokumente zugreifen können, die sie sehen dürfen.
Ich habe praktische Bedrock-Erfahrung aus dem AWS AI and ML Scholars-Programm sowie Backend-Erfahrung aus über 4 Jahren, in denen ich Systeme mit echtem Traffic bereitgestellt habe. Der interessante Teil ist der Retrieval- und Generierungscode. Die Infrastruktur drumherum entscheidet, ob dein RAG in der Produktion wirklich funktioniert.
Schreib mir, was du abfragbar machen möchtest.
Lerne Iloomnex kennen
Senior backend engineer
- AusPakistan
- Mitglied seitNov. 2023
- ⌀ Antwortzeit1 Stunde
- Letzte Lieferung1 Jahr
Sprachen
Englisch
Automatische Übersetzung
Mein Portfolio
FAQ
Automatische Übersetzung
Mit welchen Dokumenten kannst du arbeiten?
PDFs, Word-Dokumente, Markdown, Klartext, HTML und strukturierte Daten wie CSVs oder JSON. Ich habe mit gemischten Dokumentensätzen gearbeitet, darunter technische Dokumentationen, rechtliche Verträge, interne Wissensdatenbanken und Support-Ticket-Archive.
Warum AWS Bedrock statt OpenAI?
Bedrock macht Sinn, wenn du bereits bei AWS bist, Modelle in deinem VPC für die Compliance laufen lassen willst, Zugriff auf mehrere Modellfamilien über eine API brauchst (Anthropic Claude, Amazon Titan, Meta Llama, Cohere und andere) oder eine Unternehmensbeschaffung hast, die AWS bevorzugt.
