Ich baue eine rag-Pipeline auf AWS Bedrock für deine Dokumente und Daten

I
iloomnex
I
iloomnex
Iloomnex
Einige Informationen wurden automatisch übersetzt.

Über diesen Service

Automatische Übersetzung

RAG ist einfach zu demonstrieren, aber schwer in die Produktion zu bringen. Die meisten "Chat mit deinen Dokumenten"-Projekte zerfallen, sobald echte Nutzer sie verwenden. Retrieval liefert irrelevante Ausschnitte. Zitate lassen sich nicht auf die Quellen zurückverfolgen. Die Kontextfenster sprengen die Kosten pro Anfrage. Antworten halluzinieren, weil die Retrieval-Schicht nie richtig abgestimmt wurde. Die Demo funktionierte. In der Produktion nicht.

Ich baue RAG so, wie Backend-Entwickler jedes Produktionssystem bauen. Mit echtem Dokumenten-Chunking, nicht mit Standard-Splittern. Embeddings in pgvector oder OpenSearch mit einer Retrieval-Schicht, die du tatsächlich debuggen kannst. Generierung auf AWS Bedrock mit Claude- oder Titan-Modellen. Zitat-Tracking, damit Antworten auf die Quelle verweisen. Metadaten-Filterung, damit Nutzer nur auf Dokumente zugreifen können, die sie sehen dürfen.

Ich habe praktische Bedrock-Erfahrung aus dem AWS AI and ML Scholars-Programm sowie Backend-Erfahrung aus über 4 Jahren, in denen ich Systeme mit echtem Traffic bereitgestellt habe. Der interessante Teil ist der Retrieval- und Generierungscode. Die Infrastruktur drumherum entscheidet, ob dein RAG in der Produktion wirklich funktioniert.

Schreib mir, was du abfragbar machen möchtest.

Lerne Iloomnex kennen

Iloomnex

Senior backend engineer

5,0(11)
  • AusPakistan
  • Mitglied seitNov. 2023
  • ⌀ Antwortzeit1 Stunde
  • Letzte Lieferung1 Jahr
  • Sprachen

    Englisch
Senior backend engineer, 4+ years shipping production systems. I build Node.js and NestJS backends on AWS serverless. Lambda, SQS, EventBridge, Step Functions. I handle the integrations most devs avoid: Amazon SP-API, Shopify, QuickBooks, Xero, and LLMs via Bedrock, OpenAI, and Claude. Day job is a multi-tenant HRIS and payroll platform running real traffic. On Fiverr as iLoomNex, I take on backend builds, API integrations, and AI features that need to work in production, not just in a demo. Always online. Reply in under an hour. Any timezone.

Automatische Übersetzung

Mein Portfolio