Ich finetune llms und baue rag pipelines für deine ai app


Über diesen Service
Automatische Übersetzung
Bau gerade eine AI-Anwendung, die ein maßgeschneidertes Sprachmodell oder einen wissensbasierten Chatbot braucht? Du bist hier genau richtig. Ich bin Yash, ein ML-Ingenieur mit über 6 Jahren Erfahrung und praktischer Arbeit an Produktions-LLMs bei Fidelity National Financial, wo ich LayoutLMv3 (einen multimodalen Transformer/LLM) für Dokumentenintelligenz auf echten Unternehmensdaten feinabgestimmt habe.
Was ich für dich bauen werde:
- Open-Source-LLMs (LLaMA 3, Mistral, Falcon, BERT, LayoutLM) auf deinem eigenen Datensatz mit LoRA / QLoRA / Vollfinetuning anpassen
- RAG-Pipelines, die dein LLM mit deiner Wissensdatenbank über Vektordatenbanken (Pinecone, ChromaDB, FAISS, Weaviate) verbinden
- Maßgeschneiderte Chatbots, die Fragen aus deinen Dokumenten, PDFs, Datenbanken oder APIs beantworten
- LLM-Bewertung & Benchmarking zur Messung von Genauigkeit, Halluzinationsrate und Latenz
- Prompt-Engineering & System-Prompt-Optimierung für konsistente, zuverlässige Ausgaben
Warum mich einstellen?
- Erfahrung in der Feinabstimmung von echten Enterprise-LLMs in der Produktion (nicht nur Tutorials)
- IIT Kharagpur Dual Degree (B.Tech + M.Tech)
- Sauberer, dokumentierter, produktionsbereiter Code in Python
- Azure-Deployment-Erfahrung für skalierbare Inferenz
Lerne Yash Bhardwaj kennen
I build GenAI apps, LLM pipelines and NLP systems that ship to production
- AusIndien
- Mitglied seitApr. 2026
- ⌀ Antwortzeit1 Stunde
Sprachen
Hindi, Englisch
Automatische Übersetzung
FAQ
Automatische Übersetzung
Brauche ich, dass meine Daten gelabelt werden?
Für Feinabstimmung ja — ich kann dir auch beim Strukturieren und Annotieren deines Datensatzes als Zusatz helfen. Für RAG funktionieren Rohdokumente (PDF, TXT, DOCX) perfekt.
Mit welchen LLMs arbeitest du?
Open-Source-Modelle — LLaMA 3, Mistral, Phi-3, BERT und die LayoutLM-Familie — feinabgestimmt mit LoRA/QLoRA über HuggingFace. Ich unterstütze auch OpenAI's Feinabstimmungs-API für GPT-basierte Modelle.
Kannst du das Modell auch deployen?
Ja — ich deploye auf jeder Cloud-Plattform: AWS SageMaker, Google Cloud Vertex AI, Azure ML oder Hugging Face Spaces. Ich baue auch FastAPI-Inferenzendpunkte, die in Docker verpackt sind und überall deploybar sind. Für mobile/Edge-Anwendungen unterstütze ich TensorFlow Lite und ONNX-Export. Das Deployment beinhaltet eine funktionierende API.

