Ich erstelle individuelle LLM und SLM mit QLoRA
KI-Ingenieur und Full-Stack-Entwickler: Experte für skalierbare KI-Lösungen!
Über diesen Service
Feinabstimmung eines benutzerdefinierten LLMs, das DEINEN Bereich kennt, nicht das ganze Internet.
Ich bin Raihan, ein KI/ML-Ingenieur & CTO bei ClarioScope AI. Ich trainiere kleine Sprachmodelle von Grund auf (ORCH 350M3B, MedLLM, ILMA Lang) und fine-tune offene LLMs mit QLoRA auf deine echten Daten.
Was du bekommst: Feinabgestimmtes LLM/SLM auf deinem Datensatz Llama, Mistral, Qwen, Gemma, Phi LoRA / QLoRA / Full Fine-Tune (ich wähle, was zu deinen Daten & Budget passt) Datenbereinigung, Formatierung + synthetische Datengenerierung Evaluationsbericht im Vergleich zum Basismodell (Perplexity, Genauigkeit) Inferenzbereit: Hugging Face, GGUF für Ollama oder API-Endpunkt Sauberer PyTorch-Code + Dokumentation
Warum ich, nicht ein 90-Dollar-Gig? Die meisten „Fine-Tuning“-Gigs sind nur Wraps um die OpenAI API. Ich baue echte SLMs von Grund auf, wähle das richtige Basismodell & LoRA-Rang und liefere ein Modell, das das Basismodell tatsächlich schlägt. Portfolio: raihan-js.github.io
️Prozess: Kostenloses Scoping-Chat, Datenvorbereitung, Training, Evaluation im Vergleich zum Basismodell, Übergabe.
Deine Daten bleiben privat. Vollständige Gewichte + kommerzielle Nutzungsrechte verfügbar.
Schreib mir zuerst dein Anwendungsfall, um ein genaues Angebot zu erhalten. Lass uns das richtig bauen!
Kunden, mit denen ich zusammengearbeitet habe
GNatural Products
All Natural Skincare
I designed and developed Full WordPress Website for this client.
Okt. 2020
Mein Portfolio
Meine weiteren Dienstleistungen im Bereich Datenwissenschaft & ML
FAQ
Automatische Übersetzung
Trainierst du Modelle von Grund auf oder nur Feinabstimmung bestehender?
Beides. Ich habe die ORCH-Serie (350M–3B) und MedLLM von Grund auf trainiert, und ich fine-tune offene LLMs täglich. Für die meisten Anwendungsfälle liefert QLoRA-Feinabstimmung eines starken Basismodells (Llama 3.1, Mistral, Qwen) 80–90 % des Nutzens bei einem Bruchteil der Kosten — ich empfehle ehrlich basierend auf deinen Daten.
Welche Basismodelle kannst du feinabstimmen?
Alle großen Open-Source-LLMs: Llama 3.1/3.2 (1B–13B), Mistral 7B / Mixtral, Qwen 2.5, Gemma 2, Phi-3, DeepSeek, und Code Llama / Code Qwen. Ich kann auch OpenAI (GPT-4o-mini, GPT-4.1) und Gemini über deren Tuning-APIs feinabstimmen.
Wie viel Trainingsdaten brauche ich?
Für LoRA/QLoRA reichen oft 500 hochwertige Beispiele aus; 2000–10.000 sind der ideale Bereich. Weniger? Ich generiere synthetische Daten für dich (Standard & Premium). Das Training eines kleinen Modells von Grund auf braucht eine große Datenmenge — wir klären das im Scoping-Call.
Welche Hardware wird verwendet und wer bezahlt für die Rechenleistung?
Ich nutze Runpod / Vast.ai (A100 / H100 GPUs). Die Rechenkosten für Standardläufe sind in allen Paketen enthalten. Für sehr große Datensätze oder langes Pre-Training können GPU-Kosten als kleine Zusatzkosten anfallen — immer vorher vereinbart (typischerweise 20–120 USD).
Bleiben meine Daten und das trainierte Modell privat?
Ja. Deine Daten werden nur für dein Projekt verwendet und niemals wiederverwendet. Du erhältst die vollständigen Gewichte, den Code und die Rechte zur kommerziellen Nutzung (inklusive im Premium-Paket; +180 USD bei Basic/Standard).
Kannst du das Modell so bereitstellen, dass meine App es per API aufrufen kann?
Ja — Premium beinhaltet einen FastAPI + Docker-Container mit einem OpenAI-kompatiblen Endpoint, sodass dein bestehender Code einfach die Basis-URL austauscht. Standard-Kunden können die Bereitstellung für +250 USD hinzufügen.
Was ist der Unterschied zwischen Feinabstimmung und RAG?
Feinabstimmung verändert das Verhalten und Wissen des Modells in seinen Gewichten. RAG ruft Antworten aus deinen Dokumenten bei der Abfrage ab. Brauchst du RAG stattdessen? Ich biete das als separates Gig an — oder schreib mir, und ich sage dir, welches wirklich zu deinem Ziel passt.
Warum solltest du mich für günstigeres Fine-Tuning engagieren?
Die meisten günstigen Gigs sind nur dünne Wrapper um die OpenAI API. Ich bin CTO und trainiere echte SLMs von Grund auf (Portfolio: raihan-js.github.io) — deshalb sage ich dir, wann Fine-Tuning die falsche Lösung ist, wähle das richtige Basismodell und die LoRA-Konfiguration und liefere ein Modell, das messbar das Basismodell übertrifft.

