Ich erstelle individuelle LLM und SLM mit QLoRA

Einige Informationen wurden automatisch übersetzt.

Bangladesch

Ich spreche Englisch, Russisch

194 Aufträge abgeschlossen

KI-Ingenieur und Full-Stack-Entwickler: Experte für skalierbare KI-Lösungen!

Erfahrener KI-Ingenieur und Full-Stack-Entwickler mit über 7 Jahren Erfahrung im Erstellen intelligenter, skalierbarer und effizienter Lösungen. Ich bin spezialisiert auf KI-gestützte Anwendungen mit ...

Über diesen Service

Feinabstimmung eines benutzerdefinierten LLMs, das DEINEN Bereich kennt, nicht das ganze Internet.

Ich bin Raihan, ein KI/ML-Ingenieur & CTO bei ClarioScope AI. Ich trainiere kleine Sprachmodelle von Grund auf (ORCH 350M3B, MedLLM, ILMA Lang) und fine-tune offene LLMs mit QLoRA auf deine echten Daten.

Was du bekommst: Feinabgestimmtes LLM/SLM auf deinem Datensatz Llama, Mistral, Qwen, Gemma, Phi LoRA / QLoRA / Full Fine-Tune (ich wähle, was zu deinen Daten & Budget passt) Datenbereinigung, Formatierung + synthetische Datengenerierung Evaluationsbericht im Vergleich zum Basismodell (Perplexity, Genauigkeit) Inferenzbereit: Hugging Face, GGUF für Ollama oder API-Endpunkt Sauberer PyTorch-Code + Dokumentation

Warum ich, nicht ein 90-Dollar-Gig? Die meisten „Fine-Tuning“-Gigs sind nur Wraps um die OpenAI API. Ich baue echte SLMs von Grund auf, wähle das richtige Basismodell & LoRA-Rang und liefere ein Modell, das das Basismodell tatsächlich schlägt. Portfolio: raihan-js.github.io

️Prozess: Kostenloses Scoping-Chat, Datenvorbereitung, Training, Evaluation im Vergleich zum Basismodell, Übergabe.

Deine Daten bleiben privat. Vollständige Gewichte + kommerzielle Nutzungsrechte verfügbar.

Schreib mir zuerst dein Anwendungsfall, um ein genaues Angebot zu erhalten. Lass uns das richtig bauen!

Vollbild

Präsentation anzeigen

Programmiersprache:

Python

•

JavaScript

•

Pytorch

•

TypeScript

+1 mehr

KI-Modell-Frameworks & -Tools:

Hugging Face Transformers

+2 mehr

Datentyp:

Text

•

Audio

•

Tabellarische Daten

KI-Engine:

GPT

•

DALL-E

•

Stable Diffusion

•

tensorflow

•

Bloom

•

MUM

•

RoBERTa

+7 mehr

Kunden, mit denen ich zusammengearbeitet habe

GNatural Products

All Natural Skincare

I designed and developed Full WordPress Website for this client.

Okt. 2020

Mein Portfolio

Meine weiteren Dienstleistungen im Bereich Datenwissenschaft & ML

Natural Language Processing
Ab 190 $

FAQ

Automatische Übersetzung

Trainierst du Modelle von Grund auf oder nur Feinabstimmung bestehender?

Beides. Ich habe die ORCH-Serie (350M–3B) und MedLLM von Grund auf trainiert, und ich fine-tune offene LLMs täglich. Für die meisten Anwendungsfälle liefert QLoRA-Feinabstimmung eines starken Basismodells (Llama 3.1, Mistral, Qwen) 80–90 % des Nutzens bei einem Bruchteil der Kosten — ich empfehle ehrlich basierend auf deinen Daten.

Welche Basismodelle kannst du feinabstimmen?

Alle großen Open-Source-LLMs: Llama 3.1/3.2 (1B–13B), Mistral 7B / Mixtral, Qwen 2.5, Gemma 2, Phi-3, DeepSeek, und Code Llama / Code Qwen. Ich kann auch OpenAI (GPT-4o-mini, GPT-4.1) und Gemini über deren Tuning-APIs feinabstimmen.

Wie viel Trainingsdaten brauche ich?

Für LoRA/QLoRA reichen oft 500 hochwertige Beispiele aus; 2000–10.000 sind der ideale Bereich. Weniger? Ich generiere synthetische Daten für dich (Standard & Premium). Das Training eines kleinen Modells von Grund auf braucht eine große Datenmenge — wir klären das im Scoping-Call.

Welche Hardware wird verwendet und wer bezahlt für die Rechenleistung?

Ich nutze Runpod / Vast.ai (A100 / H100 GPUs). Die Rechenkosten für Standardläufe sind in allen Paketen enthalten. Für sehr große Datensätze oder langes Pre-Training können GPU-Kosten als kleine Zusatzkosten anfallen — immer vorher vereinbart (typischerweise 20–120 USD).

Bleiben meine Daten und das trainierte Modell privat?

Ja. Deine Daten werden nur für dein Projekt verwendet und niemals wiederverwendet. Du erhältst die vollständigen Gewichte, den Code und die Rechte zur kommerziellen Nutzung (inklusive im Premium-Paket; +180 USD bei Basic/Standard).

Kannst du das Modell so bereitstellen, dass meine App es per API aufrufen kann?

Ja — Premium beinhaltet einen FastAPI + Docker-Container mit einem OpenAI-kompatiblen Endpoint, sodass dein bestehender Code einfach die Basis-URL austauscht. Standard-Kunden können die Bereitstellung für +250 USD hinzufügen.

Was ist der Unterschied zwischen Feinabstimmung und RAG?

Feinabstimmung verändert das Verhalten und Wissen des Modells in seinen Gewichten. RAG ruft Antworten aus deinen Dokumenten bei der Abfrage ab. Brauchst du RAG stattdessen? Ich biete das als separates Gig an — oder schreib mir, und ich sage dir, welches wirklich zu deinem Ziel passt.

Warum solltest du mich für günstigeres Fine-Tuning engagieren?

Die meisten günstigen Gigs sind nur dünne Wrapper um die OpenAI API. Ich bin CTO und trainiere echte SLMs von Grund auf (Portfolio: raihan-js.github.io) — deshalb sage ich dir, wann Fine-Tuning die falsche Lösung ist, wähle das richtige Basismodell und die LoRA-Konfiguration und liefere ein Modell, das messbar das Basismodell übertrifft.

Soll es kreativ werden?

Suchst du technische Experten?

Bist du bereit, Verbraucher zu erreichen und zu konvertieren?

Suchst du nach Autoren?

Sorge für einen smarteren Geschäftsbetrieb

Ich erstelle individuelle LLM und SLM mit QLoRA

Über diesen Service

Kunden, mit denen ich zusammengearbeitet habe

Mein Portfolio

Meine weiteren Dienstleistungen im Bereich Datenwissenschaft & ML

FAQ

Verwandte Tags