Kategorien durchsuchen
Entdecken
Fiverr Pro
Deutsch
$
USD
Ich entwerfe private LLM-Bereitstellungen und optimiere VLLM-Inferenz
Luis Ens
Level 2
Über diesen Service
Automatische Übersetzung
Standard-Cloud-LLM-APIs bringen strenge Compliance-Risiken für regulierte Branchen mit sich und verursachen unvorhersehbare Kosten bei Token-Skalierung. Unoptimiertes Hosting von Open-Source-Gewichten (Llama, DeepSeek) vor Ort führt jedoch zu sofortigen CUDA-Out-of-Memory-Abstürzen, hohen Token-Latenzen und einer starken Unterauslastung teurer GPU-Cluster.
Ich entwickle dedizierte, sichere private LLM-Umgebungen, indem ich fortschrittliche Inferenz-Servierungsframeworks und Quantisierungsschichten einsetze, um maximale Durchsatzraten und vollständige Datentrennung zu gewährleisten.
Engineering-Fokus
- Hochdurchsatz-Servierung: Implementierung von vLLM und NVIDIA TensorRT-LLM-Engines unter Verwendung von PagedAttention, um Speicherfragmentierung zu vermeiden und gleichzeitiges Batching zu beschleunigen.
- Model-Quantisierungspipelines: Ausführung von AWQ, GPTQ oder FP8-Compilation, um den physischen VRAM-Fußabdruck um bis zu 75 % zu reduzieren, ohne die semantische Benchmark-Genauigkeit zu beeinträchtigen.
- Hardware-Architektur-Setup: Konfiguration von optimalem Tensor- und Pipeline-Parallelismus in Multi-GPU-Umgebungen (A100, H100, L40S).
- API-Middleware-Schicht: Bereitstellung sicherer, interner OpenAI-kompatibler REST-Endpunkte für eine sofortige Integration in dein bestehendes Anwendungssystem.
Lerne Luis Ens kennen
Luis Ens
Experte fuer KI Automatisierung Software Entwicklung und B2B Akquise
Level 2
- AusDeutschland
- Mitglied seitJuli 2025
- ⌀ Antwortzeit11 Stunden
- Letzte Lieferung3 Tage
Sprachen
Deutsch, Englisch
Als spezialisierter AI Developer & Integration Specialist mit über 3 Jahren Erfahrung in der Softwareentwicklung verwandle ich komplexe KI-Technologien in produktive Business-Lösungen. Mein Fokus liegt auf der Entwicklung, Feinabstimmung und nahtlosen Integration von künstlicher Intelligenz, autonomen Agenten und Automatisierungs-Workflows in bestehende Unternehmensstrukturen, Web- und Mobile-Anwendungen.
Automatische Übersetzung
