Ich werde die lokale LLM-Bereitstellung vor Ort mit vllm sglang ollama und llamacpp durchführen

C
cortexforge_ai
C
cortexforge_ai
IMRAN ULLAH
Einige Informationen wurden automatisch übersetzt.

Über diesen Service

Automatische Übersetzung

Fortschrittliche lokale und unternehmensweite LLM-Bereitstellung mit sicherer AI-Infrastruktur vor Ort und OpenAI-kompatible API.


Wenn du Open-Source-Sprachmodelle auf deinen eigenen Servern mit voller Privatsphäre, hoher Geschwindigkeit und ohne Cloud-Abhängigkeit laufen lassen möchtest, bist du hier genau richtig.

Ich setze LLM, Mixture of Experts, Embedding-Modelle, Multi-Model-Embeddings und VLM-Systeme mit vLLM, SGLang, Ollama, TGI und llama.cpp für niedrige Latenz und hohe Tokens pro Sekunde um, die über eine OpenAI-kompatible API für einfache Integration zugänglich sind.

Ich arbeite mit modernen Modellen von Qwen3, DeepSeek 4.5 und GLM 4.5 für Text, Vision und Embedding-Aufgaben.


Von leichten lokalen Modellen bis hin zu großen Deployments mit bis zu 500B+ Parametern baue ich produktionsbereite Inferenzserver mit Mehrbenutzerunterstützung, Batch-Verarbeitung und Echtzeitüberwachung.


Kontaktiere mich vor der Bestellung, um dein System und deine Ziele zu besprechen.

Lerne IMRAN ULLAH kennen

IMRAN ULLAH

Building intelligent AI systems with NLP and Vision

  • AusPakistan
  • Mitglied seitMai 2026
  • ⌀ Antwortzeit1 Stunde
  • Sprachen

    Englisch, Urdu, Koreanisch, Spanisch, Französisch, Arabisch, Bengalisch, Kurdisch
I am a Senior AI ML Engineer. I am new here but bring years of enterprise experience designing deep learning architectures. I build multi agent systems with agent2agent and MCP workflows. For NLP and vision, I create smart systems hybrid RAG and OCR pipelines using Qwen3 YOLOv12 and SAM3. I specialize in synthetic dataset generation and model fine tuning using PEFT LoRA QLoRA DoRA and Unsloth. I apply the latest reinforcement learning algorithms like RLHF DPO ORPO GRPO and DR GRPO. I optimize deployments using lightning-fast inference frameworks like vLLM SGLang TGI ONNX and TensorFlow.

Automatische Übersetzung