Ich entwickle Reinforcement Learning und Reasoning-LLMs für Forschung und Agenten

Einige Informationen wurden automatisch übersetzt.
5,0
5,0

Indien

Ich spreche Englisch, Hindi, Marathi

8 Aufträge abgeschlossen

Ich bin Computer-Vision-Ingenieur und Datenwissenschaftler. Interessiert an der Arbeit an Projekten im Zusammenhang mit maschinellem Lernen. Ich bin auch daran interessiert, an verstärktem Lernen und ...
Über diesen Service
<p suchst du nach einem AI Research Engineer, der sich auf Deep Learning, Reinforcement Learning (RL) und Reasoning mit Large Language Models (LLMs) spezialisiert hat?

Ich unterstütze Forscher, Startups und Unternehmen dabei, fortschrittliche KI-Systeme zu entwerfen, feinzuabstimmen und zu optimieren, die über einfache Textgenerierung hinausgehen und Reasoning, Entscheidungsfindung und intelligentes Agentenverhalten ermöglichen.


Was ich anbiete:

  • Reasoning LLM Entwicklung
  • Ketten-der-Denken Prompting
  • Tool-gestützte LLMs & Multi-Schritt-Reasoning
  • Benchmarking bei Reasoning-Aufgaben
  • Reinforcement Learning für LLMs
  • RLHF (Reinforcement Learning mit menschlichem Feedback)
  • RLAIF (RL mit KI-Feedback)
  • Policy-Optimierung für Alignment & Sicherheit
  • Maßgeschneiderte Deep Learning Lösungen
  • Transformer-Architekturen, Embeddings, generative KI
  • Feinabstimmung für domänenspezifische Aufgaben (Chatbots, Suche, Zusammenfassung, Agenten)
  • Optimierung & Deployment
  • Modellkompression (Quantisierung, Pruning, Distillation)
  • Skalierbare Inference-APIs & MLOps-Pipelines

️ Werkzeuge & Frameworks:

  • Deep Learning: PyTorch, TensorFlow, JAX
  • RL & LLM Training: Hugging Face TRL, RLHF-Bibliotheken, PPO, CRPO DeepSpeed, Accelerate
  • Reasoning LLMs: LangChain, OpenAI API, Anthropic, LLaMA, Mistral

Expertise:

Software-Entwicklung

Programmiersprache:

Python

Bewertungen

1 Bewertungen für diesen Service
5,0

(1)
(0)
(0)
(0)
(0)
Zusammensetzung der Bewertung
  • Kommunikation
    5
  • An einen Freund weiterempfehlen
    5
  • Dienstleistung wie beschrieben
    5
Sortieren nach:
Am relevantesten
  • B

    billyjoel99

    US

    Vereinigte Staaten

    5

    Ok thank you

    Hilfreich?
    Ja
    Nein
Bewertungen

1 Bewertungen für diesen Service
5,0

(1)
(0)
(0)
(0)
(0)
Zusammensetzung der Bewertung
  • Kommunikation
    5
  • An einen Freund weiterempfehlen
    5
  • Dienstleistung wie beschrieben
    5
Sortieren nach:
Am relevantesten
  • B

    billyjoel99

    US

    Vereinigte Staaten

    5

    Ok thank you

    Hilfreich?
    Ja
    Nein