Ich werde Algorithmen für tiefgreifendes Reinforcement-Lernen entwerfen

Einige Informationen wurden automatisch übersetzt.

Kenia

Ich spreche Englisch

1 Auftrag abgeschlossen

Hallo! Ich bin ein hochqualifizierter Data Scientist mit Fachkenntnissen in maschinellem Lernen, Deep Learning und Reinforcement Learning. Ich habe einen starken Hintergrund in KI und habe Algorith...
Über diesen Service

Hallo!!

Willkommen bei meinem Gig,


Ich biete Expertise im Bereich Deep Reinforcement Learning (RL) an. Ich habe Erfahrung mit einer Vielzahl von akademischen und industriellen Projekten und habe meine Arbeiten auf Top-KI-Konferenzen vorgestellt.

Hier helfe ich beim Aufbau von RL-Agenten, die fast jedes reale Problem lösen können, einschließlich Multi-Objective- und Multi-Agent-Ansätzen, präferenzbasierter und menschlich geführter RL. Ich bin Experte in folgenden Bereichen:


  • Modelbasierte oder modellfreie RL-Algorithmen
  • Einfache oder komplexe Markov-Entscheidungsprozesse (MDP)
  • On-Policy- und Off-Policy-RL-Algorithmen, wie:
  • Q-Learning, SARSA, CQL, DQN, A2C, TRPO, PPO, SAC, TD3 und andere modellfreie RL-Algorithmen
  • Beliebige benutzerdefinierte oder simulierte Umgebungen, wie Verkehrsampelsteuerungen (SUMO), Rechenzentrum-Controller, MuJoCo, Unity, PyBullet und OpenAI Gym
  • Multi-Agent-RL-Probleme, wie Independent DQN, Independent PPO, MAPPO, QMIX, VDN und andere Wertfaktorisierungsmethoden
  • Präferenzbasierte Verstärkungslernen wie PbRL mit synthetischem und menschlichem Feedback


Ich arbeite gerne mit den folgenden Sprachen und Tools:

  • Python
  • TensorFlow
  • Keras
  • PyTorch
  • NumPy
  • Pandas
  • Matplotlib


Fühl dich frei, mir eine Nachricht zu schicken, um dein Projekt zu besprechen.

Viele Grüße.

Expertise:

Bildverarbeitung

Feature-Lernen

Software-Entwicklung

Programmiersprache:

Python

SQL

Colab

Java

MLflow

Frameworks:

DeepPy

Google ML Kit

PyTorch

APIs:

Microsoft Computer Vision AI

Google Cloud Vision API

Tools:

Jupyter-Notizbuch

tensorflow

Excel

MLflow

Colab

RStudio