Ich biete automatische Spracherkennung, Sprach-zu-Text-Beratung an

D
djimenez_ml
D
djimenez_ml
David J
Einige Informationen wurden automatisch übersetzt.

Über diesen Service

Automatische Übersetzung

<p suchst du nach einer Möglichkeit, Sprach-zu-Text, Sprachbefehle oder konversationale KI in dein Projekt zu integrieren? Ich bin hier, um zu helfen! Mit Fachwissen in modernsten Spracherkennungstechnologien wie Whisper, Wav2vec, Kaldi, Vosk, phi4, MMS, seamless-m4t, DeepSpeech und anderen biete ich maßgeschneiderte Beratungen, um dich bei der Implementierung, Optimierung und Problemlösung zu unterstützen.

Ich spezialisiere mich auf:

  • Entwicklung und Umsetzung von Sprach-zu-Text-Lösungen
  • Auswahl der besten APIs (Deepgram, AssemblyAI, Gemini, OpenAI, Google Speech-to-Text usw.)
  • Training und Feinabstimmung von SOTA-Sprachmodellen
  • Verbesserung der Genauigkeit für bestimmte Sprachen oder Dialekte
  • Bewältigung von Herausforderungen in lauten Umgebungen
  • Sprecher-Diarisierung
  • Sprachaktivitätserkennung
  • Sound-Event-Erkennung

Lass uns deine Bedürfnisse besprechen und deine Ideen zum Leben erwecken!

Lerne David J kennen

David J

Speech Recognition

5,0(7)
  • AusSpanien
  • Mitglied seitNov. 2024
  • ⌀ Antwortzeit1 Tag
  • Letzte Lieferung1 Woche
  • Sprachen

    Spanisch, Englisch
I have +6 year of experience working with machine learning and deep learning applied to speech recognition: - Speech to text, - Diarization, - Voice Activity Detection, - Sound Event Detection, - Denoising, - Audio Signal Processing, - Emotion... in different languages. I have been working with SOTA Automatic Speech Recognition APIs and frameworks: Whisper, Kaldi, Vosk, MMS, DeepSpeech, speechbrain and wav2vec2. I have been working to fine-tuned models to improve WER and speed inference on multiple language. Hugging Face: https://huggingface.co/deepdml Github: https://github.com/djpg

Automatische Übersetzung

Mein Portfolio