Kategorien durchsuchen
Entdecken
Fiverr Pro
Deutsch
$
USD
Spracherkennung, auch bekannt als automatische Spracherkennung (ASR), Computer-Spracherkennung oder Speech-to-Text, ist eine Fähigkeit, die es einem Programm ermöglicht, menschliche Sprache in ein geschriebenes Format umzuwandeln. Während sie oft mit Voice Recognition verwechselt wird, konzentriert sich die Spracherkennung auf die Übersetzung von Sprache vom verbalen in den Textformat, während Voice Recognition nur die Stimme eines einzelnen Nutzers identifizieren möchte.
Ich kann OpenAI Whisper oder Nvidia NeMo integrieren. Ich habe Erfahrung mit dieser Bibliothek. Neben diesen kann ich auch die Bibliothek verwenden, die du benötigst.
Expertise:
API-Integration
•
Klassifizierung
•
Datenextraktion
Technologie:
Python