Les systemes speech-to-text transcrivent le langage parle en texte ecrit en temps reel ou a partir d'audio enregistre. Les systemes modernes comme Whisper (OpenAI) atteignent une precision proche de l'humain dans de nombreuses langues. Les applications incluent la transcription de reunions et le sous-titrage.






