Los sistemas speech-to-text transcriben el lenguaje hablado a texto escrito en tiempo real o a partir de audio grabado. Los sistemas modernos como Whisper (OpenAI) alcanzan una precision cercana a la humana en muchos idiomas. Las aplicaciones incluyen la transcripcion de reuniones, el subtitulado, los comandos de voz y las herramientas de accesibilidad.







