Tal till text

Tal till text

Definition

Tal-till-text (STT) är processen att automatiskt omvandla talat språk till skriven text med hjälp av AI-modeller. Det är nära besläktat med ASR.

Syfte

Syftet är att göra talat innehåll tillgängligt och sökbart. Det används flitigt inom transkription, tillgänglighet och digitala assistenter.

Betydelse

  • Stöder tillgänglighet för hörselskadade användare.
  • Tillhandahåller transkriptioner för möten och föreläsningar.
  • Noggrannheten beror på accenter och ljudförhållanden.
  • Används i nästan alla röststyrda applikationer.

Så fungerar det

  1. Spela in ljudingång.
  2. Förbearbeta och normalisera ljudsignalen.
  3. Använd ASR-modeller för att känna igen ord.
  4. Transkription av utgående text.
  5. Granska eller korrigera med mänsklig tillsyn om det behövs.

Exempel (verkliga världen)

  • Google Cloud Tal-till-text API.
  • Microsoft Azure-taltjänster.
  • Otter.ai-mötestranskribering.

Referenser / Vidare läsning

Berätta hur vi kan hjälpa till med ditt nästa AI-initiativ.