Hindi Dataset

हिंदी डेटासेट

Högkvalitativ datamängd för callcenter, allmänna konversationer och podcaster på hindi för AI- och ASR-modeller

Översikt

Titel (språk)

Hindi-språkdatauppsättning

Datasettyper

Callcenter, Allmänna samtal, Media (podcast), Manusförfattad monolog

Land

Indien

BESKRIVNING

Oskriptade telefonsamtal mellan två personer finns tillgängliga med längder på 15 till 60 minuter, tillsammans med licensierade ljud- eller videofiler som är allmän egendom, såsom intervjuer och poddsändningar med 1 till 5 deltagare inom samma intervall. Dessutom varar inspelningar av enskilda yttranden vanligtvis 5 till 30 sekunder, och skriptade monologdata finns också tillgängliga.

Användningsfall

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datauppsättningsdetaljer

Dataset typ Samplingshastighet högtalare Kanal Totalt antal timmar Totalt antal högtalare
Call Center 8 kHz 2 högtalare Dubbel 70:45:51 På förfrågan
Call Center 8 kHz 2 högtalare Mono 20,000:00:00 På förfrågan
Call Center 16 kHz 2 högtalare Mono 29:17:20 261
Call Center 16 kHz 2 högtalare Dubbel 400:27:10 1200
Allmänt samtal 8 kHz 2 högtalare Dubbel 47:48:40 224
Mediedata 16 kHz Flera högtalare Mono 227:57:43 438
Manusmonolog 48 kHz Enstaka högtalare Mono 2,866:00:00 3,988
Manusmonolog 24 kHz Enstaka högtalare Mono 29,000:00:00 På förfrågan

Utvalda klienter

Stärka team för att bygga världsledande AI-produkter.

Amazon
Google
Microsoft
Shaip kontakta oss

Hittar du inte det du letar efter?

Nya färdiga datamängder samlas in för alla datatyper

Kontakta oss nu för att släppa dina bekymmer för insamling av ljud-/talträningsdata

  • Detta fält är för validering och bör lämnas oförändrad.
  • Genom att registrera mig godkänner jag Shaip Integritetspolicy och Användarvillkor och ge mitt samtycke till att ta emot B2B marknadsföringskommunikation från Shaip.