Hindi Dataset
हिंदी डेटासेट
Översikt
Titel
hindi Språkdatauppsättning
Dataset typ
Allmänt samtal
Beskrivning
Oskrivet telefonsamtal mellan två personer. Cirka. Ljudlängd (omfång) – 15-60 minuter.
Användningsfall
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datauppsättningsdetaljer
Totalt antal timmar
40
Samplingshastighet
8 kHz
ljudkanal
Dubbel
Inspelningsplattform
Desktop
Ljudformat
. WAV
Transkriptionsformat
.json
VI ÄR (%)
5
Datamängdsdemografi
Land
Indien
Språk
hindi
Kön
Kvinna 30, Man 49, Okänd 0
Antal högtalare
79
Ålder
18-50
Översikt
Titel
hindi Språkdatauppsättning
Dataset typ
Media Audio
Beskrivning
Licenserbara ljud-/videofiler i offentlig egendom såsom intervjuer, poddsändningar etc – 1 till 5 personer. Cirka. Ljudlängd (intervall) 15-60 minuter.
Användningsfall
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datauppsättningsdetaljer
Totalt antal timmar
219
Samplingshastighet
16 kHz
ljudkanal
Mono
Inspelningsplattform
Webbkälla
Ljudformat
. WAV
Transkriptionsformat
.json
VI ÄR (%)
5
Datamängdsdemografi
Land
Indien
Språk
hindi
Kön
Kvinna 83, Man 309, Okänd 0
Antal högtalare
392
Ålder
18-50
Översikt
Titel
hindi Språkdatauppsättning
Dataset typ
TTS
Beskrivning
Enspråkiga inspelningar, som tenderar att falla inom intervallet 5 till 30 sekunder.
Användningsfall
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datauppsättningsdetaljer
Totalt antal timmar
2,867
Samplingshastighet
48 kHz
ljudkanal
Mono
Inspelningsplattform
Mobile App
Ljudformat
. WAV
Transkriptionsformat
.json
VI ÄR (%)
5
Datamängdsdemografi
Land
Indien
Språk
hindi
Kön
Kvinna 1977, Man 1864, Okänd 147
Antal högtalare
3,988
Ålder
18-50
Utvalda klienter
Stärka team för att bygga världsledande AI-produkter.
Hittar du inte det du letar efter?
Nya färdiga datamängder samlas in för alla datatyper
Kontakta oss nu för att släppa dina bekymmer för insamling av ljud-/talträningsdata