Kannada Dataset
ಕನ್ನಡ ಡೇಟಾಸೆಟ್
Högkvalitativa Kammada Call-Center, allmänna konversations- och podcastdataset för AI- och talmodeller
Översikt
Titel
kannada Språkdatauppsättning
Dataset typ
Call-center
Beskrivning
Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter.
Användningsfall
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datauppsättningsdetaljer
Totalt antal timmar
60
Samplingshastighet
8 Khz
ljudkanal
Dubbel
Inspelningsplattform
Desktop
Ljudformat
. WAV
Transkriptionsformat
.json
VI ÄR (%)
5
Datamängdsdemografi
Land
Indien
Språk
kannada
Kön
Man: 152, kvinna: 342 och okänt: 0
Antal högtalare
494
Ålder
18-50
Översikt
Titel
kannada Språkdatauppsättning
Dataset typ
Allmänt samtal
Beskrivning
Omanusfritt, syntetiskt telefonsamtal mellan "agent" och "kund", Ca. Ljudlängd (intervall) 5-15 minuter.
Användningsfall
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datauppsättningsdetaljer
Totalt antal timmar
100
Samplingshastighet
8 Khz
ljudkanal
Dubbel
Inspelningsplattform
Desktop
Ljudformat
. WAV
Transkriptionsformat
.json
VI ÄR (%)
5
Datamängdsdemografi
Land
Indien
Språk
kannada
Kön
Man: 129, kvinna: 295 och okänt: 0
Antal högtalare
424
Ålder
18-50
Översikt
Titel
kannada Språkdatauppsättning
Dataset typ
Podcast
Beskrivning
Licenserbara ljud-/videofiler i offentlig egendom såsom intervjuer, poddsändningar etc – 1 till 5 personer. Cirka. Ljudlängd (intervall) 15-60 minuter.
Användningsfall
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datauppsättningsdetaljer
Totalt antal timmar
40
Samplingshastighet
16 Khz
ljudkanal
Mono
Inspelningsplattform
Webbkälla
Ljudformat
. WAV
Transkriptionsformat
.json
VI ÄR (%)
5
Datamängdsdemografi
Land
Indien
Språk
kannada
Kön
Man: 74, Kvinna: 16 och Okänd: 32
Antal högtalare
122
Ålder
18-50
Utvalda klienter
Stärka team för att bygga världsledande AI-produkter.
Hittar du inte det du letar efter?
Nya färdiga datamängder samlas in för alla datatyper
Kontakta oss nu för att släppa dina bekymmer för insamling av ljud-/talträningsdata