Malayalam Dataset
മലയാളം ഡാറ്റാസെറ്റ്
Högkvalitativ malayalam-konversation och podcastdatauppsättning för AI och talmodeller
Översikt
Titel (språk)
Malayalam-språkdatabas
Datasettyper
Allmänna konversationer, mediadata (podcast)
Land
Indien
BESKRIVNING
Denna datauppsättning innehåller oskriptade syntetiska telefonsamtal mellan en agent och en kund (5–15 minuter) och licensierbara ljud- eller videofiler i allmän egendom, såsom intervjuer och poddsändningar med 1 till 5 deltagare (15–60 minuter).
Användningsfall
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datauppsättningsdetaljer
| Dataset typ | Samplingshastighet | högtalare | Kanal | Totalt antal timmar | Totalt antal högtalare |
|---|---|---|---|---|---|
| Allmänt samtal | 8 kHz | 2 högtalare | Dubbel | 70:46:30 | 576 |
| Allmänt samtal | 8 kHz | 2 högtalare | Dubbel | 149:39:33 | 296 |
| Mediedata | 16 kHz | Flera högtalare | Mono | 12:39:24 | 81 |
Utvalda klienter
Stärka team för att bygga världsledande AI-produkter.
Hittar du inte det du letar efter?
Nya färdiga datamängder samlas in för alla datatyper
Kontakta oss nu för att släppa dina bekymmer för insamling av ljud-/talträningsdata