Arabiska datauppsättning
مجموعة البيانات العربية
Högkvalitativa arabiska allmänna konversationer och text-till-tal (TTS) för AI och talmodeller
Översikt
Titel (språk)
Arabiska språkdataset
Datasettyper
Callcenter, Allmänna samtal, Musik, Manusförfattare
Land
arabiska
BESKRIVNING
Denna datauppsättning inkluderar oskriptade syntetiska telefonsamtal mellan agenter och kunder (5–15 minuter), naturliga telefonsamtal mellan människor på Gulfarabiska (15–60 minuter) och sångljud med transkriptioner, vilket tillhandahåller olika taldata för träning och utvärdering av tal- och språkteknik.
Användningsfall
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datauppsättningsdetaljer
| Dataset typ | Samplingshastighet | högtalare | Kanal | Totalt antal timmar | Totalt antal högtalare |
|---|---|---|---|---|---|
| Call Center | 8 kHz | 2 högtalare | Dubbel | 62:52:19 | På förfrågan |
| Call Center | 8 kHz | 2 högtalare | Mono | 1,025:09:19 | På förfrågan |
| Allmänt samtal | 8 kHz | 2 högtalare | Dubbel | 254:16:34 | 626 |
| Musik | 48 kHz | Enstaka högtalare | Mono | 03:17:21 | 10 |
| Manusmonolog | 48 kHz | Enstaka högtalare | Mono | 4,249:00:00 | 2,125 |
| Manusmonolog | 24 kHz | Enstaka högtalare | Mono | 2,300:00:00 | På förfrågan |
Utvalda klienter
Stärka team för att bygga världsledande AI-produkter.
Hittar du inte det du letar efter?
Nya färdiga datamängder samlas in för alla datatyper
Kontakta oss nu för att släppa dina bekymmer för insamling av ljud-/talträningsdata