Arabiska datauppsättning
مجموعة البيانات العربية
Översikt
Titel
Arabiska språkdataset
Dataset typ
Allmänt samtal
Vänster kanal
Höger kanal
Beskrivning
Oskrivet telefonsamtal mellan två personer. Cirka. Ljudlängd (intervall) – 15-60 minuter, arabiska från Gulfländerna.
Användningsfall
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datauppsättningsdetaljer
Totalt antal timmar
292
Samplingshastighet
8 kHz
ljudkanal
Dubbel
Inspelningsplattform
stationär dator
Ljudformat
. WAV
Transkriptionsformat
.json
VI ÄR (%)
5
Datamängdsdemografi
Land
arabiska
Språk
arabiska
Kön
Kvinna: 171, man: 534 och okänd: 1
Antal högtalare
706
Ålder
18-50
Översikt
Beskrivning
Enspråkiga inspelningar, som tenderar att falla inom intervallet 5 till 30 sekunder.
Användningsfall
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datauppsättningsdetaljer
Totalt antal timmar
1,947
Samplingshastighet
48 kHz
ljudkanal
Mono
Inspelningsplattform
Mobile App
Ljudformat
. WAV
Transkriptionsformat
.json
VI ÄR (%)
5
Datamängdsdemografi
Land
arabiska
Språk
arabiska
Kön
Kvinna 838 Man 1209 Okänd 78
Antal högtalare
2,125
Ålder
18-50
Utvalda klienter
Stärka team för att bygga världsledande AI-produkter.
Hittar du inte det du letar efter?
Nya färdiga datamängder samlas in för alla datatyper
Kontakta oss nu för att släppa dina bekymmer för insamling av ljud-/talträningsdata