Arabiska datauppsättning

مجموعة البيانات العربية

Högkvalitativ arabisk allmän konversation och Podcast-dataset för AI- och talmodeller

Översikt

Titel

Arabiska språkdataset

Dataset typ

Allmänt samtal

Beskrivning

Oskrivet telefonsamtal mellan två personer. Cirka. Ljudlängd (intervall) – 15-60 minuter, arabiska från Gulfländerna.

Användningsfall

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datauppsättningsdetaljer

Totalt antal timmar

292

Samplingshastighet

8 kHz

ljudkanal

Dubbel

Inspelningsplattform

Desktop

Ljudformat

. WAV

Transkriptionsformat

.json

VI ÄR (%)

5

Datamängdsdemografi

Land

arabiska

Språk

arabiska

Kön

Kvinna 838 Man 1209 Okänd 78

Antal högtalare

706

Ålder

18-50

Översikt

Titel

Arabiska språkdataset

Dataset typ

TTS

Beskrivning

Enspråkiga inspelningar, som tenderar att falla inom intervallet 5 till 30 sekunder.

Användningsfall

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datauppsättningsdetaljer

Totalt antal timmar

1,947

Samplingshastighet

48 kHz

ljudkanal

Mono

Inspelningsplattform

Mobile App

Ljudformat

. WAV

Transkriptionsformat

.json

VI ÄR (%)

5

Datamängdsdemografi

Land

arabiska

Språk

arabiska

Kön

Kvinna 838 Man 1209 Okänd 78

Antal högtalare

2,125

Ålder

18-50

Utvalda klienter

Stärka team för att bygga världsledande AI-produkter.

amason
Google
Microsoft
Shaip kontakta oss

Hittar du inte det du letar efter?

Nya färdiga datamängder samlas in för alla datatyper

Kontakta oss nu för att släppa dina bekymmer för insamling av ljud-/talträningsdata

  • Genom att registrera mig godkänner jag Shaip Integritetspolicy och Användarvillkor och ge mitt samtycke till att ta emot B2B marknadsföringskommunikation från Shaip.
  • Detta fält är för validering och bör lämnas oförändrad.