Arabiska datauppsättning

مجموعة البيانات العربية

Högkvalitativa arabiska allmänna konversationer och text-till-tal (TTS) för AI och talmodeller

Översikt

Titel (språk)

Arabiska språkdataset

Datasettyper

Callcenter, Allmänna samtal, Musik, Manusförfattare

Land

arabiska

BESKRIVNING

Denna datauppsättning inkluderar oskriptade syntetiska telefonsamtal mellan agenter och kunder (5–15 minuter), naturliga telefonsamtal mellan människor på Gulfarabiska (15–60 minuter) och sångljud med transkriptioner, vilket tillhandahåller olika taldata för träning och utvärdering av tal- och språkteknik.

Användningsfall

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datauppsättningsdetaljer

Dataset typ Samplingshastighet högtalare Kanal Totalt antal timmar Totalt antal högtalare
Call Center 8 kHz 2 högtalare Dubbel 62:52:19 På förfrågan
Call Center 8 kHz 2 högtalare Mono 1,025:09:19 På förfrågan
Allmänt samtal 8 kHz 2 högtalare Dubbel 254:16:34 626
Musik 48 kHz Enstaka högtalare Mono 03:17:21 10
Manusmonolog 48 kHz Enstaka högtalare Mono 4,249:00:00 2,125
Manusmonolog 24 kHz Enstaka högtalare Mono 2,300:00:00 På förfrågan

Utvalda klienter

Stärka team för att bygga världsledande AI-produkter.

Amazon
Google
Microsoft
Shaip kontakta oss

Hittar du inte det du letar efter?

Nya färdiga datamängder samlas in för alla datatyper

Kontakta oss nu för att släppa dina bekymmer för insamling av ljud-/talträningsdata

  • Detta fält är för validering och bör lämnas oförändrad.
  • Genom att registrera mig godkänner jag Shaip Integritetspolicy och Användarvillkor och ge mitt samtycke till att ta emot B2B marknadsföringskommunikation från Shaip.