Afrikaans Dataset

Afrikaanse Datastel

Högkvalitativa afrikanska allmänna samtals- och podcastdataset för AI- och talmodeller

Översikt

Titel

Afrikaans språkdataset

Dataset typ

Allmän konversationsdata

Beskrivning

Oskrivet telefonsamtal mellan två personer. Cirka. Ljudlängd (omfång) – 15-60 minuter, afrikaans talas i Afrika.

Användningsfall

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datauppsättningsdetaljer

Totalt antal timmar

368

Samplingshastighet

8 kHz

ljudkanal

Dubbel

Inspelningsplattform

Desktop

Ljudformat

. WAV

Transkriptionsformat

.json

VI ÄR (%)

5

Datamängdsdemografi

Land

afrikaans

Språk

afrikaans

Kön

Kvinna: 502, man: 390 och okänd: 2

Antal högtalare

894

Ålder

18-50

Översikt

Titel

Afrikaans språkdataset

Dataset typ

Podcast

Beskrivning

Licenserbara ljud-/videofiler i offentlig egendom såsom intervjuer, poddsändningar etc – 1 till 5 personer. Cirka. Ljudlängd (intervall) 15-60 minuter.

Användningsfall

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datauppsättningsdetaljer

Totalt antal timmar

658

Samplingshastighet

16 kHz

ljudkanal

Mono

Inspelningsplattform

Webbkälla

Ljudformat

. WAV

Transkriptionsformat

.json

VI ÄR (%)

5

Datamängdsdemografi

Land

afrikaans

Språk

afrikaans

Kön

Kvinna: 750, man: 1,278 och okänd: 52

Antal högtalare

2,080

Ålder

18-50

Utvalda klienter

Stärka team för att bygga världsledande AI-produkter.

amason
Google
Microsoft
Shaip kontakta oss

Hittar du inte det du letar efter?

Nya färdiga datamängder samlas in för alla datatyper

Kontakta oss nu för att släppa dina bekymmer för insamling av ljud-/talträningsdata

  • Genom att registrera mig godkänner jag Shaip Integritetspolicy och Användarvillkor och ge mitt samtycke till att ta emot B2B marknadsföringskommunikation från Shaip.
  • Detta fält är för validering och bör lämnas oförändrad.