Hebreiska datauppsättning
Översikt över svenska
Högkvalitativ hebreisk datauppsättning för allmänna konversationer och podcast för AI- och talmodeller
Översikt
Titel (språk)
hebreiska språkdataset
Datasettyper
Allmän konversation, mediedata
Land
Israel
BESKRIVNING
Oskriptade telefonsamtal mellan två personer på hebreiska från Israel finns tillgängliga med längder på 15 till 60 minuter, tillsammans med licensierbara ljud- eller videofiler som är allmän egendom, såsom intervjuer och poddsändningar med 1 till 5 deltagare, också från 15 till 60 minuter.
Användningsfall
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datauppsättningsdetaljer
| Dataset typ | Samplingshastighet | högtalare | Kanal | Totalt antal timmar | Totalt antal högtalare |
|---|---|---|---|---|---|
| Allmänt samtal | 8 kHz | 2 högtalare | Dubbel | 398:47:10 | 814 |
| Mediedata | 16 kHz | Flera högtalare | Mono | 426:14:16 | 885 |
Utvalda klienter
Stärka team för att bygga världsledande AI-produkter.
Hittar du inte det du letar efter?
Nya färdiga datamängder samlas in för alla datatyper
Kontakta oss nu för att släppa dina bekymmer för insamling av ljud-/talträningsdata
Översikt
Titel
Hebreiska Språkdatauppsättning
Dataset typ
Allmänt samtal
BESKRIVNING
Oskrivet telefonsamtal mellan två personer. Cirka. Ljudlängd (omfång) – 15-60 minuter, hebreiska i Israel.
Användningsfall
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datauppsättningsdetaljer
Totalt antal timmar
399
Samplingshastighet
8 kHz
ljudkanal
Dubbel
Inspelningsplattform
Desktop
Ljudformat
. WAV
Transkriptionsformat
.json
VI ÄR (%)
5
Datamängdsdemografi
Land
Israel
Språk
Hebreiska
Kön
Kvinna 414, Man 399, Okänd 1
Antal högtalare
814
Ålder
18-50
Översikt
Titel
Hebreiska Språkdatauppsättning
Dataset typ
Podcast
BESKRIVNING
Licenserbara ljud-/videofiler i offentlig egendom såsom intervjuer, poddsändningar etc – 1 till 5 personer. Cirka. Ljudlängd (intervall) 15-60 minuter.
Användningsfall
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datauppsättningsdetaljer
Totalt antal timmar
427
Samplingshastighet
16 kHz
ljudkanal
Mono
Inspelningsplattform
Webbkälla
Ljudformat
. WAV
Transkriptionsformat
.json
VI ÄR (%)
5
Datamängdsdemografi
Land
Israel
Språk
Hebreiska
Kön
Kvinna 361, Man 513, Okänd 13
Antal högtalare
887
Ålder
18-50