Danskt Dataset
Dansk Datasæt
Danska allmänna samtals-, TTS- och podcastdatauppsättningar av hög kvalitet för AI- och talmodeller
Översikt
Titel
danska Språkdatauppsättning
Dataset typ
Allmänt samtal
Beskrivning
Oskrivet telefonsamtal mellan två personer. Cirka. Ljudlängd (omfång) – 15-60 minuter.
Användningsfall
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datauppsättningsdetaljer
Totalt antal timmar
372
Samplingshastighet
8 kHz
ljudkanal
Dubbel
Inspelningsplattform
Desktop
Ljudformat
. WAV
Transkriptionsformat
.json
VI ÄR (%)
5
Datamängdsdemografi
Land
Danmark
Språk
danska
Kön
Kvinna 311, Man 417, Okänd 0
Antal högtalare
728
Ålder
18-50
Översikt
Titel
danska Språkdatauppsättning
Dataset typ
Podcast
Beskrivning
Licenserbara ljud-/videofiler i offentlig egendom såsom intervjuer, poddsändningar etc – 1 till 5 personer. Cirka. Ljudlängd (intervall) 15-60 minuter.
Användningsfall
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datauppsättningsdetaljer
Totalt antal timmar
664
Samplingshastighet
16 kHz
ljudkanal
Mono
Inspelningsplattform
Webbkälla
Ljudformat
. WAV
Transkriptionsformat
.json
VI ÄR (%)
5
Datamängdsdemografi
Land
Danmark
Språk
danska
Kön
Kvinna 369, Man 864, Okänd 27
Antal högtalare
1,260
Ålder
18-50
Översikt
Titel
Danska språkdataset
Dataset typ
TTS
Beskrivning
Enstaka inspelningar, som tenderar att hamna i intervallet 5 till 30 sekunder, danska från Danmark.
Användningsfall
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datauppsättningsdetaljer
Totalt antal timmar
2,579
Samplingshastighet
48 kHz
ljudkanal
Mono
Inspelningsplattform
Mobile App
Ljudformat
. WAV
Transkriptionsformat
.json
VI ÄR (%)
5
Datamängdsdemografi
Land
Danmark
Språk
danska
Kön
Kvinna 1551, Man 1233, Okänd 42
Antal högtalare
2,826
Ålder
18-50
Utvalda klienter
Stärka team för att bygga världsledande AI-produkter.

Hittar du inte det du letar efter?
Nya färdiga datamängder samlas in för alla datatyper
Kontakta oss nu för att släppa dina bekymmer för insamling av ljud-/talträningsdata