Danskt Dataset
Dansk Datasæt
Danska allmänna samtals-, TTS- och podcastdatauppsättningar av hög kvalitet för AI- och talmodeller
Översikt
Titel (språk)
Danska språkdataset
Datasettyper
Callcenter, Allmänna samtal, Mediedata (Podcastdata), Manusförfattad monolog
Land
Danmark
BESKRIVNING
Oskriptade telefonsamtal mellan två personer är tillgängliga med en ungefärlig längd på 15 till 60 minuter. Licensierade ljud- eller videofiler som är allmän egendom, såsom intervjuer eller poddsändningar med 1 till 5 deltagare, varierar också från 15 till 60 minuter. Dessutom varierar inspelningar av enskilda yttranden på danska från Danmark vanligtvis från 5 till 30 sekunder.
Användningsfall
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datauppsättningsdetaljer
| Dataset typ | Samplingshastighet | högtalare | Kanal | Totalt antal timmar | Totalt antal högtalare |
|---|---|---|---|---|---|
| Call Center | 8 kHz | 2 högtalare | Mono | 2,000:00:00 | På förfrågan |
| Allmänt samtal | 8 kHz | 2 högtalare | Dubbel | 356:29:47 | 700 |
| Mediedata | 16 kHz | Flera högtalare | Mono | 665:16:30 | 1,261 |
| Manusmonolog | 48 kHz | Enstaka högtalare | Mono | 2,496:00:00 | 2,825 |
Utvalda klienter
Stärka team för att bygga världsledande AI-produkter.
Hittar du inte det du letar efter?
Nya färdiga datamängder samlas in för alla datatyper
Kontakta oss nu för att släppa dina bekymmer för insamling av ljud-/talträningsdata