Koreansk datauppsättning
한국어 데이터셋
Högkvalitativ koreansk datamängd för callcenter, manusbaserade monologer och media (podcast) för AI- och talmodeller
Översikt
Titel (språk)
Dataset för koreanska språk
Datasettyper
Callcenter, mediedata, manusbaserad monolog
Land
korea
BESKRIVNING
Denna datauppsättning innehåller oskriptade telefonsamtal mellan syntetiska agenter och kunder (5–15 minuter), licensierbara ljud-/videofiler i allmän egendom, såsom intervjuer och poddsändningar med 1 till 5 deltagare (15–60 minuter), och skriptade monologer med en enda talare som levererar fördefinierat innehåll för tal- och språkmodellträning.
Användningsfall
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datauppsättningsdetaljer
| Dataset typ | Samplingshastighet | högtalare | Kanal | Totalt antal timmar | Totalt antal högtalare |
|---|---|---|---|---|---|
| Call Center | 8 kHz | 2 högtalare | Dubbel | 102:27:55 | 1,244 |
| Mediedata | 16 kHz | Flera högtalare | Mono | 203:46:54 | 397 |
| Manusmonolog | 24 kHz | Enstaka högtalare | Mono | 500:00:00 | På förfrågan |
| Manusmonolog | 48 kHz | Enstaka högtalare | Mono | 1,955:00:00 | På förfrågan |
Utvalda klienter
Stärka team för att bygga världsledande AI-produkter.
Hittar du inte det du letar efter?
Nya färdiga datamängder samlas in för alla datatyper
Kontakta oss nu för att släppa dina bekymmer för insamling av ljud-/talträningsdata