Koreansk datauppsättning

한국어 데이터셋

Högkvalitativ koreansk datamängd för callcenter, manusbaserade monologer och media (podcast) för AI- och talmodeller

Översikt

Titel (språk)

Dataset för koreanska språk

Datasettyper

Callcenter, mediedata, manusbaserad monolog

Land

korea

BESKRIVNING

Denna datauppsättning innehåller oskriptade telefonsamtal mellan syntetiska agenter och kunder (5–15 minuter), licensierbara ljud-/videofiler i allmän egendom, såsom intervjuer och poddsändningar med 1 till 5 deltagare (15–60 minuter), och skriptade monologer med en enda talare som levererar fördefinierat innehåll för tal- och språkmodellträning.

Användningsfall

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datauppsättningsdetaljer

Dataset typ Samplingshastighet högtalare Kanal Totalt antal timmar Totalt antal högtalare
Call Center 8 kHz 2 högtalare Dubbel 102:27:55 1,244
Mediedata 16 kHz Flera högtalare Mono 203:46:54 397
Manusmonolog 24 kHz Enstaka högtalare Mono 500:00:00 På förfrågan
Manusmonolog 48 kHz Enstaka högtalare Mono 1,955:00:00 På förfrågan

Utvalda klienter

Stärka team för att bygga världsledande AI-produkter.

Amazon
Google
Microsoft
Shaip kontakta oss

Hittar du inte det du letar efter?

Nya färdiga datamängder samlas in för alla datatyper

Kontakta oss nu för att släppa dina bekymmer för insamling av ljud-/talträningsdata

  • Detta fält är för validering och bör lämnas oförändrad.
  • Genom att registrera mig godkänner jag Shaip Integritetspolicy och Användarvillkor och ge mitt samtycke till att ta emot B2B marknadsföringskommunikation från Shaip.