Danskt Dataset

Dansk Datasæt

Danska allmänna samtals-, TTS- och podcastdatauppsättningar av hög kvalitet för AI- och talmodeller

Översikt

Titel (språk)

Danska språkdataset

Datasettyper

Callcenter, Allmänna samtal, Mediedata (Podcastdata), Manusförfattad monolog

Land

Danmark

BESKRIVNING

Oskriptade telefonsamtal mellan två personer är tillgängliga med en ungefärlig längd på 15 till 60 minuter. Licensierade ljud- eller videofiler som är allmän egendom, såsom intervjuer eller poddsändningar med 1 till 5 deltagare, varierar också från 15 till 60 minuter. Dessutom varierar inspelningar av enskilda yttranden på danska från Danmark vanligtvis från 5 till 30 sekunder.

Användningsfall

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datauppsättningsdetaljer

Dataset typ Samplingshastighet högtalare Kanal Totalt antal timmar Totalt antal högtalare
Call Center 8 kHz 2 högtalare Mono 2,000:00:00 På förfrågan
Allmänt samtal 8 kHz 2 högtalare Dubbel 356:29:47 700
Mediedata 16 kHz Flera högtalare Mono 665:16:30 1,261
Manusmonolog 48 kHz Enstaka högtalare Mono 2,496:00:00 2,825

Utvalda klienter

Stärka team för att bygga världsledande AI-produkter.

Amazon
Google
Microsoft
Shaip kontakta oss

Hittar du inte det du letar efter?

Nya färdiga datamängder samlas in för alla datatyper

Kontakta oss nu för att släppa dina bekymmer för insamling av ljud-/talträningsdata

  • Detta fält är för validering och bör lämnas oförändrad.
  • Genom att registrera mig godkänner jag Shaip Integritetspolicy och Användarvillkor och ge mitt samtycke till att ta emot B2B marknadsföringskommunikation från Shaip.