Polsk datauppsättning

Polsk datauppsättning

Högkvalitativ polsk mediedata och manusmonolog för AI och talmodeller

Översikt

Titel (språk)

Polsk språkdatauppsättning

Datasettyper

Media (Podcast), Manusförfattad monolog

Land

Polen

BESKRIVNING

Denna datauppsättning innehåller licensierbara ljud- eller videofiler som är allmän egendom, såsom intervjuer och poddsändningar med 1 till 5 deltagare (15–60 minuter), tillsammans med manusbaserade monologer där en enda talare levererar fördefinierat innehåll för träning och utvärdering av tal- och språkmodeller.

Användningsfall

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datauppsättningsdetaljer

Dataset typ Samplingshastighet högtalare Kanal Totalt antal timmar Totalt antal högtalare
Mediedata 16 kHz Multipal-högtalare Mono 268:56:51 532
Manusmonolog 48 kHz Enstaka högtalare Mono 2,348:00:00 2,699

Utvalda klienter

Stärka team för att bygga världsledande AI-produkter.

Amazon
Google
Microsoft
Shaip kontakta oss

Hittar du inte det du letar efter?

Nya färdiga datamängder samlas in för alla datatyper

Kontakta oss nu för att släppa dina bekymmer för insamling av ljud-/talträningsdata

  • Detta fält är för validering och bör lämnas oförändrad.
  • Genom att registrera mig godkänner jag Shaip Integritetspolicy och Användarvillkor och ge mitt samtycke till att ta emot B2B marknadsföringskommunikation från Shaip.