US engelska datauppsättning

Högkvalitativ datauppsättning på amerikansk engelska för AI och talmodeller

Översikt

Titel (språk)

US engelska språkdataset

Datasettyper

Callcenter, Media (Podcast), Medicin

Land

USA

BESKRIVNING

Denna datauppsättning innehåller oskriptade syntetiska agent-kund-konversationer (5–15 minuter), licensierbara ljud- eller videofiler i allmän egendom, såsom intervjuer och poddsändningar med 1 till 5 deltagare (15–60 minuter), tillsammans med medie- och medicinska datauppsättningstyper för omfattande forskning om tal och språk.

Användningsfall

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datauppsättningsdetaljer

Dataset typ Samplingshastighet högtalare Kanal Totalt antal timmar Totalt antal högtalare
Call Center 8 kHz 2 högtalare Mono 10,196:00:00 1,052
Call Center 8 kHz 2 högtalare Dubbel 597:26:43 På förfrågan
Mediedata 16 kHz Flera högtalare Mono 620:23:43 5,466
Sjukvård 8 kHz 2 högtalare Mono 1,480:30:33 697

Utvalda klienter

Stärka team för att bygga världsledande AI-produkter.

Shaip kontakta oss

Hittar du inte det du letar efter?

Nya färdiga datamängder samlas in för alla datatyper

Kontakta oss nu för att släppa dina bekymmer för insamling av ljud-/talträningsdata

  • Detta fält är för validering och bör lämnas oförändrad.
  • Genom att registrera mig godkänner jag Shaip Integritetspolicy och Användarvillkor och ge mitt samtycke till att ta emot B2B marknadsföringskommunikation från Shaip.