Bengali Dataset

বাংলা ডেটাসেট

Högkvalitativt bengaliskt callcenter, allmänt samtal och podcastdatauppsättning för AI- och talmodeller

Översikt

Titel (språk)

Dataset för bengaliska språk

Datasettyper

Callcenter, Allmänna samtal, Mediedata (Podcastdata), Manusförfattad monolog

Land

Indien

BESKRIVNING

Oskriptade, syntetiska telefonsamtal mellan en agent och en kund är tillgängliga med en ungefärlig längd på mellan 5 och 15 minuter. Dessutom finns licensierade ljud- eller videofiler som är allmän egendom, såsom intervjuer, poddsändningar och liknande innehåll med 1 till 5 deltagare, tillgängliga med en ungefärlig längd på mellan 15 och 60 minuter.

Användningsfall

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datauppsättningsdetaljer

Dataset typ Samplingshastighet högtalare Kanal Totalt antal timmar Totalt antal högtalare
Call Center 8 kHz 2 högtalare Dubbel 117:03:45 498
Allmänt samtal 8 kHz 2 högtalare Dubbel 168:13:39 458
Mediedata 16 kHz Flera högtalare Mono 24:58:58 90
Manusmonolog 24 kHz Enstaka högtalare Mono 2,300:00:00 På förfrågan

Utvalda klienter

Stärka team för att bygga världsledande AI-produkter.

Shaip kontakta oss

Hittar du inte det du letar efter?

Nya färdiga datamängder samlas in för alla datatyper

Kontakta oss nu för att släppa dina bekymmer för insamling av ljud-/talträningsdata

  • Detta fält är för validering och bör lämnas oförändrad.
  • Genom att registrera mig godkänner jag Shaip Integritetspolicy och Användarvillkor och ge mitt samtycke till att ta emot B2B marknadsföringskommunikation från Shaip.